|
Iron Man#2
Регистрация: 08.07.2009
Сообщений: 2,084
С нами:
8865026
Репутация:
2562
|
|
Проблемы дисков
Проблемы дисков
S.M.A.R.T. - технология оценки состояния жёсткого диска, а также механизм предсказания времени выхода его из строя.
Описание атрибутов: - Raw Read Error Rate *КРИТИЧЕСКИЙ ПАРАМЕТР* Частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска.
- Throughput Performance Общая производительность диска. Если значение атрибута уменьшается, то велика вероятность, что с диском есть проблемы.
- Spin-Up Time *КРИТИЧЕСКИЙ ПАРАМЕТР* Время раскрутки пакета дисков из состояния покоя до рабочей скорости.
- Start/Stop Count Полное число запусков/остановок шпинделя. У дисков некоторых производителей (например, Seagate) — счётчик включения режима энергосбережения. В поле raw value хранится общее количество запусков/остановок диска.
- Reallocated Sectors Count *КРИТИЧЕСКИЙ ПАРАМЕТР* Число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным», и переносит данные в специально отведенную область. Вот почему на современных жёстких дисках нельзя увидеть bad-блоки — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, а переназначенный сектор — remap. Чем больше значение, тем хуже состояние поверхности дисков. Поле raw value содержит общее количество переназначенных секторов.
- Read Channel Margin Запас канала чтения. Назначение этого атрибута не документировано. В современных накопителях не используется.
- Seek Error Rate *КРИТИЧЕСКИЙ ПАРАМЕТР* Частота ошибок при позиционировании блока головок. Чем их больше, тем хуже состояние механики и/или поверхности жёсткого диска.
- Seek Time Performance Средняя производительность операции позиционирования магнитными головками. Если значение атрибута уменьшается, то велика вероятность проблем с механической частью.
- Power-On Hours (POH) Число часов, проведённых во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ (MTBF — mean time between failure).
- Spin-Up Retry Count *КРИТИЧЕСКИЙ ПАРАМЕТР* Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то велика вероятность неполадок с механической частью.
- Recalibration Retries Количество повторов запросов рекалибровки в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то велика вероятность проблем с механической частью.
- Device Power Cycle Count Количество полных циклов включения-выключения диска.
- Soft Read Error Rate Число ошибок при чтении по вине программного обеспечения.
- Airflow Temperature (WDC) Температура воздуха внутри корпуса жёсткого диска для дисков Western Digital. Для дисков Seagate рассчитывается по формуле (100 — HDA temperature).
- G-sense error rate Количество ошибок, возникающих в результате ударных нагрузок
- Power-off retract count Number of power-off or emergency retract cycles
- Load/Unload Cycle Количество циклов перемещения блока магнитных головок в парковочную зону/в рабочее положение.
- HDA temperature Здесь хранятся показания встроенного термодатчика
- Hardware ECC Recovered Число ошибок передачи данных по шине данных, которые удалось восстановить аппаратно. На SATA-дисках значение ухудшается обычно при «разгоне» частоты системной шины — SATA-интерфейс очень чувствителен к «разгону» компьютера.
- Reallocation Event Count *КРИТИЧЕСКИЙ ПАРАМЕТР* Число операций переназначения. В поле «raw value» атрибута хранится общее число попыток переноса информации с переназначенных секторов в резервную область. Учитываются как успешные, так и неуспешные попытки.
- Current Pending Sector Count *КРИТИЧЕСКИЙ ПАРАМЕТР* В поле хранится число секторов, являющихся кандидатами на замену. Они не были ещё определены как плохие, но считывание с них отличается от чтения стабильного сектора, это так называемые подозрительные или нестабильные сектора. В случае успешного последующего прочтения сектора он исключается из числа кандидатов. В случае повторных ошибочных чтений накопитель пытается восстановить его и выполняет операцию переназначения.
- Uncorrectable Sector Count *КРИТИЧЕСКИЙ ПАРАМЕТР* Число неисправимых ошибок при обращении к сектору{Возможно, имелось в виду «число некорректируемых секторов», но никак не число самих ошибок!}. В случае увеличения числа ошибок велика вероятность критических дефектов поверхности и/или механики накопителя.
- UltraDMA CRC Error Count Число ошибок, возникающих при передаче данных по внешнему интерфейсу.
- Write Error Rate /
- Multi-Zone Error Rate Показывает общее количество ошибок, происходящих при записи сектора. Может служить показателем качества поверхности и механики накопителя.
- Soft read error rate Number of off-track errors
- Data Address Mark errors Number of Data Address Mark (DAM) errors (or) vendor-specific
- Run out cancel Количество ошибок ECC
- Soft ECC correction Количество ошибок ECC, скорректированных программным способом.
- Thermal asperity rate (TAR) Number of thermal asperity errors
- Flying height Высота между головкой и поверхностью диска.
- Spin high current Amount of high current used to spin up the drive
- Spin buzz Number of buzz routines to spin up the drive
- Offline seek performance Drive’s seek performance during offline operations
- Disk Shift *КРИТИЧЕСКИЙ* Дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения. Единица измерения неизвестна.
- G-Sense Error Rate Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного датчика удара.
- Loaded Hours Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область.
- Load/Unload Retry Count Количество новых попыток выгрузок/загрузок блока магнитных головок в/из парковочной области после неудачной попытки.
- Load Friction Величина силы трения блока магнитных головок при его выгрузке из парковочной области.
- Load 'In'-time Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска.
- Torque Amplification Count Количество попыток скомпенсировать вращающий момент.
- Power-Off Retract Cycle Количество повторов автоматической парковки блока магнитных головок в результате выключения питания.
- GMR Head Amplitude Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок)
- Temperature Температура жёсткого диска
- Read error retry rate Число ошибок во время чтения жёсткого диска
- Head flying hours Время позиционирования головки
Bad-блоки HDD
Bad-секторы есть на любом HDD, независимо от его новизны и используемых технологий. Наибольшую неприятность для еще трудоспособного жесткого диска представляют так называемые bad-блоки (кластер, состоящий из нескольких секторов).
Важно: С виду безобидные удары, падения с небольшой высоты могут нарушить балансировку дисков, что через некоторое время приведет к чрезмерному износу подшипников, и как результат, появлению bad’ов и поломке винчестера. Меньшая сила внешнего воздействия требуется для появления bad’ов во время работы. Головки винчестера «парят» на очень малом удалении от диска (~0.1 мкм), поэтому даже несильное постукивание приведет к гарантированной порче той области, над которой в момент удара находилась головка. Бесстрашно устанавливая его впритык к не менее теплообильному CD приводу. Такое соседство может неблагоприятным образом сказаться на состоянии поверхностного слоя диска.
defect list
В результате тестирования становится доступной информация о дефектных участках, которая записывается в таблицу дефектов или дефект-лист (defect list). Он содержит адреса участков поверхности, непригодных для использования. Так как это важная информация, используемая на протяжении всего срока эксплуатации винчестера, то дефект-лист на диске представлен в нескольких копиях.На современных винчестерах дефект-листов, минимум, два, а то и больше.
P-list
Один из них называется. В него заносятся адреса поврежденных участков или отдельных секторов, которые обнаружились при технологическом тестировании.
G-list
Второй дефект-лист называется. В нем приводятся адреса запорченных участков, которые появились непосредственно во время эксплуатации жесткого диска. С помощью этой таблицы можно судить, каково сегодняшнее состояние поверхности диска. Если же он начал заполняться, т.е. контроллер обнаружил поврежденные участки или секторы и указал его адрес в дефект-листе, значит, процесс пошел.
лист сервометок
В современных моделях жестких дисков представлены еще два дефект-листа — лист сервометок и временный. Как известно, сервометки были разработаны для лучшего позиционирования головок, когда плотность записи достигает такой величины, что головки не могут быстро и точно перемещаться с одной дорожки на другую. Сервометки тоже могут содержать ошибки. И для большей надежности винчестеров дефектные сервометки начали заносить в специальный, предназначенный только для них список.
Последний дефект-лист — временный, предназначенный для записи подозрительных, с точки зрения контроллера HDD, секторов. Например, если не удалось с первого раза считать или записать данные в определенный сектор, либо же время записи или чтения вышло за определенные рамки. Тогда контроллер заносит адреса «подозрительных» секторов во временный дефект-лист. Если с проблемными секторами не может ни записать, ни считать данные, то эти секторы фиксируются в G-list’е, и считаются bad’ами.
Контроллер просто так не заносит секторы в дефект-лист. Он придерживается пословицы — семь раз проверь, один раз запиши в дефект-лист.
Когда сектор появился в любом из этих листов (кроме временного), он перестает существовать.
Реально лечатся в домашних условиях только исправимые логические бэды и ошибки файловой системы. Другие в случае необходимости можно попробовать подменить на резервные, но не вылечить.
|