[identity profile] kray-zemli.livejournal.com posting in [community profile] useful_faq
Всякие там сисдамины хвалятся, что по этим показометрам могут сказать, сколько винту жить осталось. Хочу понять, как они это делают? Там же ведь просто куча бессмысленных цифр. И больше ничего. Тоже хочу знать про свой винт.

Обычно, если запустить какую-нибудь программулину, она выводит что-нибудь подобное:

ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  1 Raw_Read_Error_Rate     POSR--   114   096   006    -    67524050
  3 Spin_Up_Time            PO----   096   092   000    -    0
  4 Start_Stop_Count        -O--CK   099   099   020    -    1240
  5 Reallocated_Sector_Ct   PO--CK   099   099   036    -    54
  7 Seek_Error_Rate         POSR--   083   060   030    -    210375619
  9 Power_On_Hours          -O--CK   082   082   000    -    16123
 10 Spin_Retry_Count        PO--C-   100   100   097    -    0
 12 Power_Cycle_Count       -O--CK   100   100   020    -    620
183 Runtime_Bad_Block       -O--CK   100   100   000    -    0
184 End-to-End_Error        -O--CK   100   100   099    -    0
187 Reported_Uncorrect      -O--CK   100   100   000    -    0
188 Command_Timeout         -O--CK   100   098   000    -    4295032838
189 High_Fly_Writes         -O-RCK   100   100   000    -    0
190 Airflow_Temperature_Cel -O---K   057   051   045    -    43 (Min/Max 36/46)
194 Temperature_Celsius     -O---K   043   049   000    -    43 (0 15 0 0 0)
195 Hardware_ECC_Recovered  -O-RC-   022   011   000    -    67524050
197 Current_Pending_Sector  -O--C-   100   100   000    -    0
198 Offline_Uncorrectable   ----C-   100   100   000    -    0
199 UDMA_CRC_Error_Count    -OSRCK   200   200   000    -    0
240 Head_Flying_Hours       ------   100   253   000    -    200416058951001
241 Total_LBAs_Written      ------   100   253   000    -    3018098677
242 Total_LBAs_Read         ------   100   253   000    -    2476481168
                            ||||||_ K auto-keep
                            |||||__ C event count
                            ||||___ R error rate
                            |||____ S speed/performance
                            ||_____ O updated online
                            |______ P prefailure warning


prefailure warning -- это ведь означает, что винту недолго жить осталось, да? Или нет?
Вот эти цифры выводились полгода назад:

  1 Raw_Read_Error_Rate     POSR--   112   096   006    -    45139705
  3 Spin_Up_Time            PO----   094   092   000    -    0
  4 Start_Stop_Count        -O--CK   100   100   020    -    968
  5 Reallocated_Sector_Ct   PO--CK   099   099   036    -    54
  7 Seek_Error_Rate         POSR--   083   060   030    -    207722295
  9 Power_On_Hours          -O--CK   085   085   000    -    13448
 10 Spin_Retry_Count        PO--C-   100   100   097    -    0
 12 Power_Cycle_Count       -O--CK   100   100   020    -    484
183 Runtime_Bad_Block       -O--CK   100   100   000    -    0
184 End-to-End_Error        -O--CK   100   100   099    -    0
187 Reported_Uncorrect      -O--CK   100   100   000    -    0
188 Command_Timeout         -O--CK   100   099   000    -    4295032836
189 High_Fly_Writes         -O-RCK   100   100   000    -    0
190 Airflow_Temperature_Cel -O---K   058   051   045    -    42 (Min/Max 26/44)
194 Temperature_Celsius     -O---K   042   049   000    -    42 (0 15 0 0 0)
195 Hardware_ECC_Recovered  -O-RC-   016   011   000    -    45139705
197 Current_Pending_Sector  -O--C-   100   100   000    -    0
198 Offline_Uncorrectable   ----C-   100   100   000    -    0
199 UDMA_CRC_Error_Count    -OSRCK   200   200   000    -    0
240 Head_Flying_Hours       ------   100   253   000    -    186985696213382
241 Total_LBAs_Written      ------   100   253   000    -    101179276
242 Total_LBAs_Read         ------   100   253   000    -    2415736241


По второму винту

  1 Raw_Read_Error_Rate     POSR--   111   099   006    -    39316470
  3 Spin_Up_Time            PO----   096   095   000    -    0
  4 Start_Stop_Count        -O--CK   097   097   020    -    3546
  5 Reallocated_Sector_Ct   PO--CK   097   097   036    -    141
  7 Seek_Error_Rate         POSR--   084   060   030    -    285616356
  9 Power_On_Hours          -O--CK   083   083   000    -    15671
 10 Spin_Retry_Count        PO--C-   100   100   097    -    0
 12 Power_Cycle_Count       -O--CK   099   099   020    -    1791
183 Runtime_Bad_Block       -O--CK   100   100   000    -    0
184 End-to-End_Error        -O--CK   100   100   099    -    0
187 Reported_Uncorrect      -O--CK   098   098   000    -    2
188 Command_Timeout         -O--CK   100   096   000    -    60130459670
189 High_Fly_Writes         -O-RCK   084   084   000    -    16
190 Airflow_Temperature_Cel -O---K   056   049   045    -    44 (Min/Max 37/48)
194 Temperature_Celsius     -O---K   044   051   000    -    44 (0 8 0 0 0)
195 Hardware_ECC_Recovered  -O-RC-   046   025   000    -    39316470
197 Current_Pending_Sector  -O--C-   100   100   000    -    0
198 Offline_Uncorrectable   ----C-   100   100   000    -    0
199 UDMA_CRC_Error_Count    -OSRCK   200   200   000    -    23
240 Head_Flying_Hours       ------   100   253   000    -    168336948219697
241 Total_LBAs_Written      ------   100   253   000    -    3244857648
242 Total_LBAs_Read         ------   100   253   000    -    2956408543


Полгода назад:

  1 Raw_Read_Error_Rate     POSR--   115   099   006    -    92622589
  3 Spin_Up_Time            PO----   095   095   000    -    0
  4 Start_Stop_Count        -O--CK   097   097   020    -    3276
  5 Reallocated_Sector_Ct   PO--CK   098   098   036    -    119
  7 Seek_Error_Rate         POSR--   083   060   030    -    218895315
  9 Power_On_Hours          -O--CK   086   086   000    -    12995
 10 Spin_Retry_Count        PO--C-   100   100   097    -    0
 12 Power_Cycle_Count       -O--CK   099   099   020    -    1656
183 Runtime_Bad_Block       -O--CK   100   100   000    -    0
184 End-to-End_Error        -O--CK   100   100   099    -    0
187 Reported_Uncorrect      -O--CK   098   098   000    -    2
188 Command_Timeout         -O--CK   100   099   000    -    4295032841
189 High_Fly_Writes         -O-RCK   098   098   000    -    2
190 Airflow_Temperature_Cel -O---K   056   050   045    -    44 (Min/Max 24/46)
194 Temperature_Celsius     -O---K   044   050   000    -    44 (0 8 0 0 0)
195 Hardware_ECC_Recovered  -O-RC-   046   025   000    -    92622589
197 Current_Pending_Sector  -O--C-   100   100   000    -    0
198 Offline_Uncorrectable   ----C-   100   100   000    -    0
199 UDMA_CRC_Error_Count    -OSRCK   200   200   000    -    0
240 Head_Flying_Hours       ------   100   253   000    -    11424613024629
241 Total_LBAs_Written      ------   100   253   000    -    331405224
242 Total_LBAs_Read         ------   100   253   000    -    2476525453


Как видно, подросло чуть-чуть количество каких-то reallocated sectors. Пора бежать за боржоми, или можно ещё подождать?

Date: 2013-05-05 05:18 pm (UTC)
From: [identity profile] dna2.livejournal.com
Второй сыплется потихоньку (именно эти reallocated), лучше заменить, пока совсем не встал. И у него, похоже, какие-то проблемы с кабелем или с разъёмом, в общем, где-то там с передачей данных - UDMA CRC Errors выросло.
Первый раньше (до съёма первого из предъявленных смартов) изрядно осыпался, за последние полгода вроде стабилен.
prefailure warning в данном случае относится к самому атрибуту, а не к его значению. Означает что-то типа "если этот атрибут поплывёт, то атас".

Date: 2013-05-05 06:06 pm (UTC)
From: [identity profile] tapkin.livejournal.com
вам в ру_хард

Date: 2013-05-05 08:20 pm (UTC)
From: [identity profile] f2065.livejournal.com
Самое критичное - Reallocated_Sector. Если там в поле Raw Value значение отличное от 0 - от винта пора избавляться. А если там значение более 5 - то уже срочно надо копировать всё ценное на другой винт.

Вообще если на оба винта так дружно сыплются - это какая-то системная проблема, может БП плохой например или шлейфы. Это не нормально что они так теряют сектора. Нормально это когда при наработке 50000ч ремапленных секторов всё ещё ноль…

Date: 2013-05-05 08:52 pm (UTC)
From: [identity profile] dims12.livejournal.com
Каждый подозрительный показатель изучайте отдельно, цифры имеют разный смысл. Reallocated sectors это то, что раньше называлось бэд сектор и лечилось диск доктором. Сейчас винчестеры "лечат" сами себя, то есть, если у них появляется подозрительный сектор, то он заводит новый из специального пула запасных секторов и данные не страдают, только немного замедляется скорость, потому что в запасной сектор головке чтения-записи приходится лазить в другое место. Однако, увеличение этого показателя означает, что диск "сыпется". Продолжаться это может годы и когда диск накроется никто сказать не может. ИМХО, в норме, в домашних условиях, если данные подвергаются регулярному резервному копированию, этот показатель можно игнорировать, пока диск не сломается.

Date: 2013-05-07 03:01 am (UTC)
From: [identity profile] egor-13.livejournal.com
Reallocated sectors это то, что раньше называлось бэд сектор и лечилось диск доктором

Не совсем то - потому как вполне возможно их мирное сосуществование ;( Я в свое время взял старенький винчестер для периодических бэкапов несистемных файлов - позднее на нем сначала появились reallocated, а потом добавились и bad. Впрочем, как раз для бэкапов сойдет, поскольку они копии.

Date: 2013-05-05 09:38 pm (UTC)
From: [identity profile] nextcicatrice.livejournal.com
Ответ на первый вопрос можно найти погуглив фразу "Оцениваем состояние жёстких дисков при помощи S.M.A.R.T." Там подробно разжёван каждый параметр.