Samsung SSD "Wear_Leveling_Count" означает

У меня есть Samsung SSD на моем ноутбуке и на некоторых серверах.

Когда я делаю:

smartctl -a /dev/sda | grep 177

Я получаю результаты, которые не могу понять. Вот некоторые примеры:

# my laptop Samsung SSD 850 EVO 500GB (new)
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
177 Wear_Leveling_Count     0x0013   100   100   000    Pre-fail  Always       -       0

# server 256 GB, SAMSUNG MZ7TE256HMHP-00000
177 Wear_Leveling_Count     0x0013   095   095   000    Pre-fail  Always       -       95

# server 512 GB, SAMSUNG MZ7TE512HMHP-00000 (1 year old)
177 Wear_Leveling_Count     0x0013   099   099   000    Pre-fail  Always       -       99

# server 512 GB, SAMSUNG MZ7TE512HMHP-00000 (suppose to be new)
177 Wear_Leveling_Count     0x0013   099   099   000    Pre-fail  Always       -       99

# server 480 GB, SAMSUNG MZ7KM480HAHP-0E005
177 Wear_Leveling_Count     0x0013   099   099   005    Pre-fail  Always       -       3

# server 240 GB, SAMSUNG MZ7KM240HAGR-0E005
177 Wear_Leveling_Count     0x0013   099   099   005    Pre-fail  Always       -       11

Любая идея, как читать Wear_Leveling_Count?

Некоторые значения минимальны, некоторые максимальны.

Если считать "ноутбук" Samsung SSD 850 EVO 500GB, это 0 и, вероятно, перейдет на 100, а затем потерпит неудачу.

Если считать первый "сервер" 256 GB, SAMSUNG MZ7TE256HMHP-00000это уже на максимуме? Будет ли он падать до нуля?

4 ответа

Решение

Кингстон описал этот атрибут SMART следующим образом:

Количество циклов стирания / программирования на блок в среднем. Этот атрибут предназначен для показа неизбежного износа. Нормализованное уравнение: 100 - ( 100 * Среднее число стираний / NAND максимальное номинальное количество циклов стирания)

Игнорировать Raw Data в этих случаях (они могут манипулироваться производителями для работы по-разному), и посмотреть на Current Value колонка.

Этот источник от Anandtech дает нам хорошее представление о том, как использовать эту цифру:

Значение SMART Wear Leveling Count (WLC) дает нам все необходимые данные. Текущее значение обозначает остаточную долговечность привода в процентах, что означает, что оно начинается с 100 и уменьшается линейно при записи в привод. Необработанное значение WLC подсчитывает израсходованные циклы P/E, поэтому, если эти два значения отслеживаются во время записи на накопитель, рано или поздно мы найдем место, где нормализованное значение падает на единицу.

Все ваши диски находятся между 95 и 100, и в конечном итоге упадут до 0. Это оценка того, сколько write, erase, rewrite и т. д. циклы, которые каждый блок может пройти перед отказом, и на данный момент один из ваших накопителей, по оценкам, использовал 5% его текущего ожидаемого срока службы. Опять же, ключевое слово здесь оценивается.

Также обратите внимание, что ваши накопители могут использовать разные технологии NAND, отсюда и различия в восприятии жизни. Некоторые технологии NAND предполагают, что блоки будут работать около 1000 циклов PE каждый, другие могут быть оценены до 30 000.

SMART сообщает о состоянии PREFAILED для моего Samsung SM951 (AHCI) 128 ГБ, о котором сообщается в Linux как SAMSUNG MZHPV128HDGM-00000 (BXW2500Q),

Но в моем случае я думаю, что это ошибка прошивки привода,

  • поскольку total-bytes-written свойство сообщается как 1.1TB, в то время как накопитель имеет указанное общее записанное количество байтов (TBW) 75TB! Что, вероятно, на стороне сохранения (очень), потому что аналогичные (MLC NAND) накопители достигли множества из этого (600 ТБ) в реальном тесте на выносливость,
  • и кроме wear_level_count предупреждение не сообщается о каких-либо других префаиловых или устаревших ошибках или предупреждениях,
  • в то время как reallocated-sector-count, который в соответствии с этим тестом является хорошим индикатором до сбоя, по-прежнему равен 0.

Поэтому я бы посоветовал изучить эти значения для вашего диска / системы и основывать свои выводы на этом.

Я предпочитаю утилиту низкого уровня skdump который поставляется с libatasmartта же библиотека, что используется дисками Gnome.

Используйте следующую команду, заменив /dev/sdc с путем к вашему блочному устройству:

sudo skdump /dev/sdc

Короткое примечание о Samsung EVO и PRO SSD:

      smartctl -a /dev/sda

smartctl 6.4 2014-10-07 r4002 [x86_64-linux-4.9.0-0.bpo.6-amd64] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     Samsung SSD 860 PRO 1TB
Serial Number:    S42NNF0K000000
LU WWN Device Id: 5 002538 e405145c6
Firmware Version: RVM01B6Q
User Capacity:    1,024,209,543,168 bytes [1.02 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   Unknown(0x09fc) (unknown minor revision code: 0x005e)
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Fri Jan  8 11:53:56 2021 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        (    0) seconds.
Offline data collection
capabilities:            (0x53) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    No Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    (  85) minutes.
SCT capabilities:          (0x003d) SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       14689
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       122
177 Wear_Leveling_Count     0x0013   098   098   000    Pre-fail  Always       -       25
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   100   010    Pre-fail  Always       -       0
181 Program_Fail_Cnt_Total  0x0032   100   100   010    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   010    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0013   100   100   010    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0032   067   056   000    Old_age   Always       -       33
195 Hardware_ECC_Recovered  0x001a   200   200   000    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x003e   099   099   000    Old_age   Always       -       23
235 Unknown_Attribute       0x0012   099   099   000    Old_age   Always       -       58
241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       29068641040

Итак, самая интересная часть показателя продолжительности жизни:

      ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
177 Wear_Leveling_Count     0x0013   098   098   000    Pre-fail  Always       -       25

25 для значения RAW??? Означает ли это, что у меня исчерпано 25 процентов жизни?

На самом деле нет. Посмотрите, что написал Samsung:

Атрибут SMART 177 (счетчик выравнивания износа)

Этот атрибут представляет количество мультимедийных программ и операций стирания (количество раз, когда блок был стерт). Это значение напрямую связано со сроком службы SSD. Необработанное значение этого атрибута показывает общее количество циклов P/E.

Это означает, что в моем конкретном SSD VALUE 98 показано, что еще осталось 98 процентов срока службы, но среднее количество циклов программирования/стирания на блок составляет 25 раз.

Еще одна интересная вещь:

      241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       29068641040

Какой это размер в ГБ? ТБ?

Очень просто. Возьмите информацию SMART, чтобы получить размер сектора:

      Sector Size:      **512** bytes logical/physical

Всего записано гигабайт или терабайт:

29068641040/2/1024/1024 = 13861 ГБ / 1024 = 13,536 ТБ

Пояснение: разделите количество LBA на 2, поскольку 1 КБ состоит из 2 секторов по 512Б. Затем разделите на 1024, чтобы получить МБ, ГБ и ТБ.

Надеюсь, поможет.

Я всегда просто планирую ежедневное создание образа своих дисков. Некоторые установки Veem, другие StorageCraft. Поскольку восстановление/монтирование голого металла и виртуальной машины в большинстве случаев занимает менее 5 минут, меня еще ни разу не поймали со спущенными штанами.

В дополнение к этому, если вы действительно хотите иметь план, запланируйте замену всех дисков в течение 30 дней после истечения срока гарантии.

Я уважаю математику и желание знать подробности того, как и когда отказ диска можно отслеживать или прогнозировать, и я снимаю шляпу перед всеми вами, кто занимается технической стороной выяснения чисел!

Другие вопросы по тегам