Samsung SSD "Wear_Leveling_Count" означает
У меня есть Samsung SSD на моем ноутбуке и на некоторых серверах.
Когда я делаю:
smartctl -a /dev/sda | grep 177
Я получаю результаты, которые не могу понять. Вот некоторые примеры:
# my laptop Samsung SSD 850 EVO 500GB (new)
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
177 Wear_Leveling_Count 0x0013 100 100 000 Pre-fail Always - 0
# server 256 GB, SAMSUNG MZ7TE256HMHP-00000
177 Wear_Leveling_Count 0x0013 095 095 000 Pre-fail Always - 95
# server 512 GB, SAMSUNG MZ7TE512HMHP-00000 (1 year old)
177 Wear_Leveling_Count 0x0013 099 099 000 Pre-fail Always - 99
# server 512 GB, SAMSUNG MZ7TE512HMHP-00000 (suppose to be new)
177 Wear_Leveling_Count 0x0013 099 099 000 Pre-fail Always - 99
# server 480 GB, SAMSUNG MZ7KM480HAHP-0E005
177 Wear_Leveling_Count 0x0013 099 099 005 Pre-fail Always - 3
# server 240 GB, SAMSUNG MZ7KM240HAGR-0E005
177 Wear_Leveling_Count 0x0013 099 099 005 Pre-fail Always - 11
Любая идея, как читать Wear_Leveling_Count
?
Некоторые значения минимальны, некоторые максимальны.
Если считать "ноутбук" Samsung SSD 850 EVO 500GB
, это 0 и, вероятно, перейдет на 100, а затем потерпит неудачу.
Если считать первый "сервер" 256 GB, SAMSUNG MZ7TE256HMHP-00000
это уже на максимуме? Будет ли он падать до нуля?
4 ответа
Кингстон описал этот атрибут SMART следующим образом:
Количество циклов стирания / программирования на блок в среднем. Этот атрибут предназначен для показа неизбежного износа. Нормализованное уравнение: 100 - ( 100 * Среднее число стираний / NAND максимальное номинальное количество циклов стирания)
Игнорировать Raw Data
в этих случаях (они могут манипулироваться производителями для работы по-разному), и посмотреть на Current Value
колонка.
Этот источник от Anandtech дает нам хорошее представление о том, как использовать эту цифру:
Значение SMART Wear Leveling Count (WLC) дает нам все необходимые данные. Текущее значение обозначает остаточную долговечность привода в процентах, что означает, что оно начинается с 100 и уменьшается линейно при записи в привод. Необработанное значение WLC подсчитывает израсходованные циклы P/E, поэтому, если эти два значения отслеживаются во время записи на накопитель, рано или поздно мы найдем место, где нормализованное значение падает на единицу.
Все ваши диски находятся между 95 и 100, и в конечном итоге упадут до 0. Это оценка того, сколько write
, erase
, rewrite
и т. д. циклы, которые каждый блок может пройти перед отказом, и на данный момент один из ваших накопителей, по оценкам, использовал 5% его текущего ожидаемого срока службы. Опять же, ключевое слово здесь оценивается.
Также обратите внимание, что ваши накопители могут использовать разные технологии NAND, отсюда и различия в восприятии жизни. Некоторые технологии NAND предполагают, что блоки будут работать около 1000 циклов PE каждый, другие могут быть оценены до 30 000.
SMART сообщает о состоянии PREFAILED для моего Samsung SM951 (AHCI) 128 ГБ, о котором сообщается в Linux как SAMSUNG MZHPV128HDGM-00000 (BXW2500Q)
,
Но в моем случае я думаю, что это ошибка прошивки привода,
- поскольку
total-bytes-written
свойство сообщается как 1.1TB, в то время как накопитель имеет указанное общее записанное количество байтов (TBW) 75TB! Что, вероятно, на стороне сохранения (очень), потому что аналогичные (MLC NAND) накопители достигли множества из этого (600 ТБ) в реальном тесте на выносливость, - и кроме
wear_level_count
предупреждение не сообщается о каких-либо других префаиловых или устаревших ошибках или предупреждениях, - в то время как
reallocated-sector-count
, который в соответствии с этим тестом является хорошим индикатором до сбоя, по-прежнему равен 0.
Поэтому я бы посоветовал изучить эти значения для вашего диска / системы и основывать свои выводы на этом.
Я предпочитаю утилиту низкого уровня skdump
который поставляется с libatasmart
та же библиотека, что используется дисками Gnome.
Используйте следующую команду, заменив /dev/sdc
с путем к вашему блочному устройству:
sudo skdump /dev/sdc
Короткое примечание о Samsung EVO и PRO SSD:
smartctl -a /dev/sda
smartctl 6.4 2014-10-07 r4002 [x86_64-linux-4.9.0-0.bpo.6-amd64] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Device Model: Samsung SSD 860 PRO 1TB
Serial Number: S42NNF0K000000
LU WWN Device Id: 5 002538 e405145c6
Firmware Version: RVM01B6Q
User Capacity: 1,024,209,543,168 bytes [1.02 TB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Form Factor: 2.5 inches
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: Unknown(0x09fc) (unknown minor revision code: 0x005e)
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Fri Jan 8 11:53:56 2021 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 0) seconds.
Offline data collection
capabilities: (0x53) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 85) minutes.
SCT capabilities: (0x003d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
9 Power_On_Hours 0x0032 097 097 000 Old_age Always - 14689
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 122
177 Wear_Leveling_Count 0x0013 098 098 000 Pre-fail Always - 25
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 0
181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
183 Runtime_Bad_Block 0x0013 100 100 010 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0032 067 056 000 Old_age Always - 33
195 Hardware_ECC_Recovered 0x001a 200 200 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x003e 099 099 000 Old_age Always - 23
235 Unknown_Attribute 0x0012 099 099 000 Old_age Always - 58
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 29068641040
Итак, самая интересная часть показателя продолжительности жизни:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
177 Wear_Leveling_Count 0x0013 098 098 000 Pre-fail Always - 25
25 для значения RAW??? Означает ли это, что у меня исчерпано 25 процентов жизни?
На самом деле нет. Посмотрите, что написал Samsung:
Атрибут SMART 177 (счетчик выравнивания износа)
Этот атрибут представляет количество мультимедийных программ и операций стирания (количество раз, когда блок был стерт). Это значение напрямую связано со сроком службы SSD. Необработанное значение этого атрибута показывает общее количество циклов P/E.
Это означает, что в моем конкретном SSD VALUE 98 показано, что еще осталось 98 процентов срока службы, но среднее количество циклов программирования/стирания на блок составляет 25 раз.
Еще одна интересная вещь:
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 29068641040
Какой это размер в ГБ? ТБ?
Очень просто. Возьмите информацию SMART, чтобы получить размер сектора:
Sector Size: **512** bytes logical/physical
Всего записано гигабайт или терабайт:
29068641040/2/1024/1024 = 13861 ГБ / 1024 = 13,536 ТБ
Пояснение: разделите количество LBA на 2, поскольку 1 КБ состоит из 2 секторов по 512Б. Затем разделите на 1024, чтобы получить МБ, ГБ и ТБ.
Надеюсь, поможет.
Я всегда просто планирую ежедневное создание образа своих дисков. Некоторые установки Veem, другие StorageCraft. Поскольку восстановление/монтирование голого металла и виртуальной машины в большинстве случаев занимает менее 5 минут, меня еще ни разу не поймали со спущенными штанами.
В дополнение к этому, если вы действительно хотите иметь план, запланируйте замену всех дисков в течение 30 дней после истечения срока гарантии.
Я уважаю математику и желание знать подробности того, как и когда отказ диска можно отслеживать или прогнозировать, и я снимаю шляпу перед всеми вами, кто занимается технической стороной выяснения чисел!