Новый ноутбук с жестким диском и странным SMART-отчетом о Ubuntu 16.04.3 LTS

Я купил новый заводской ноутбук HP Omen 15-ce084no, который поставляется с Windows 10. Он имеет 256 ГБ SSD и 1 ТБ механический диск. Проверив, что все работает в Windows, я избавился от него и установил Ubuntu 16.04.3 LTS с ядром Linux 4.10 на SSD и настроил механический диск в качестве хранилища данных. Я был счастлив (и удивлен), что абсолютно все, в том числе Wi-Fi, графическая карта и клавиатура с подсветкой, работали из коробки на Ubuntu. После установки проприетарных драйверов мой ноутбук был готов к серьезному использованию.

Однако при настройке я заметил, что диск объемом 1 ТБ издает тихий щелчок каждую секунду во время работы Ubuntu. Он не делал этого в Windows 10, я в этом уверен, и он этого не делает, например, при доступе к настройкам BIOS. Он начинает щелкать примерно через 30 секунд после загрузки Ubuntu, и вам не нужно входить в систему как пользователь. Он также щелкает, когда на экране входа в систему lightdm или, когда Ctrl+Alt+F1 на терминале.

Я немного погуглил и обнаружил много подобных кликов в Linux, решения которых основывались на проблемах парковки и энергосбережения, таких как настройка hdparm Настройки. Никто из них не работал на моем ноутбуке, и щелчок продолжается. я бегу smartctl -a на диске и заметил ненормальные значения для предположительно нового диска (Power-Off_Retract_Count = 524296). Кроме того, звук щелчка, хотя и мягкий, очень раздражает, и я не выношу его, даже если он не был опасен для диска.

Может ли кто-нибудь просмотреть сообщения ниже и ответить на эти вопросы для меня:

  1. Как эти значения возможны на новом жестком диске?
  2. Неисправен ли жесткий диск и нужно ли его заменить?
  3. Может ли Ubuntu/Linux вызвать его и так быстро уничтожить жесткий диск (примерно за 31 час работы)?
  4. Если причиной является Ubuntu/Linux, существует ли программное решение проблемы, кроме предложенного по этим ссылкам, ни одна из которых не работает:

Вот вывод smartctl -a с некоторыми удаленными идентификационными частями:

smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.10.0-40-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     HGST Travelstar 7K1000
Device Model:     HGST HTS721010A9E630
Serial Number:    JR10XXXXXXXXXX
LU WWN Device Id: 5 000cca XXXXXXXXX
Firmware Version: JB0OA3T0
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 6
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Nov 30 20:03:48 2017 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine 
completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        (   45) seconds.
Offline data collection
capabilities:            (0x5b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    ( 160) minutes.
SCT capabilities:          (0x003d) SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  
WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   062    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0025   100   100   040    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0023   121   100   033    Pre-fail  Always       -       2
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       32
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002f   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   040    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       31
 10 Spin_Retry_Count        0x0033   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       31
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   097    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   076   053   045    Old_age   Always       -       24 (Min/Max 24/24)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       8
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       524296
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       237
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   100   100   000    Old_age   Always       -       0
223 Load_Retry_Count        0x002a   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  
LBA_of_first_error
# 1  Short offline       Completed without error       00%         3         -
# 2  Short offline       Completed without error       00%         0         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Теперь сравните этот вывод с моим 5-летним диском ноутбука, на котором Ubuntu 16.04 LTS работает около 1,5 лет, а Windows 7 до этого:

smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-101-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi Travelstar 5K500.B
Device Model:     Hitachi HTS545025B9A300
Serial Number:    1007XXXXXXXXXXXXXXXX
LU WWN Device Id: 5 000cca XXXXXXXXX
Firmware Version: PB2OC64G
User Capacity:    250,059,350,016 bytes [250 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    5400 rpm
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 6
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Thu Nov 30 19:58:27 2017 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine 
completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        (  645) seconds.
Offline data collection
capabilities:            (0x5b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    (  83) minutes.
SCT capabilities:          (0x003d) SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  
WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   062    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   040    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   201   201   033    Pre-fail  Always       -       1
  4 Start_Stop_Count        0x0012   096   096   000    Old_age   Always       -       7777
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   040    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   048   048   000    Old_age   Always       -       23080
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   096   096   000    Old_age   Always       -       7763
191 G-Sense_Error_Rate      0x000a   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       136
193 Load_Cycle_Count        0x0012   083   083   000    Old_age   Always       -       171510
194 Temperature_Celsius     0x0002   144   144   000    Old_age   Always       -       38 (Min/Max 16/50)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0
223 Load_Retry_Count        0x000a   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 2
    CR = Command Register [HEX]
    FR = Features Register [HEX]
    SC = Sector Count Register [HEX]
    SN = Sector Number Register [HEX]
    CL = Cylinder Low Register [HEX]
    CH = Cylinder High Register [HEX]
    DH = Device/Head Register [HEX]
    DC = Device Command Register [HEX]
    ER = Error register [HEX]
    ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 2 occurred at disk power-on lifetime: 14089 hours (587 days + 1 hours)
  When the command that caused the error occurred, the device was active or 
idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 52 f9 d9 f8 e0  Error: UNC 82 sectors at LBA = 0x00f8d9f9 = 16308729

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 7f cc d9 f8 e0 00      00:00:18.800  READ DMA EXT
  25 00 7f 4d d9 f8 e0 00      00:00:18.800  READ DMA EXT
  25 00 7f ce d8 f8 e0 00      00:00:18.800  READ DMA EXT
  25 00 7f 4f d8 f8 e0 00      00:00:18.800  READ DMA EXT
  25 00 7f d0 d7 f8 e0 00      00:00:18.800  READ DMA EXT

Error 1 occurred at disk power-on lifetime: 14089 hours (587 days + 1 hours)
  When the command that caused the error occurred, the device was active or 
idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 52 f9 d9 f8 e0  Error: UNC 82 sectors at LBA = 0x00f8d9f9 = 16308729

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 7f cc d9 f8 e0 00      00:00:39.800  READ DMA EXT
  25 00 7f 4d d9 f8 e0 00      00:00:39.800  READ DMA EXT
  25 00 7f ce d8 f8 e0 00      00:00:39.800  READ DMA EXT
  25 00 7f 4f d8 f8 e0 00      00:00:39.800  READ DMA EXT
  25 00 7f d0 d7 f8 e0 00      00:00:39.800  READ DMA EXT

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

1 ответ

Частичный ответ:

Все значения SMART для вашего нового жесткого диска выглядят хорошо, кроме Power-Off_Retract_Count, Особенно Power_On_Hours подтвердить, что это новый диск (если кто-то не подделал эти значения, но я не думаю, что это легко возможно без взлома прошивки).

Power-Off_Retract_Count - это

отсчитывается каждый раз, когда головки загружаются с носителя (т.е. каждый раз, когда машина выключается, переводится в спящий режим или находится в режиме ожидания).

Так что это определенно похоже на проблему, подобную тем, которые вы исследовали: жесткий диск считает, что он бездействует, убирает жесткий диск, а затем включается обычная обратная запись ядра Linux и снова пробуждает диск.

У меня была похожая проблема для моего WD Green. Обратите внимание, что эти проблемы сильно зависят от поставщика, вы не можете просто применить решение, которое работает для одного бренда и модели, для другого бренда и модели. И я никогда не слышал о модели HGST Travelstar раньше (но это может быть я).

Посмотрите на "холостые" функции hdparm и посмотрите, активны ли они для вашего жесткого диска. Если это не так, вам придется искать какое-то решение, специфичное для этой модели (на WD Green необходимо было использовать дополнительную программу, которая могла бы выполнить специфичную для поставщика команду для отключения разгрузки холостого хода).

У меня такой же жесткий диск, подходящая модель и версия прошивки.

Значение Power-Off_Retract_Count действительно немного, но я бы не боялся, это на самом деле 0x80008 (524296 в шестнадцатеричном формате). Если вы посмотрите на первые 4 бита справа, я держу пари, что число аварийных отключений компьютера будет 0x0008 (8). Вот что на самом деле означает эта ценность. Аварийное отключение компьютера, когда головки втягиваются с помощью механизма аварийной разгрузки, который рассчитан на 20000 циклов в технических характеристиках привода.

https://documents.westerndigital.com/content/dam/doc-library/en_us/assets/public/western-digital/product/hgst/travelstar-7k-series/product-manual-travelstar-7k1000-standard-models.pdf

Что касается щелкающих шумов, есть несколько тем, которые могут иметь полезный ввод:

Другие вопросы по тегам