Что может вызвать очень высокие ошибки CRC на SSD (кроме плохих кабелей SATA, если таковые имеются)?

Мой SATA SSD, за промежуток около 2 лет, разработал более 37K ошибок CRC. Они не увеличились линейно. Было всего 3 -4 случая, когда Windows зависала, и позже, после проверки параметров SMART, я обнаружил существенное увеличение количества ошибок CRC. Увеличение было внезапным в количествах 7 - 8 К за один раз. В противном случае SSD работает нормально.

Мне интересно, что может быть причиной такого поведения. У меня есть кабели SATA хорошего качества, и они не слишком изогнуты и не скручены в корпусе.

Более того, проблема кажется самоограничивающей. Не прикасаясь к чему-либо (не нужно повторно подключать кабель SATA или около того), он восстанавливается сам по себе, а затем просто отлично работает еще несколько месяцев, прежде чем демонстрирует такое спорадическое поведение.

Это заставляет меня задуматься, есть ли что-то на самом SSD, что может быть причиной этого?

У меня есть другой жесткий диск, подключенный к тому же контроллеру SATA, такого поведения он еще никогда не демонстрировал.

Конфигурация системы - материнская плата 880GM USB3, SATA II, набор микросхем AMD SB710, Windows 7 64, 8 ГБ ОЗУ, Samsung EVO 850 120 ГБ SSD, жесткий диск Seagate Barracuda 2.5.

2 ответа

У меня была та же проблема, но я нашел ее корень. Это не имеет ничего общего с плохим кабелем / RAM / CPU. Это из-за несовместимости между вашим SSD Samsung и контроллером SATA вашего чипсета AMD. Лучшее решение для предотвращения случайного заикания и увеличения ошибок CRC - отключить NCQ (Native Command Queue) в вашем драйвере SATA

  1. Если вы используете драйвер MS Storahci по умолчанию, добавьте в реестр [HKEY_LOCAL_MACHINE \ SYSTEM \ CurrentControlSet \ Services \ storahci \ Parameters \ Device] "NcqDisabled" = dword: 00000001 или "SingleIO" = hex (7): 2a, 00,00, 00,00,00

  2. Если вы используете драйвер AMD SATA, добавьте это вместо: [HKEY_LOCAL_MACHINE \ SYSTEM \ CurrentControlSet \ services \ amd_sata \ Parameters \ Device] "AmdSataNCQDisabled" = dword: 0000000F или "AmdSataQueueDepth" = dword: 00000001

Другим решением является переключение контроллера SATA в режим IDE, но это приводит к более медленной производительности, чем описанные выше обходные пути.

Как вы уже указали, счетчик ошибок CRC связан с ошибками, обнаруженными в интерфейсе между хостом и диском. Это может быть вызвано несколькими причинами:

  1. Свободный кабель S-ATA
  2. Неисправный кабель S-ATA
  3. Неисправность ОЗУ (из-за неисправности или перегрева)
  4. Неисправный процессор (из-за неисправности или перегрева)
  5. Неисправность разъема S-ATA материнской платы или самого диска

Кажется, что это происходит очень редко, и кажется, что оно решается само собой, ничего не делая, поэтому сначала я исследую номер 3. Вы можете запустить тест памяти. Я бы порекомендовал Memtest86+. Поскольку проблема возникает нечасто, я бы рекомендовал запускать тест памяти на продолжительный период времени, чтобы можно было выполнить несколько проходов. Любая ошибка ОЗУ является слишком большой ошибкой, за исключением случаев, когда в тесте молотка ее всего несколько, поскольку некоторые типы ОЗУ более восприимчивы к этому типу стресс-тестирования, чем другие.

То, что я считаю, может привести к ошибкам CRC в Smart.

Плохой диск.
Плохой кабель
Плохие порты / материнская плата.

Я не ожидал бы, что проблема с оперативной памятью или процессором вызовет это, но это зависит от того, как подключен диск.

Так, например, если контроллер находится на борту, а порт sata напрямую подключается к контроллеру, то сигнал данных не проходит через процессор или системную память, поэтому неисправная память не будет причиной проблемы. Конечно, плохой баран может испортить данные, но это пройдет точку проверки SMART и не накапливает этот счетчик.

Недавно мне пришлось диагностировать проблему с моим твердотельным накопителем, первоначально у него были другие симптомы, но после того, как samsung вернул диск, я обнаружил спиральные ошибки CRC, и в моем случае я обнаружил, что использовал плохой кабель "и" у меня неисправный порт на моем компьютере ". системная плата.

Однако мой SSD нового поколения как на плохом кабеле, так и на порте не генерировал ошибок CRC, но оба SSD моего поколения были, причина в том, что новый SSD имеет лучший контроллер ECC. Таким образом, современные твердотельные накопители с улучшенной ECC могут обеспечить защиту от неисправных кабелей и портов.

Однако слово предупреждения.

Когда SSD сообщает об ошибке CRC, это означает, что контроллеру не удалось правильно прочитать данные с диска, и он должен повторить попытку или полностью потерпеть неудачу. Обычно это связано с ошибкой чтения. Это может произойти либо с плохой вспышкой nand, либо с плохой целостностью сигнала sata по кабелю, либо с трассировкой платы.

Опасность от всего этого заключается в том, что это также может привести к тихому повреждению данных на диске, поэтому, например, если вы используете диск с сильным ECC для исправления ошибок чтения на лету по плохому кабелю, он не будет исправлять перевернутые биты из запросов на запись и просто сообщить об успехе. Обычно защита от этого заключается в проверке ваших записанных данных, некоторые файловые системы, такие как ZFS, делают это автоматически. А также такие инструменты, как теракопия, которые предлагают делать это автоматически.

Также я заметил различия между разными драйверами.

Так, например, драйвер msahci будет продолжать работу при возникновении ошибок CRC на полной скорости, и часто возникает больше ошибок, связанных с аппаратной проблемой.
Однако драйвер быстрого хранения Intel автоматически переключается на более медленную скорость SATA, и при этом он предотвращает дальнейшие ошибки, поскольку нарушенная целостность сигнала часто вызывает проблемы только на самых высоких скоростях, иными словами, замедление скорости часто сводит на нет ошибки. Это предпочтительнее, чем повторная попытка неудачного чтения и молчаливое повреждение данных при записи. Замедление является временным до перезагрузки, а также для каждого порта, поэтому, если, например, ssd на порту 0 возвращается к sata 300 с sata 600 из-за ошибок SMART crc, ssd на порту 1, если нет ошибок crc, останется на sata 600 скорость.

Проблемы с кабелями не кажутся необычными, я проверил все 8 моих кабелей, после диагностики этой недавней проблемы, и 3 из 8 не были свободны от ошибок на SSD. Они не могут хорошо переносить резкие повороты и изгибы, также пришлось поменять кабель в другой машине около месяца назад. С точки зрения поврежденных портов и материнских плат, вызывающих ошибки sata на ssd, это выглядит гораздо реже, но время от времени происходит.

У меня тоже похожая проблема. Недавно я заменил жесткий диск моего ноутбука на твердотельный накопитель Kingston. Но я все еще использую жесткий диск с помощью компакт-диска после извлечения компакт-диска. Проблема заключалась в том, что жесткий диск работал нормально с основным портом Sata, но количество CRC резко возрастало в порту SATA привода компакт-дисков. Он все еще растет, но с точки зрения производительности недостатков нет. Я узнал, что основным портом SATA был SATA3, а портом привода компакт-дисков - SATA 2.0. Хотя он обратно совместим, я пришел к выводу, что это может быть проблема. В ваших спецификациях это SATA2, но ваш SSD - SATA3, поэтому это может сбивать с толку контроллер SATA.

Другие вопросы по тегам