Окажет ли негативное влияние на SSD-накопитель, если я буду выключать и включать его каждый час в течение 6 месяцев?
У нас есть система, в которой используется SSD (4 ТБ Samsung 860 Pro), который мы включаем на 10 минут для записи данных, а затем выключаем каждый час в течение 24/7 в течение примерно шести месяцев через систему Linux. Мы вручную включаем питание диска и ждем, пока операционная система увидит смонтированный диск. Обычно это занимает от 12 до 22 секунд. Мы считаем, что монтирование не удалось, если диск не отображается после 30 секунд ожидания монтирования. В первый раз, когда мы это сделали, все работало нормально. Мы провели второй раунд с тем же диском, но диски перестали монтироваться менее чем за 30 секунд примерно через 1–3 месяца между пятью системами, которые мы запускали.
По сути, в первом раунде привод включался и выключался как минимум 4320 раз. Поскольку во время второго раунда испытаний диск не устанавливался последовательно, общее количество циклов включения составляет от 5000 до 7000. Все диски продолжают работать, если вы подождете более 30 секунд, но в нашей системе они считаются ненадежно монтируемыми.
Кажется, я не могу найти какие-либо спецификации SSD-накопителей, касающиеся включения и выключения питания и есть ли ограничения на это. Диск 860 Pro емкостью 4 ТБ был очень дорогим, когда мы его купили (>1 тысяча долларов), и предположительно очень надежным с очень большим количеством циклов программирования/стирания (P/E). Тем не менее, нет никаких спецификаций по циклическому включению питания.
Частое выключение и выключение питания вредно для SSD-накопителя? Я знаю, что большинство людей, вероятно, не делают этого, и привод, вероятно, не включает и выключает питание чаще одного раза в день. по сути, мы пробежали 12 лет ежедневной циклической работы за 6 месяцев.
Редактировать 1 (дополнительная информация из комментариев): Мы работаем от батареек , поэтому энергопотребление очень ограничено.
Редактировать 2 (дополнительная информация из комментариев): SSD-накопитель подключен к RPi 2B v.1.2 с помощью модифицированного кабеля USB 3 — SATA. У нас есть внешний регулятор питания для включения и выключения питания по кабелю. По сути, Pi включает питание SSD, а затем проверяет, подключен ли SSD к определенному порту USB, а затем пытается подключить диск. Это делается с помощью сценария bash, который запускает цикл монтирования с задержкой в 1 секунду, пока не будет доступен доступ к SSD. Мы даем ему до 30 циклов (задержка 1 секунда каждый после неудачного монтирования).
Редактировать 3 (дополнительная информация из комментариев): Процедура размонтирования заключается в том, чтобы размонтировать диск, а затем отключить питание. Мы проверили, что данные полностью записаны перед размонтированием и выключением питания. Размер данных представляет собой сжатый файл, обычно размером от 1,2 до 1,6 ГБ. Обычно это всего лишь один файл за один час, и сжатие файла из необработанных данных на SD-карте и передача его на SSD занимает около 10 минут или около того. Таким образом, SSD включен в течение 10-12 минут, прежде чем выключиться.
Редактировать 4. Проверив больше дисков, я нашел тот, который уже имеет более 13000 циклов включения и все еще монтируется так, как мы хотим. Я жду, когда мне вернут вышедшие из строя диски, чтобы посмотреть, на что они рассчитаны. Мы знаем, что использовали их как минимум в двух предыдущих запусках, поэтому я ожидаю увидеть более 10 тысяч циклов включения для каждого из них.
Редактировать 5. Тип файла на SSD — Ext4.
9 ответов
Вместо того, чтобы отвечать на ваш вопрос, я предлагаю вам пересмотреть способы управления питанием накопителей. Учли ли вы дополнительную стоимость оборудования и паразитное энергопотребление для возможности прямого управления питанием?
SoC экономят электроэнергию за счет отключения часов на устройстве, а не отключения питания устройства. Вместо того, чтобы отказывать ему в питании, устройство переводится в спящий режим и в ответ потребляет ( требует ) меньше энергии. Поэтому вместо того, чтобы отключать питание накопителя, попробуйте перевести его в спящий режим. См. раздел «Сон устройства» (DevSleep). Использование режимов пониженного энергопотребления диска исключает необходимость использования внешнего оборудования переключения питания и переносит ответственность за экономию энергии на сам диск. Предположительно, такой привод может поддерживать повторяющиеся циклы сна и бодрствования.
Необходимость потреблять меньше энергии и обеспечивать продление срока службы батареи является важной частью современных мобильных устройств. Чтобы удовлетворить все более жесткие требования к питанию и времени автономной работы в этой новой среде, интерфейс SATA развивается. DevSleep — это новое дополнение к спецификации SATA, которое позволяет решениям хранения данных на базе SATA выйти на новый уровень энергопотребления.
В спецификации DevSleep не указано, каких уровней мощности достигнет устройство в состоянии DevSleep, но твердотельные накопители нацелены на мощность 5 мВт или меньше.
Да , циклы включения являются фактором износа твердотельных накопителей и отслеживаются как «Количество циклов включения» во внутреннем интеллектуальном мониторинге. Только производитель может сказать, насколько это слишком много, но накопители корпоративного уровня рассчитаны на круглосуточную работу, постоянную температуру и чистый источник питания. Чем дальше вы выходите за эти границы, тем менее надежными могут быть ваши диски.
Тем не менее, более длительное время монтирования на самом деле не является распространенным признаком износа SSD, если только оно не сопровождается ошибками чтения/записи. Если SSD после монтирования работает нормально, то гораздо более вероятно, что что-то на уровне ОС приводит к тому, что операция монтирования занимает больше времени, хотя причины могут различаться в зависимости от ОС, прошивки, файловой системы и т. д.
Нет, нет веских причин, по которым ваш SSD изнашивается всего за 7000 циклов включения.
Но если монтирование в пустом состоянии занимает 12–22 секунды, то монтирование в заполненном состоянии может легко занять вдвое больше времени (трудно сказать, что нужно сделать диску, чтобы сообщить о своей готовности, но это действие можно легко масштабировать с помощью например, количество файлов). Вы не упомянули, как вы заполняете свой диск с течением времени, но вы можете попробовать сэкономить время монтирования и количество загрузок для каждого диска. Я предполагаю, что вы увидите постепенное увеличение времени монтирования с каждой загрузкой, а дальнейшие подробности должны дать подсказки, которые помогут лучше объяснить это.
Включение электрического устройства означает создание скачка напряжения, поскольку мощность снижается от нуля до 100 процентов. Включение – самая опасная операция для электронного оборудования, поэтому при включении компьютера часто выявляются аппаратные проблемы.
Так что да, негативное влияние есть, но для SSD хорошего качества потребуется очень большое количество циклов включения и выключения, чтобы увидеть эффект.
SSD-накопители защищены от перебоев в подаче электроэнергии с помощью аппаратного или встроенного ПО PLP (Power Loss Protection). PLP в твердотельных накопителях с годами совершенствовались, поэтому чем новее диск, тем больше вероятность, что он будет защищен новейшей технологией PLP. Samsung 860 Pro, похоже, вышел в 2018 году, поэтому это не новейшая технология.
Я не верю, что какая-либо компания по производству твердотельных накопителей будет иметь рейтинги по максимальному количеству перезапусков питания, хотя все производители тестируют свои твердотельные накопители, чтобы гарантировать определенную отказоустойчивость.
Например, я обнаружил, что твердотельные накопители ATP проходят схему тестирования, описанную в статье « Использование тестов на четыре угла, температурное циклическое воздействие и циклическое циклическое питание для проверки устойчивости твердотельного накопителя к экстремальным условиям эксплуатации» , согласно которой диск проходит проверку, если он выдерживает 4000 таких циклов. . Если разделить это число на 365 дней, это будет означать срок службы более 10 лет для типичного потребительского компьютера, который включается один раз в день.
Ваш диск подвергается гораздо большему количеству циклов включения, чем 4000, которые ATP считает желаемым верхним пределом производительности, так что вы фактически находитесь на неизведанной территории.
Во-первых, важно распознать три разных слоя, на которых здесь может произойти «повреждение»:
- Аппаратное обеспечение: некоторые физические компоненты повреждены. Это имеет смысл для вращающегося диска, и именно поэтому количество циклов включения является показателем SMART, но это не вращающийся диск. Мы не можем сказать ничего наверняка о том, вредны ли циклы включения питания для аппаратного обеспечения SSD, но, исходя из моего опыта работы с электроникой, я бы назвал это крайне маловероятным. SSD состоит из твердотельных компонентов, и им (в основном) все равно, сколько раз вы их включаете и включаете. Резисторы не волнуют. Влияние на транзисторы и конденсаторы незначительно. Индукторы могут создавать скачки напряжения при внезапном отключении питания, но это учитывается в любой хорошей конструкции.
- Состояние устройства на уровне прошивки: такие вещи, как перемещение поврежденных секторов. SSD стали сложными. Прошивка проделывает всякие трюки за вашей спиной, а прошивка SSD заведомо глючная. Например, возможно, что ваш SSD каким-то образом помечает сектора как плохие, если он находится в середине записи, когда вы отключили питание. Многие твердотельные накопители также имеют многоуровневое хранилище, где записи сохраняются в небольшой буфер, невидимый для ОС. Это позволяет SSD быстрее менять порядок записи и сообщать о записи как о «долговременном хранении». Возможно, что-то в этой системе путается из-за всех циклов включения питания. Если это то, что происходит, вы можете исправить это с помощью «Безопасного стирания ATA» или «Безопасного стирания NVMe» (при этом удаляется все на диске). Тем не менее, я думаю, что это вряд ли будет проблемой.
- Состояние устройства на программном уровне: АКА, файловая система. Монтирование файловой системы на SSD должно занять примерно 1 секунду, а не 12–22 секунды. Это говорит о том, что файловая система не может быть полностью размонтирована. Многим файловым системам приходится предпринимать какие-то действия по восстановлению при монтировании устройства, которое не было полностью размонтировано. Это часто включает в себя «обход» файловой системы, чтобы убедиться, что все в порядке. Это происходит медленнее, поскольку в файловой системе больше данных. Другие файловые системы ведут «журнал» того, что они делали, поэтому им нужно проверять только те части файловой системы, над которыми они работали, если что-то было полностью размонтировано. Другие файловые системы (в основном) не имеют никаких средств защиты и монтируются очень быстро, даже если они повреждены.
Я думаю, что ваша проблема существует в № 3. Есть несколько способов проверить это:
- Если переформатировать диск, он снова будет работать быстро? Если да, то у вас проблема №3.
- Если вы побайтно скопируете раздел с «плохого» диска на новый (не монтируя его и не позволяя ОС что-либо очистить), он по-прежнему будет медленным? Если да, то у вас проблема №3.
- Если вы отслеживаете дисковый ввод-вывод во время монтирования диска, видите ли вы большую активность? Если да, то, вероятно, у вас проблема №3.
Что касается количества допустимых циклов мощности: я не могу найти данных по этому поводу.
Но я сомневаюсь, что это имеет значение. Я склонен полагать, что любое внезапное отключение электроэнергии может на каком-то уровне нанести вред устройству.
SSD почти никогда ничего не делают
То, что вы закончили запись, не означает, что SSD закончил запись, поскольку, как уже предполагали другие, твердотельные накопители имеют тенденцию выполнять все виды фоновых задач (сбор мусора, выравнивание износа, очистка) в «простое время». Таким образом, выдергивание пробки может привести к тому, что FTL окажется в нестабильном состоянии.
Выдергивание вилки на каком-то уровне приносит вред
Кажется, вы пока не ответили на вопрос, как отключить питание SSD или как его «выключить». Если вы как бы «выдернете вилку» или «щелкнете выключателем», вы действительно можете на каком-то уровне повредить SSD. Эти утверждения могут быть подтверждены исследованиями .
В этой статье рассматривается один из аспектов целостности данных путем измерения типов ошибок, возникающих при сбое питания во время работы флэш-памяти. Наши результаты показывают, что сбой питания может привести к нескольким неинтуитивным действиям.
Помимо повреждений на уровне FTL, файловые системы также не застрахованы от перебоев в подаче электроэнергии. Полагаю, каждый пользователь ПК знает это из личного опыта.
Диск, который не монтируется за x секунд, не означает, что он вышел из строя
Точно так же, как ОС пытается восстановиться после некорректного завершения работы или, по крайней мере, проверить «грязную» файловую систему, мы можем предположить, что прошивка SSD будет делать то же самое. Эти проверки требуют времени. Некоторые производители, например, предлагают дать SSD около 5 минут на выполнение этих действий.
Независимо от того, виден диск или нет, оставьте его в этом состоянии минимум на пять минут, чтобы SSD мог восстановить свои таблицы сопоставления, затем перезагрузите систему и посмотрите, восстановился ли диск.
В индустрии восстановления данных известен факт, что «кирпичный» твердотельный накопитель может восстановиться самостоятельно, если оставить его на некоторое время с подключенным питанием и отключенными линиями передачи данных. Я знаю крайние случаи, когда SSD оживал после 24 часов подключения к источнику питания. Но бывают случаи, когда прошивка выходит из строя до такой степени, что контроллер не может даже получить доступ к NAND. В какой-то момент контроллер должен прочитать прошивку из самой NAND, и если она слишком повреждена, она обычно оживает, но с уменьшенной емкостью.
Нет информации о фактическом режиме отказа.
Если ваше устройство не монтируется в течение x минут, это по определению не означает, что SSD окончательно вышел из строя. Ваше устройство не «монтируется» в течение x минут также очень мало говорит нам о режиме сбоя: проблема с файловой системой, проблема с прошивкой, проблема с оборудованием?
Вернуться к SD-картам?
Забавно, что SD-карты, которые вы использовали ранее, лучше справляются с внезапным отключением питания, чем более сложные (во многих отношениях) твердотельные накопители. Если вам нужна система, в которой вы можете просто щелкнуть переключателем, вашим выбором может быть переключение обратно на SD-карты или переход на более дорогие твердотельные накопители с физической защитой от потери питания в виде массива «суперконденсаторов».
Возможно, вам следует беспокоиться о скрытом повреждении данных.
В конце концов, каждая внезапная ситуация с отключением питания является плохой и потенциально может вывести из строя твердотельный накопитель без отказа какого-либо аппаратного компонента, но даже без сбоя устройства это может привести к повреждению ваших данных , что, если это останется незамеченным, может стать гораздо более серьезной проблемой.
Битовое повреждение поразило 3 устройства; у 3 была обрезана запись; 8 имели ошибки сериализации; одно устройство потеряло 1/3 своих данных; и 1 SSD замурован. На жестком диске младшего класса были некоторые несериализуемые записи, в то время как на жестком диске высокого класса не было сбоев питания (проверено: 15 дисков).
РЕДАКТИРОВАТЬ из-за изменений в вопросе.
«Мы работаем на батарейках, поэтому потребление энергии очень ограничено».
Я думаю, стоит выяснить, не является ли это источником проблемы. Итак, протестируйте ту же настройку, но теперь с настенным питанием. РЕДАКТИРОВАТЬ: Это было исследовано, а не проблема.
«Процедура размонтирования заключается в размонтировании диска и затем отключении питания. Мы проверили, что данные полностью записаны перед размонтированием и выключением питания».
Я не уверен, что это правильный способ, поскольку размонтирование не сообщает SSD о прекращении фоновой обработки, поэтому он может продолжать запись, и такая внезапная потеря питания может повредить FTL. Но я не сторонник Pi и Linux. Для вдохновения смотрите этот ответ .
«Я нашел тот, у которого уже более 13000 циклов включения, и он все еще монтируется так, как мы хотим»
Это бесполезная информация: один может выйти из строя после n циклов включения, другой — через m циклов включения, следующий — после первого раза. Следующий может потерпеть неудачу по совсем другим причинам. Кроме того, нам нужно учитывать бренды, модели, версии прошивки и многое другое.
РЕДАКТИРОВАТЬ в ответ на комментарий: «Похоже, это может быть ответом на небезопасное отключение питания: echo 1 | sudo dd of=/sys/block/sdX/device/delete»
Основываясь на моем опыте использования твердотельных накопителей в различных контекстах, я склонен полагать, что вам следует изучить именно это: плавное выключение твердотельного накопителя.
Помимо отправки прямых команд ATA, может существовать какой-то инструмент, который может сделать это за вас. Это была цель моей «вдохновляющей ссылки». Грациозного размонтирования недостаточно, это должна быть команда, которая приказывает диску выключить питание, чтобы остановить его внутреннюю служебную деятельность.
Дополнительным препятствием может стать преобразование USB > SATA: отправка правильных команд сама по себе не означает, что мост USB передаст команду на диск SATA. Опять же, исходя из опыта, мне кажется, что лучший шанс, что адаптер USB > SATA передаст команду, — это если он питается от контроллера Asmedia (ASM1153, ASM1051).
ТЛ;ДР
Прочтите о сбое термоциклирования в электронике и посмотрите на это классное изображение термической усталости припоя.
У нас есть система, в которой используется SSD (4 ТБ Samsung 860 Pro), который мы включаем на 10 минут для записи данных, а затем выключаем каждый час в течение 24/7 в течение примерно шести месяцев через систему Linux.
Вы только включаете и выключаете SSD, верно? Не вся система?
Мы вручную включаем питание диска и ждем, пока операционная система увидит смонтированный диск. Обычно это занимает от 12 до 22 секунд. Мы считаем, что монтирование не удалось, если диск не отображается после 30 секунд ожидания монтирования.
Вручную?? Вы оцениваете свою ценность в отрицательных значениях?
Это вполне ожидаемо. Современные твердотельные накопители выравнивают износ, что означает, что они физически перемещают логические блоки. Обычно это выполняется как фоновая задача с низким приоритетом в прошивке, когда ОС не пишет. Из-за такого выравнивания износа твердотельным накопителям необходимо хранить логико-физическое сопоставление блоков. Это также хранится во флэш-памяти.
Flash также требует 250 мс стабильной мощности при записи ячейки. Это скрыто прошивкой, и в последовательности записей это означает, что вам нужно включать питание только на 250 мс после последней физической записи - но это включает в себя отображение блоков.
Поскольку вы выключаете устройство без предупреждения, вы рискуете испортить сопоставление блоков. В зависимости от прошивки SSD может восстановить часть или все это сопоставление. Но каждый раз, когда вы выключаете SSD во время выравнивания износа, вы рискуете полностью выйти из строя диска.
Сброс к заводским настройкам может позволить встроенному программному обеспечению отменить все сопоставление блоков и создать новое. В этом случае все, что вы потеряете, — это немного емкости флэш-блоков, разрушенных в результате отключения питания.
Некоторый опыт по данному вопросу:
Конкретная схема включения и выключения питания может быть плохой, а может и нет, в зависимости от конструкции шины питания. Обычно это не плохо.
Если что-то выходит из строя из-за самого включения и выключения питания, это не выходит из строя постепенно или изящно. Это терпит неудачу, и точка.
SSD-накопители выполняют много домашней работы, когда они оставлены включенными и в режиме ожидания. Это включает в себя, помимо прочего, стирание блоков, в которых данные больше не действительны (т. е. перезаписаны или обрезаны), и перемещение недавно записанных данных из буферного SLC в блоки MLC постоянного хранилища. Могут быть и другие фоновые задачи. В противном случае SSD действительно демонстрируют снижение производительности.
(может быть связано со временем монтирования). Мы наблюдали, как твердотельные накопители различных надежных брендов снижают свою производительность на 3–5 порядков как при чтении, так и при записи после длительного использования. Нам не удалось определить конкретную модель использования, которая приводит к такой потере производительности, но это точно не большие последовательные записи. Что касается чтения, на диске появляются «медленные места» в определенных диапазонах LBA, и становится трудно спасти данные с него. С другой стороны, до сих пор никакие данные не были потеряны. В-третьих, диск, по крайней мере, временно восстанавливает производительность после того, как был «улучшен стиранием безопасности», а затем оставлен в покое (включен) на время, объявленное для команды «улучшенное стирание безопасности».