How many passes are enough with Memtest?

My computer hangs at random on multiple occasions and on different OSes today, requiring me to hit the reset button. I suspect it could be a memory problem and did a memtest с memtest86.

Он прошел два прохода без ошибок. Этого достаточно, или мне нужно пробежать всю ночь, пока я не увижу ошибку?

Что делать, если это проблема с материнской платой или процессором? Как я узнаю, не получив новую материнскую плату?

Технические характеристики системы:

  • Память: 2.0 ГБ
  • Двухъядерный процессор Pentium® E5300 с тактовой частотой 2,60 ГГц x 2
  • Материнская плата: ASUS P5KPL-AM EPU

12 ответов

Тестирование не может доказать отсутствие ошибок, только их наличие

Memtest отлично подходит для поиска ошибок в оперативной памяти. Частота ошибок поиска по необходимости обратно пропорциональна тому, насколько повреждена оперативная память. Чем больше он сломан, тем быстрее он находит ошибки.

В 90% случаев, если у ОЗУ есть проблема, memtest обнаружит ее в течение 10 секунд, в 99% случаев достаточно одного прохода, чтобы найти проблему. Чем дольше требуется найти проблему, тем более тонкой она и тем менее вероятной является причина проблемы с вашим ПК (но вы все равно должны получить новый оперативный памяти, если вы получите хотя бы одну ошибку)

Поскольку ваш компьютер часто выходит из строя, и вы выполнили несколько проходов, это, вероятно, не ваша оперативная память. В качестве следующего шага вы должны проверить свой жесткий диск, а затем процессор с помощью такого инструмента, как Ultimate Boot CD или Hiren's. (Большинство современных BIOS также имеют встроенную функцию тестирования HDD)

Я запустил memtest и увидел 6 проходов без ошибок, с 4+ ошибками за проход после этого. Я обычно просто выполняю 3-4 прохода, но, конечно, можно пропустить ошибки, выполнив всего пару проходов. Я предполагаю, что некоторые ошибки появляются только при нагревании модулей памяти, что вызывает проблемы с памятью, работающей под высоким напряжением.

MemTest86 пытается сделать полный тест оперативной памяти. При этом он также стал хорошим всесторонним тестом, поскольку некоторые тесты также затрагивают контроллер памяти материнской платы и процессор.

Объем оперативной памяти значительно увеличился, и сегодня портативный телефон может содержать больше оперативной памяти, чем для мэйнфрейма 20 лет назад. По мере развития MemTest86 количество тестов увеличилось, как и объем оперативной памяти. Хотя оперативная память стала быстрее, тесты все еще отнимают много времени, измеряемые часами или даже днями.

Теперь о плохих новостях: я нашел по крайней мере два респектабельных источника, десять форумов и вики, как это дает один и тот же совет. Я цитирую десять форумов:

MemTest86+ должен быть запущен как минимум 8 проходов, чтобы быть где-то близким к окончательному, что-либо меньшее не даст полного анализа ОЗУ.

Если вас попросят запустить MemTest86+ от участника десяти форумов, убедитесь, что вы выполнили все 8 проходов для получения убедительных результатов. Если вы выполняете менее 8 проходов, вам будет предложено запустить его снова.

Я должен отметить, что MemTest86 имеет две версии, Free и Pro, где версия Pro имеет несколько тестов, чем бесплатная версия и параметры конфигурации. Вы можете увидеть различия в статье Сравнение возможностей.

Более подробную информацию об оптимальном количестве проходов можно почерпнуть из статьи MemTest86 Техническая информация из описания файла конфигурации MemTest86, mt86.cfg, доступно только в Pro версии:

PASS1FULL

Указывает, должен ли первый проход выполнять полный или сокращенный тест. По умолчанию при первом проходе выполняется сокращенный тест (т. Е. Меньшее количество итераций), чтобы как можно скорее обнаружить наиболее очевидные ошибки.

Вывод 1: первый проход короче и быстрее, в основном предназначен для выявления серьезных ошибок. Тот факт, что первый проход прошел без ошибок, обнадеживает, но пользователям бесплатной версии нужно дождаться второго прохода для полного охвата тестов.

Наибольшее количество проходов, которые я нашел, было в этом тесте:

Тест 7 [Движущиеся инверсии, 32-битная комбинация]

Это вариант алгоритма движущихся инверсий, который сдвигает шаблон данных влево на один бит для каждого последующего адреса. Начальная позиция бита смещается влево для каждого прохода. Для использования всех возможных шаблонов данных требуется 32 прохода. Этот тест довольно эффективен при обнаружении чувствительных к данным ошибок, но время выполнения очень велико.

Вывод 2: для полного теста 7 необходимо пройти 32 прохода, которые я принимаю за верхнюю границу количества проходов, необходимых для действительно исчерпывающего теста.

Я также отмечаю, что во многих тестах используется случайный шаблон с различным шаблоном для каждого прохода, что означает, что каждый проход отличается. Принимая это до абсурдных высот, мы можем заключить, что не существует верхнего предела для количества проходов, необходимых для абсолютно убедительного результата.

Мое мнение

Мое мнение относительно количества проходов состоит в том, что нужно выполнить столько проходов, сколько нужно времени. Нижняя граница, кажется, состоит из двух проходов, так как только второй будет полным тестом. Но вопрос "сколько достаточно" не имеет реального ответа. Еще раз отмечу, что для двух технических ссылок, которые я цитировал выше, минимальное количество проходов, необходимых для получения хорошего и убедительного результата, составляет 8 проходов (возможно, так, чтобы Тест 7 выполнил один целый 8-битный байт, среди прочих причин).

С другой стороны, ошибки, обнаруженные MemTest86, следует воспринимать очень серьезно. Поскольку здесь был задан вопрос о допустимом количестве ошибок, я отвечаю, что даже один отказ слишком велик и не приемлем.

На работе мы обычно оставляли машины работающими на ночь, но, честно говоря, каждый раз, когда мне удавалось показать проблему с памятью в memtest, это происходило в течение нескольких секунд после ее запуска.

Я никогда не видел, чтобы машина делала 1 полный проход, чтобы один из следующих провалился. (Не то, чтобы это обязательно невозможно, просто чтобы показать, что это редко.)

Раньше я работал в компьютерном магазине, где мы начинали тестировать новые машины более или менее ежедневно.

Без достаточного количества информации, чтобы действительно сказать, так что я все еще предполагаю, что ваша проблема, скорее всего, перегрев или плохой водитель.

Поскольку вы пробовали более одной ОС, драйверная часть кажется маловероятной. Если вы, например, не пробовали только разные версии Windows, которые используют один и тот же драйвер.

http://hcidesign.com/memtest/manual.html

100% покрытие означает один полный проход тестирования вашей памяти. В общем, лучше запустить несколько проходов. Вот три типичных периода тестирования, которые вы можете использовать:

  1. Тестирование до 100% покрытия (быстрый тест, чтобы убедиться, что ваша RAM работает нормально)
  2. Тест на 1 час (это поймает все, кроме случайных ошибок)
  3. Тестирование в течение ночи (рекомендуется; в любом случае, ваш компьютер больше ничего не делает ночью, почему бы не быть абсолютно уверенным, что у вас хорошая память?)

Я видел, как ОЗУ пропускает первые 6 проходов memtest, а затем проваливает последующие проходы, и при запуске ОС Linux с этой ОЗУ блокировка происходит через 6-8 часов. Другая оперативная память на той же материнской плате работала нормально, поэтому, очевидно, неисправная память чувствительна к температуре.

Когда я подозреваю проблему с оперативной памятью (например, компьютеры Dell с диагностическими индикаторами), я запускаю memtest на одном модуле памяти за раз в первом слоте в течение 8-16 часов. Если он проходит, это подтверждает, что и слот, и модуль ОЗУ исправны, и я могу (более) уверенно использовать этот слот для тестирования других модулей ОЗУ.

Мой опыт работы с memtest86+ немного отличается от большинства людей здесь. За прошедшие годы memtest мне очень помогла, но, к сожалению, иногда не удается обнаружить ошибки.

Хотя memtest работает большую часть времени, он пару раз подводил меня. В первый раз, когда он не смог обнаружить ошибки, у меня был ПК с 1x 4 ГБ DDR3, который давал мне BSOD, связанные с памятью. Я запускал memtest целый день, мы говорим о 15+ проходах, но без ошибок. Затем я проверил его на совершенно другом компьютере, то же самое, без ошибок. Операционная система была совершенно нестабильной, но никаких ошибок на memtest. Затем я использовал другое программное обеспечение под названием "PC-Check" от Eurosoft, которое очень похоже на memtest, но использует другие алгоритмы. Он также загрузочный, не требует никакой операционной системы. Он обнаружил ошибки менее чем за 5 минут. Затем я смог отправить модуль на Corsair RMA и получить замену.

Итак, memtest очень хороший, но не всегда достаточно. В настоящее время я использую memtest и PC-check для проверки памяти. Если memtest не может обнаружить ошибки, проверка компьютера, безусловно, будет и наоборот. И поверьте мне, это случается чаще, чем можно подумать.

Я бы сказал, что 3 проходов обычно достаточно. Если вы хотите быть более уверенным, сделайте 8 или 9 проходов, поскольку @Jeff видел ошибки только в одном случае на своем 7-м или более позднем проходе, но это может занять вечность! Итак, чтобы быть более практичным, возможно, просто ограничьте себя одной 8-часовой пробежкой в ​​ночное время, если выполнено не менее 3 проходов, или одной 24-часовой пробежкой весь день + ночь, если выполнено не менее 3 проходов.

Как правило, я думаю, что @LAwLz здесь правильно поняла, когда сказала (выделено мной):

В большинстве случаев memtest начинает выдавать ошибки в течение минуты, если карта памяти неисправна. Если вы спросите меня, я бы сказал, что через 1 минуту без ошибок вы можете быть уверены на 50%, что оперативная память в порядке. Через 5 минут это 70%. После одного прохода это 90%. После 3 проходов это 99,9% и так далее.

@LAwLz также продолжает, что нет никаких гарантий независимо от того, сколько проходов вы делаете:

Но вот что нужно иметь в виду. Memtest только докажет, что у вашей оперативной памяти есть проблемы, но не докажет, что у нее нет проблем (даже после 10 часов тестов). Даже если вы запустите тест 100 раз, вы не можете быть уверены, что он не выдаст ошибку после 101-го запуска.

И она также считает, что 8 часов достаточно (но я бы добавил: если за это время будет выполнено не менее 3 проходов - если нет, продолжайте, пока не получите хотя бы 3 прохода):

Поскольку в настоящее время я жду новый комплект RAM, так как в моем последнем была мертвая флешка, я планирую запустить memtest на новом комплекте RAM. Я буду запускать его на ночь, так что это займет около 8 часов.

Если вы хотите быть максимально уверенным, я бы сказал, пусть он работает на ночь. Если после 8 часов интенсивного поиска ошибок вы не получите никаких ошибок, то можно с уверенностью сказать, что они в порядке.

У меня противоположная точка зрения.

Это зависит от вашей терпимости к нестабильности и сбоям. На своих основных компьютерах я использую Linux и не терплю ничего. Мои машины обычно работают более года, прежде чем я перезагружаю их или происходит сбой в подаче электроэнергии. Были случаи, когда прошло несколько (лет). Потом во второй или третий раз происходит что-то странное, я перехожу на другую платформу и начинаю диагностировать. Это почти всегда ОЗУ (один раз была плата Ethernet и один раз коммутатор, для которого требовались только новые конденсаторы).

Учитывая эту точку зрения, у меня другой взгляд на количество проходов. Когда я покупаю новую машину (буквально или новую для меня на ebay), я эксплуатирую ее 1-3 или 4 недели в зависимости от моего терпения. После этого он всегда работал бесконечно. Единственными плохими машинами, которые я взял, были два Apple XServe 2009 года с 24 ГБ памяти, которые я получил бесплатно. У каждого был один блок неисправных модулей DIMM, и после удаления они работали много недель, прежде чем я успел их отключить. С 8 физическими ядрами XEON, работающими одновременно, это было довольно много итераций. На провал memtest86 ушла около недели. Затем я повторил сбой (Еще много дней! Какая боль...), затем заменил неисправные модули DIMM.

Почему я это делаю? В трех случаях моя машина становилась «ненадежной»: через несколько недель или месяцев она делала что-то нестабильно или зависала.

На машине с Linux при первом таком длительном запуске через 3 недели обнаружилась ошибка, я заменил модуль DIMM, и она больше никогда не зависала. Аналогично инцидент, произошедший за 2 недели.

У меня был ноутбук Toshiba под управлением Windows, который работал разное время, от нескольких часов до пары недель. Я обнаружил, что ему не хватает термопасты, и вместо этого между процессором и графическим процессором и тепловой трубкой используется какой-то пенопласт. Я заменил его термопастой (правда, не механически герметичной, поскольку механическая конструкция предполагала термопрокладку ненулевой толщины), и это значительно помогло, но иногда она все равно выходила из строя. Я выбросил это.

Да, если что-то очень грубо не так, это будет найдено с первого прохода, но обычно на это уходит несколько десятков часов. Всем машинам, о которых я говорю, для выполнения одного прохода требуется около часа-полутора, то есть получается несколько десятков проходов.

У меня было несколько материнских плат, которые постоянно терпели неудачу с memtest86 после нескольких месяцев работы, но memtest86 ничего не нашел (я не помню, сколько терпения у меня было во время выполнения). Я сбросил с 4 на 3 банки памяти и они больше никогда не падали. Мои материнские платы ASUS с одним и тем же набором микросхем всегда нормально работали с 4 банками. Оба использовали решающую память.

Раньше я использовал функцию управления тактовой частотой BIOS, чтобы снизить тактовую частоту на шаг, исходя из теории, что это сделает машину более надежной, если проблема с синхронизацией DRAM, но когда у меня действительно возникала проблема, это никогда не помогало, и описанный выше инцидент единственный раз обнаружил, что помогло снижение нагрузки на общие линии.

Я обнаружил, что машины с Windows часто все же проходят тест memtest86 в течение нескольких недель, но машина остается ненадежной под Windows. Иногда несовершенная машина внезапно становится надежной после выхода версии Windows. У меня была проблема до и во время Covid, которая была решена в четвертом полугодовом выпуске Windows — в трех выпусках проблема была решена! Та же самая машина внезапно стала прочной.

Так что, если вы перезагружаетесь каждый день или с радостью говорите: «Ой, надо перезагрузиться», и не боитесь, что когда-нибудь плохой бит окажется в ваших данных, а не в инструкциях, то я бы посоветовал запускать memtest86 хотя бы на время . полный день. По моему опыту, большинство вещей можно найти за несколько проходов и менее чем за день. Информация о том, что первый проход был менее тщательным, имеет смысл — я думаю, что он всегда проходил через первый или два прохода. Но полный день ни в коем случае не является окончательным. Я уверен, что это полный месяц, и часто иду на компромисс и провожу его на 2-3 недели, потому что нетерпелив.

Наконец, продавцы бывших в употреблении компьютеров обычно меняют вещи местами или даже разбирают их по частям, а затем собирают заново в зависимости от того, что хочет покупатель, иногда не обращая внимания на статику. Один из них сказал мне, что проблема статики иногда решалась в 2000-х годах и больше не является проблемой. Правда в том, что статика может уничтожить часть детали, но в большинстве случаев она достаточно горячая, чтобы слегка ухудшить состояние транзистора и проявиться в дальнейшем. Если вы получаете машину, которая проработала несколько лет и никто ее не разбирал, велика вероятность, что она будет работать примерно вечно. Слабые транзисторы возникают из-за примесей в кристаллической решетке кремния, а электрические поля заставляют их смещаться туда, где они причиняют наибольший вред. При более высоких температурах они дрейфуют быстрее. Когда происходит разряд сильного тока (так называемый искра), они, а также примеси, которые делают транзистор транзистором, могут совершенно свободно перемещаться, изменяя профиль легирования (наклон обрыва). Представьте себе коробку неаполитанского мороженого с красивыми четкими границами между ванилью и шоколадом, теперь вставьте небольшую нихромовую спираль на дюйм прямо от границы и нагрейте ее докрасна в течение нескольких секунд. Что сейчас произойдет? У меня был ноутбук, купленный у местного переработчика, который каждые несколько дней выходил из строя на memtest86 или выходил из строя. Я забрал его обратно, и когда я выразил беспокойство по поводу статики (глядя на его процесс), он вручил мне еще один, сказав: «Вот, я не трогал это. Оно принадлежало ИТ-менеджеру, вот откуда все это взялось, и он дал мне его последний». Это было в 2013 году. Работает до сих пор (2021 год), пока не ломалось. Почти бесполезный по сегодняшним меркам, но он служит своей нынешней цели.

Надеюсь, это полезно! Неприятные новости, но это была моя реальность. Для справки: все это основано на чем-то большем, чем 20 машин, которые я могу быстро сосчитать.

Я делаю один проход, чтобы увидеть, есть ли какие-либо очевидные ошибки.

Если есть ошибка, больше не нужно проходов.

Если проблема с компьютером странная, я отпускаю его на ночь или на день в течение ~10 часов, чтобы быть уверенным.

Я обычно запускаю memtest КАЖДЫЙ РАЗ, когда меняю процессор, память или замечаю странные проблемы. Причина в том, что memtest - это не просто проверка памяти. Это приведет к ошибке в трех других важных случаях:

1) Если есть проблемы из-за перегрева процессора или памяти. Обычно memtest загружает процессор для нескольких тестов почти до 100%.

2) если процессор не может правильно обращаться к памяти. Большинство тестов читают и пишут во всех местах памяти.

3) если есть проблемы с питанием. Т.е. слабый источник питания или плохие конденсаторы вызывают слишком много пиков, компенсирующих случайные биты.

Если я вижу хотя бы одну красную ошибку, я начинаю искать, что следует удалить / исправить перед использованием оборудования.

Учитывая, что после одного прохода он отображает Pass complete, no errors, press Esc to exitЯ всегда предполагал, что этого достаточно.

введите описание здесь

Другие вопросы по тегам