Smart short self test failed что это

Некоторые параметры зашкаливают и показывают, что диск «На грани отказа», а общая оценка «Диск исправен, 98 плохих секторов». Кому верить?

Smart short self test failed что это. 47300: 1812380085. Smart short self test failed что это фото. Smart short self test failed что это-47300: 1812380085. картинка Smart short self test failed что это. картинка 47300: 1812380085

Smart short self test failed что это. 120094: 2126677331. Smart short self test failed что это фото. Smart short self test failed что это-120094: 2126677331. картинка Smart short self test failed что это. картинка 120094: 2126677331

Весь смарт давай, лучше текстом, чем скрином.

Smart short self test failed что это. 100098:1655825300. Smart short self test failed что это фото. Smart short self test failed что это-100098:1655825300. картинка Smart short self test failed что это. картинка 100098:1655825300

это чепуха какая-то, у меня также на новом диске

Smart short self test failed что это. 100098:1655825300. Smart short self test failed что это фото. Smart short self test failed что это-100098:1655825300. картинка Smart short self test failed что это. картинка 100098:1655825300

кроме бэд-блоков конечно

Smart short self test failed что это. 120094: 2126677331. Smart short self test failed что это фото. Smart short self test failed что это-120094: 2126677331. картинка Smart short self test failed что это. картинка 120094: 2126677331

Smart short self test failed что это. 47300: 1812380085. Smart short self test failed что это фото. Smart short self test failed что это-47300: 1812380085. картинка Smart short self test failed что это. картинка 47300: 1812380085

Smart short self test failed что это. 120094: 2126677331. Smart short self test failed что это фото. Smart short self test failed что это-120094: 2126677331. картинка Smart short self test failed что это. картинка 120094: 2126677331

Smart short self test failed что это. 100098:1655825300. Smart short self test failed что это фото. Smart short self test failed что это-100098:1655825300. картинка Smart short self test failed что это. картинка 100098:1655825300

про перегрев это из этой строчки?

194 Temperature_Celsius 0x0022 035 061 000

Smart short self test failed что это. 120094: 2126677331. Smart short self test failed что это фото. Smart short self test failed что это-120094: 2126677331. картинка Smart short self test failed что это. картинка 120094: 2126677331

Smart short self test failed что это. 23351: 1310178298. Smart short self test failed что это фото. Smart short self test failed что это-23351: 1310178298. картинка Smart short self test failed что это. картинка 23351: 1310178298

Smart short self test failed что это. 23351: 1310178298. Smart short self test failed что это фото. Smart short self test failed что это-23351: 1310178298. картинка Smart short self test failed что это. картинка 23351: 1310178298

Smart short self test failed что это. 100098:1655825300. Smart short self test failed что это фото. Smart short self test failed что это-100098:1655825300. картинка Smart short self test failed что это. картинка 100098:1655825300

по-хорошему надо бы пофиксить перевод

Smart short self test failed что это. 36804:66134862. Smart short self test failed что это фото. Smart short self test failed что это-36804:66134862. картинка Smart short self test failed что это. картинка 36804:66134862

Smart short self test failed что это. 96843:955143001. Smart short self test failed что это фото. Smart short self test failed что это-96843:955143001. картинка Smart short self test failed что это. картинка 96843:955143001

а нормально сделать скрин слабо?

Smart short self test failed что это. p. Smart short self test failed что это фото. Smart short self test failed что это-p. картинка Smart short self test failed что это. картинка p

бессмысленно, судя по скрину это убунта, там свои переводчики

Smart short self test failed что это. 47300: 1812380085. Smart short self test failed что это фото. Smart short self test failed что это-47300: 1812380085. картинка Smart short self test failed что это. картинка 47300: 1812380085

Хотя кулер на диски не повредит (грелись они у тебя раньше, когда-то перегрев был или смарт соврал).

Smart short self test failed что это. 47300: 1812380085. Smart short self test failed что это фото. Smart short self test failed что это-47300: 1812380085. картинка Smart short self test failed что это. картинка 47300: 1812380085

Это изкоробочный гномоперевод

Smart short self test failed что это. p. Smart short self test failed что это фото. Smart short self test failed что это-p. картинка Smart short self test failed что это. картинка p

от попыуток прям настроение поднялось. Выкидывай этот стрёмный сигейт в помойку. Для трёх тыщ часов работы слишком много понаписано в смарте.

Smart short self test failed что это. 36804:66134862. Smart short self test failed что это фото. Smart short self test failed что это-36804:66134862. картинка Smart short self test failed что это. картинка 36804:66134862

смарт удивил своими завышенными параметрами

Ненормальных там только три параметра — Reallocated_Sector_Ct, Seek_Error_Rate и Hardware_ECC_Recovered. Остальное по нулям. Ну разве что температура в 61 градус — это перебор, но это дело уже прошлое.

Smart short self test failed что это. 120094: 2126677331. Smart short self test failed что это фото. Smart short self test failed что это-120094: 2126677331. картинка Smart short self test failed что это. картинка 120094: 2126677331

Seek Error Rate может быть большим, если диски в одной коробке стоят, от вибрации.

Smart short self test failed что это. 36804:66134862. Smart short self test failed что это фото. Smart short self test failed что это-36804:66134862. картинка Smart short self test failed что это. картинка 36804:66134862

На RAW VALUE смотришь? Контроллёр жёсткого диска чтоль? Только он знает, что означает эта цифра. Предназначенные для человека цифры как раз маленькие — 59 вместо 87 для VALUE и 57 вместо 60 для WORST.

Smart short self test failed что это. 84342: 1179834432. Smart short self test failed что это фото. Smart short self test failed что это-84342: 1179834432. картинка Smart short self test failed что это. картинка 84342: 1179834432

Это не зашкаливание, а плохой перевод.

«На грани отказа» и «Старый» — это типы параметров, соответственно «Pre-fail» и «Old_age», и они описывают, как надо интерпретировать ухудшение этого параметра (если оно будет).

Smart short self test failed что это. 36804:66134862. Smart short self test failed что это фото. Smart short self test failed что это-36804:66134862. картинка Smart short self test failed что это. картинка 36804:66134862

Не совсем. Не ухудшение, а падение ниже уровня THRESH. Для pre-fail это означает, что диск ВНЕЗАПНО почти-почти fail и пора спасать всё, что ещё спасается, а для old-age только то, что диск стар. Суперстар.

Smart short self test failed что это. 84342: 1179834432. Smart short self test failed что это фото. Smart short self test failed что это-84342: 1179834432. картинка Smart short self test failed что это. картинка 84342: 1179834432

Да, я неточно выразился.

(Впрочем, если оно ухудшается с заметной скоростью — тоже ничего хорошего.)

Источник

SMART Self Test — что это в БИОС

Smart short self test failed что это. lazy placeholder. Smart short self test failed что это фото. Smart short self test failed что это-lazy placeholder. картинка Smart short self test failed что это. картинка lazy placeholder

При включении компьютера Вы можете увидеть сообщения системы SMART Selt Test. Иногда она может выдавать различные ошибки, после чего ПК уже может нормально не загрузиться. Что это такое и для чего нужна данная функция?! Сейчас расскажу.
Чтобы предотвратить потерю данных, большинство классических жестких дисков для ПК и ноутбуков используют SMART. В переводе эта аббревиатура означает технологию самоконтроля, анализа и отчета о работе накопителя. SMART ведёт статистику о жестких дисках и отслеживает все ключевые данные, включая продолжительность работы накопителя и количество раз, когда привод перемещал данные из поврежденных областей.

Конечно, может случиться внезапный сбой работы жёсткого диска. Но чаще всего его можно предупредить благодаря тому, что SMART отслеживает состояние привода и может выдать сообщение о постепенном ухудшении его состояния.

SMART-тесты жесткого диска

Как правило, система тестирования жестких дисков SMART работает незаметно, как бы за кулисами. Если она обнаруживает серьезную проблему, то загрузка компьютера может быть приостановлена, чтобы отобразить предупреждение. Операционная система Windows не включает инструмент для ручного мониторинга или тестирования вашего диска с помощью SMART, но некоторые производители компьютеров, например Toshiba, Dell или HP предустанавливают небольшую диагностическую утилиту, которая проверяет уровни контролируемых атрибутов SMART, обеспечивая надзор за здоровьем привода. Если на вашем компьютере нет подобной утилиты тестирования и вы хотите проверить здоровье своего харда — загрузите тестовую программу, например DiskSmartView, SpeedFan или Smartmontools.

Как исправить ошибку SMART

Если при загрузке компьютера появляется предупреждение SMART Self Test, но компьютер загружается, то Вам нужно немедленно создать резервную копию всех важных файлов на другом диске,чтобы их не потерять. Конечно, жесткий диск может сразу и не сломаться, а проработать ещё какое-то время. Но зачем лишний риск?

Ну а далее нужно будет задуматься о замене HDD на новый, так как обычно нет возможности исправить физический износ, приводящий к сбою привода.

В Интернете можно встретить программы, которые якобы могут исправить ошибки SMART Self Test за определенную цену. Вестись на это не стоит — это развод. Физический изноз и осыпающиеся секторы «вылечить» не получится, к сожалению.

Smart short self test failed что это. lazy placeholder. Smart short self test failed что это фото. Smart short self test failed что это-lazy placeholder. картинка Smart short self test failed что это. картинка lazy placeholder

Как отключить проверку SMART

Если Вы по какой-то причине решите отключить функцию проверки жёсткого диска, то для этого необходимо будет зайти в BIOS материнской платы и в расширенных параметрах поискать раздел SMART Settings. В нём нужно найти раздел SMART Self Test и поставить ему значение Disable.
Но опять же, хочу предупредить, что не стоит игнорировать самопроверку HDD и ошибки, которые она выдаёт. Иначе рискуете потерять информацию с диска.

Источник

Исправляем ошибки S.M.A.R.T. на SSD и жестких дисках

Что такое S.M.A.R.T.? Почему возникают SMART ошибки и о чем это говорит? Ниже мы детально расскажем про причины и методы устранения подобных проблем.

Smart short self test failed что это. smart. Smart short self test failed что это фото. Smart short self test failed что это-smart. картинка Smart short self test failed что это. картинка smart

Содержание:

Средство S.M.A.R.T., показывающее ошибки жесткого диска (HDD или SSD) является сигналом того, что с накопителем случились какие-то неполадки, влияющие на стабильность и работу компьютера.

Помимо этого, такая ошибка – серьезный повод задуматься о сохранности своих важных данных, поскольку из-за проблемного накопителя можно попросту лишиться всей информации, которую практически невозможно восстановить.

Что такое SMART и что он показывает?

«S.M.A.R.T.» расшифровывается как «self-monitoring, analysis and reporting technology», что в переводе означает «технология самодиагностики, анализа и отчетности».

Каждый жесткий диск, подключённый через интерфейс SATA или ATA, имеет встроенную систему S.M.A.R.T., которая позволяет выполнять следующие функции:

Система S.M.A.R.T. позволяет давать пользователю полную информацию о физическом состоянии жесткого диска методом выставления оценок, при помощи которых можно рассчитать примерное время выхода HDD из строя. С данной системой можно лично ознакомиться, воспользовавшись программой Victoria или другими аналогами.

С тем, как работать, проверять и исправлять ошибки жесткого диска в программе Victoria, Вы можете ознакомиться в статье «Как протестировать и исправить жесткий диск используя бесплатную программу Victoria».

Ошибки S.M.A.R.T.

Как правило, в нормально работающем накопителе система S.M.A.R.T. не выдает никаких ошибок даже при невысоких оценках. Это обусловлено тем, что появление ошибок является сигналом возможной скорой поломки диска.

Ошибки S.M.A.R.T. всегда свидетельствуют о какой-либо неисправности или о том, что некоторые элементы диска практически исчерпали свой ресурс. Если пользователю стали демонстрироваться подобные сообщения, следует задуматься о сохранности своих данных, поскольку теперь они могут исчезнуть в любой момент!

Примеры ошибок SMART

Ошибка «SMART failure predicted»

Smart short self test failed что это. smart failure. Smart short self test failed что это фото. Smart short self test failed что это-smart failure. картинка Smart short self test failed что это. картинка smart failure

В данном случае S.M.A.R.T. оповещает пользователя о скором выходе диска из строя. Важно: если Вы увидели такое сообщение на своем компьютере, срочно скопируйте всю важную информацию и файлы на другой носитель, поскольку данный жесткий диск может прийти в негодность в любой момент!

Ошибка «S.M.A.R.T. status BAD»

Smart short self test failed что это. smart status bad. Smart short self test failed что это фото. Smart short self test failed что это-smart status bad. картинка Smart short self test failed что это. картинка smart status bad

Данная ошибка говорит о том, что некоторые параметры жесткого диска находятся в плохом состоянии (практически выработали свой ресурс). Как и в первом случае, следует сразу сделать бекап важных данных.

Ошибка «the smart hard disk check has detected»

Smart short self test failed что это. smart error. Smart short self test failed что это фото. Smart short self test failed что это-smart error. картинка Smart short self test failed что это. картинка smart error

Как и в двух предыдущих ошибках, система S.M.A.R.T. говорит о скорой поломке HDD.

Коды и названия ошибок могут различаться в разных жестких дисках, материнских платах или версиях BIOS, тем не менее, каждая из них является сигналом для того, чтобы сделать резервную копию своих файлов.

Как исправить SMART ошибку?

Ошибки S.M.A.R.T. свидетельствуют о скорой поломке жесткого диска, поэтому исправление ошибок, как правило, не приносит должного результата, и ошибка остается. Помимо критических ошибок, существуют еще и другие проблемы, которые могут вызывать сообщения такого рода. Одной из таких проблем является повышенная температура носителя.

Ее можно посмотреть в программе Victoria во вкладке SMART под пунктом 190 «Airflow temperature» для HDD. Или под пунктом 194 «Controller temperature» для SDD.

Smart short self test failed что это. victoria. Smart short self test failed что это фото. Smart short self test failed что это-victoria. картинка Smart short self test failed что это. картинка victoria

Если данный показатель будет завышен, следует принять меры по охлаждению системного блока:

Другим способом исправления ошибок SMART является проверка накопителя на наличие ошибок.

Это можно сделать, зайдя в папку «Мой компьютер», кликнув правой клавишей мыши по диску или его разделу, выбрав пункт «Сервис» и запустив проверку.

Smart short self test failed что это. disk check1. Smart short self test failed что это фото. Smart short self test failed что это-disk check1. картинка Smart short self test failed что это. картинка disk check1

Если ошибка не была исправлена в ходе проверки, следует прибегнуть к дефрагментации диска.

Чтобы это сделать, находясь в свойствах диска, следует нажать на кнопку «Оптимизировать», выбрать необходимый диск и нажать «Оптимизировать».

Smart short self test failed что это. optimisation. Smart short self test failed что это фото. Smart short self test failed что это-optimisation. картинка Smart short self test failed что это. картинка optimisation

Если ошибка не пропадет после этого, скорее всего, диск просто исчерпал свой ресурс, и в скором времени он станет нечитаемым, а пользователю останется только приобрести новый HDD или SSD.

Как отключить проверку SMART?

Диск с ошибкой S.M.A.R.T. может выйти из строя в любой момент, но это не означает, что им нельзя продолжать пользоваться.

Стоит понимать, что использование такого диска не должно подразумевать в себе хранение на нем сколько-либо стоящей информации. Зная это, можно провести сброс smart настроек, которые помогут замаскировать надоедливые ошибки.

Шаг 1. Заходим в BIOS или UEFI (кнопка F2 или Delete во время загрузки), переходим в пункт «Advanced», выбираем строку «IDE Configuration» и нажимаем Enter. Для навигации следует использовать стрелочки на клавиатуре.

Smart short self test failed что это. bios advanced. Smart short self test failed что это фото. Smart short self test failed что это-bios advanced. картинка Smart short self test failed что это. картинка bios advanced

Шаг 2. На открывшемся экране следует найти свой диск и нажать Enter (жесткие диски подписаны «Hard Disc»).

Smart short self test failed что это. choose disk. Smart short self test failed что это фото. Smart short self test failed что это-choose disk. картинка Smart short self test failed что это. картинка choose disk

Шаг 3. Опускаемся вниз списка и выбираем параметр SMART, нажимаем Enter и выбираем пункт «Disabled».

Smart short self test failed что это. smart off. Smart short self test failed что это фото. Smart short self test failed что это-smart off. картинка Smart short self test failed что это. картинка smart off

Шаг 4. Выходим из BIOS, применяя и сохраняя настройки.

Стоит отметить, на некоторых системах данная процедура может выполняться немного по-другому, но сам принцип отключения остается прежним.

После отключения SMART ошибки перестанут появляться, и система будет загружаться в штатном порядке до тех пор, пока HDD окончательно не выйдет из строя. В некоторых ситуациях ошибки могут показываться в самой ОС, тогда достаточно несколько раз отклонить их, после чего появится кнопка «Больше не показывать».

Что делать если данные были утеряны?

При случайном форматировании, удалении вирусами или утере любых важных данных следует быстро вернуть утерянную информацию самым эффективным методом.

Шаг 1. Установить и запустить программу RS Partition Recovery.

Smart short self test failed что это. . Smart short self test failed что это фото. Smart short self test failed что это-. картинка Smart short self test failed что это. картинка

Универсальное решение для восстановления данных

Шаг 2. Выберите носитель или раздел диска, с которого необходимо восстановить данные.

Smart short self test failed что это. rs partition recovery main. Smart short self test failed что это фото. Smart short self test failed что это-rs partition recovery main. картинка Smart short self test failed что это. картинка rs partition recovery main

Шаг 3. Выберите тип анализа.

Smart short self test failed что это. rs partition recovery type analysis. Smart short self test failed что это фото. Smart short self test failed что это-rs partition recovery type analysis. картинка Smart short self test failed что это. картинка rs partition recovery type analysis

Быстрый анализ стоит использовать, если файлы были удалены недавно. Программа проведет анализ и отобразит данные доступные для восстановления.

Полный анализ позволяет найти утерянные данные после форматирования, перераспределения диска или повреждения файловой структуры(RAW).

Шаг 4. Просмотр и выбор файлов для восстановления.

Smart short self test failed что это. rs partition recovery result. Smart short self test failed что это фото. Smart short self test failed что это-rs partition recovery result. картинка Smart short self test failed что это. картинка rs partition recovery result

Шаг 5. Добавление файлов для сохранения в «Список Восстановления» или выбор всего раздела для восстановления.

Smart short self test failed что это. list to save. Smart short self test failed что это фото. Smart short self test failed что это-list to save. картинка Smart short self test failed что это. картинка list to save

Smart short self test failed что это. rs partition recovery save as. Smart short self test failed что это фото. Smart short self test failed что это-rs partition recovery save as. картинка Smart short self test failed что это. картинка rs partition recovery save as

Стоит отметить, что в качестве места для записи восстановленного файла лучше всего выбрать другой диск или раздел чтобы избежать перезаписи файла.

Источник

Оценка технического состояния жестких дисков с использованием технологии S.M.A.R.T


Общие сведения о технологии S.M.A.R.T

Современные жесткие диски довольно “умные” устройства и, кроме основных присущих им как устройствам хранения и обработки данных свойств, поддерживают технологию самотестирования, анализа состояния, и накопления статистических данных об ухудшении собственных характеристик S.M.A.R.T. ( S elf- M onitoring A nalysis a nd R eporting T echnology). Основы S.M.A.R.T. были разработаны в 1995 г. совместными усилиями ведущих производителями жестких дисков (HDD). В последующие годы стандарты S.M.A.R.T дорабатывались в соответствии с изменениями технологий и оборудования ( SMART II и SMART III) и продолжают совершенствоваться в настоящее время.

Атрибуты состоят из нескольких полей, ( наиболее часто обозначаемых как Val, Worst, Tresh, RAW ), каждое из которых является определенным показателем, характеризующим техническое состояние накопителя на данный момент времени. Программы считывания S.M.A.R.T. выводят содержимое атрибутов, как правило, в виде нескольких колонок :

Формат командной строки smartctl :

smartctl параметры устройство

Примеры использования smartctl

По умолчанию, база данных хранится в файле /usr/share/smartmontools/drivedb.h

===== DEVICE SELF-TEST OPTIONS =====

Примеры использования smartctrl.

Пример отображаемых данных:

Расшифровка атрибутов S.M.A.R.T

Идентификаторы атрибутов указаны в десятичной системе счисления, а в скобках они же – в шестнадцатеричной.

Оценка технического состояния жесткого диска по данным S.M.A.R.T

Минимально информативный контроль состояния дисков может выполняться даже на уровне BIOS. В случае достижения критического значения любого атрибута, характеризующего работоспособность, при включенном мониторинге состояния S.M.A.R.T в настройках BIOS, загрузка операционной системы приостанавливается и на экран выводится сообщение:

Primary Master Hard Disk: S.M.A.R.T status BAD!, Backup and Replace.
Press F1 to Resume

Таким образом, без установки или запуска дополнительного программного обеспечения, имеется возможность вовремя определить факт критического состояния накопителя средствами Базовой Системы Ввода-Вывода (BIOS) при включении компьютера.

Изменение абсолютных значений атрибутов нужно рассматривать в динамике, и в логической взаимосвязи друг с другом.

Выполнение встроенных тестов S.M.A.R.T

Что означает, что диску отправлена команда на выполнение короткого теста, диск ее воспринял успешно, тест будет продолжаться 1 минуту, и для принудительного его прекращения можно воспользоваться командой smartctl –X.

Для запуска длинного теста используется команда:

В ответ на команду выводится информация о начале теста:

Как видно, длинный тест для данной модели накопителя будет выполняться 70 минут.

Результат выполнения можно проверить командой smartctl –l selftest /dev/sda

Список команд ATA для работы с S.M.A.R.T

Дополнительно по теме оборудования в Linux:

Источник

Мониторинг и проверка состояния SSD в Linux

И снова здравствуйте. Перевод следующей статьи подготовлен специально для студентов курса «Администратор Linux». Поехали!

Smart short self test failed что это. image loader. Smart short self test failed что это фото. Smart short self test failed что это-image loader. картинка Smart short self test failed что это. картинка image loader

Что такое S.M.A.R.T.?

S.M.A.R.T. (расшифровывается как Self-Monitoring, Analysis, and Reporting Technology) – это технология, вшитая в накопители, такие как жесткие диски или SSD. Ее основная задача – это мониторинг состояния.

На деле, S.M.A.R.T. контролирует несколько параметров во время обычной работы с диском. Он мониторит такие параметры как количество ошибок чтения, время запуска диска и даже состояние окружающей среды. Помимо этого, S.M.A.R.T. также может проводить тесты с использованием накопителя.

В идеале, S.M.A.R.T. позволит прогнозировать предсказуемые отказы, такие как отказы, вызванные механическим износом или ухудшением состояния поверхности диска, а также непредсказуемые отказы, вызванные каким-либо неожиданным дефектом. Поскольку обычно диски не выходят из строя внезапно, S.M.A.R.T. помогает операционной системе или системному администратору идентифицировать те диски, которые скоро выйдут из строя, чтобы их можно было заменить и избежать потери данных.

Что не относится к S.M.A.R.T.?

Все это, конечно, круто. Однако S.M.A.R.T. – это не хрустальный шар. Он не может спрогнозировать отказ со стопроцентной вероятностью и не может гарантировать, что накопитель не выйдет из строя без предупреждения. В лучшем случае S.M.A.R.T. стоит использовать для оценки вероятности поломки.

Учитывая статистический характер прогнозирования отказов, технология S.M.A.R.T. особенно интересует компании, использующие большое количество устройств для хранения данных. Чтобы выяснить, насколько точно S.M.A.R.T. может прогнозировать отказы и сообщать о необходимости замены дисков в центрах обработки данных или серверных мейнфреймах, даже проводились специальные исследования.

В 2016 году Microsoft и университет штата Пенсильвания провели исследование, связанное с SSD.

Согласно этому исследованию, некоторые атрибуты S.M.A.R.T. считаются хорошими индикаторами неизбежности отказа. В особенности в статье упоминаются:

Счетчик переназначенных (Realloc) секторов:

Несмотря на то, что основополагающие технологии радикально отличаются, этот показатель остается востребованным как в мире SSD, так и в мире жестких дисков. Стоит отметить, что из-за особенностей алгоритмов балансировки износа, используемых в SSD, когда несколько секторов выходят из строя, то с большой вероятностью можно предположить, что скоро выйдут из строя еще больше.

Ошибки в цикле Program/Erase (P/E):

Это признак проблем с основным оборудованием флеш-памяти, связанных с тем, что диск не может удалить данные из блока или сохранить их там. Дело в том, что процесс производства несовершенен, поэтому появление таких ошибок вполне можно ожидать. Однако флеш-память имеет ограниченное число циклов записи/удаления. По этой причине внезапное увеличение числа событий может сигнализировать о том, что диск достигает своего предела, и вполне ожидаемо, что другие ячейки памяти также начнут выходить из строя.

CRC и неисправимые ошибки («Data Error ”):

События такого типа могут быть вызваны ошибками хранения, либо проблемами с внутренним каналом связи накопителя. Этот индикатор учитывает как исправленные ошибки (без проблем сообщенные хост-системе), так и неисправленные ошибки (из-за которых происходит блокировка диска, сообщившего хост-системе о невозможности чтения). Другими словами, исправляемые ошибки невидимы для операционной системы, тем не менее они влияют на производительность накопителя, увеличивая вероятность переназначения сектора.

SATA downshift count:

Из-за временных помех, проблем с каналом связи между накопителем и хостом или из-за внутренних проблем с накопителем, интерфейс SATA может переключиться на более низкую скорость передачи сигналов. Снижение скорости соединения ниже номинального уровня оказывает очевидное влияние на производительность диска. Таким образом, этот показатель является наиболее значимым, в особенности, когда он коррелирует с наличием одного или нескольких предыдущих показателей.

Согласно исследованию, 62% вышедших из строя SSD показали наличие как минимум одного из вышеприведенных симптомов. С другой стороны можно сказать, что 38% изученных накопителей сломались без индикации этих симптомов. В исследованиях не упоминалось, были ли какие-то еще сообщения об отказах от S. M. A. R. T. по другим «симптомам». По этой причине нельзя напрямую сопоставить эти значения с отказом без предупреждения в 36% случаев из статьи от Google.

В исследовании Microsoft и университета штата Пенсильвания не раскрывались модели исследуемых дисков, однако, по словам авторов, большинство дисков поступают от одного и того же поставщика в течение уже нескольких поколений.

В ходе исследования также были отмечены значительные различия в надёжности между различными моделями. Например, «худшая» изученная модель показывает двадцатипроцентную частоту отказов через 9 месяцев после первой ошибки переназначения и до 36-ти процентов отказов в течение 9 месяцев после первого появления ошибок данных. «Худшей» моделью было названо более старое поколение дисков, рассматриваемых в статье.

С другой стороны, с теми же симптомами, что приведены выше, накопители нового поколения отказали в 3% и 20% в соответствии с теми же ошибками. Трудно сказать, можно ли объяснить эти цифры улучшением конструкции накопителя и производственного процесса, или здесь роль играет эффект устаревания накопителя.

Самое интересное, что упоминается в статье (я уже писал об этом ранее), так это то, что увеличение количества зарегистрированных ошибок может случить тревожным индикатором:

«Существует большая вероятность появления симптомов, предшествующих отказу SSD, которые активно себя проявляют и быстро прогрессируют, сильно сокращая время жизни накопителя до нескольких месяцев.»

Другими словами, одна случайная ошибка, о которой сообщил S.M.A.R.T., определенно не должна рассматриваться как сигнал о неизбежном отказе. Однако, когда исправный SSD начинает сообщать о все большем количестве ошибок, следует ждать краткосрочного или среднесрочного сбоя.

Использование smartctl для мониторинга состояния вашего SSD в Linux

smartctl – это инструмент командной строки, но это особенно помогает в случаях, когда вам нужно автоматизировать сбор данных, например, с ваших серверов.

Первый шаг в использовании smartctl – это проверка того, есть ли на вашем диске S.M.A.R.T. и поддерживается ли он инструментом:

Как видите, мой внутренний жесткий диск ноутбука действительно поддерживает S.M.A.R.T. и он включен. Итак, как теперь получить S.M.A.R.T статус? Есть ли какие-то зафиксированные ошибки?

Понимание выходных данных команд smartctl

На выходе получается много информации, которую не всегда легко понять. Наиболее интересной, вероятно, является та часть, которая помечена как “Vendor Specific SMART Attributes with Thresholds”. Она сообщает различные статистические данные, собранные S.M.A.R.T. устройством, и позволяет сравнить эти значения (текущие или худшие за все время) с некоторым порогом, определенным поставщиком.

Например, вот мои отчеты о переназначенных секторах на диске:

Вы можете заметить атрибут «Pre-fail». Он означает, что значение является аномальным. Таким образом, если значение превышает пороговое, велика вероятность сбоя. Другая категория »Old_age» используется для атрибутов, отвечающих значениям «нормального износа».

Последнее поле (здесь со значением «3») соответствует исходному значению атрибута, которое сообщает диск. Обычно это число имеет физическое значение. Здесь это фактическое количество переназначенных секторов. Для других атрибутов это может быть температура в градусах Цельсия, время в часах или минутах или количество раз, когда для диска было выполнено определенное условие.

В дополнение к исходному значению, диск с поддержкой S.M.A.R.T. должен сообщать «нормализованные значения» (значения полей, самые худшие и пороговые). Эти значения нормируются в диапазоне 1-254 (0-255 для пороговых значений). Прошивка диска выполняет эту нормализацию с помощью некоторого внутреннего алгоритма. Кроме того, разные производители могут нормализовать один и тот же атрибут по-разному. Большинство значений представлены в процентах, причем чем выше, тем лучше, но так бывает не всегда. Когда параметр ниже или равен пороговому значению, указанному производителем, диск считается неисправным в терминах этого атрибута. Помня о всех указаниях из первой части статьи, когда атрибут, показывающий ранее значение “pre-fail” все-таки дал сбой, наиболее вероятно, что скоро диск выйдет из строя.

В качестве второго примера возьмем “seek error rate”:

На самом деле (и это основная проблема отчетности S.M.A.R.T.), точное значение полей каждого атрибута понимает только поставщик. В моем случае Seagate использует логарифмическую шкалу для нормализации значения. Таким образом, «71» означает примерно одну ошибку на 10 миллионов запросов (10 в степени 7,1). Забавно, что самым худшим показателем за все время была одна ошибка на 1 миллион запросов (10 в 6-й степени).

Если я правильно понимаю, то это значит, что головки моего диска сейчас расположены точнее, чем раньше. Я не следил за этим диском внимательно, поэтому анализирую полученные данные весьма субъективно. Возможно накопитель просто надо было немного «обкатать» с тех пор как он был введен в эксплуатацию? Или может быть это следствие механического износа деталей и, следовательно, теперь имеет место меньшая сила трения? В любом случае, какова бы ни была причина, это значение является скорее показателем производительности, чем ранним предупреждением об ошибке. Так что меня оно не сильно беспокоит.

Помимо вышеприведенного и трех крайне подозрительных ошибок, записанных около шести месяцев назад, этот диск находится в удивительно хорошем состоянии (по данным S.M.A.R.T.) для стокового диска ноутбука, проработавшего более 1100 дней (26423 часа).

Из любопытства я провел этот же тест на гораздо более новом ноутбуке, оснащенном SSD:

Выше вы видите выходные данные абсолютно нового SSD. Данные понятны даже в случае отсутствия нормализации или метаинформации для данных конкретного поставщика, как в моем случае с “Unknown_SSD_Attribute.” Я могу только надеяться, что в последующих версиях smartctl в базе данных появятся данные об этой модели диска, и я смогу лучше определять потенциальные проблемы.

Проверьте свой SSD в Linux с помощью smartctl

До сих пор мы рассматривали данные, собранные во время нормальной работы накопителя. Однако протокол S.M.A.R.T. также поддерживает несколько команд для автономного тестирования для запуска диагностики по требованию.

Автономное тестирование может проводиться во время обычных операций с диском, если не было указано иное. Поскольку тест и запросы ввода-вывода хоста будут конкурировать, производительность диска упадет на время теста. Спецификация S.M.A.R.T. определяет несколько видов автономного тестирования:

Вот примеры, взятые с тех же дисков, что были выше. Я предлагаю вам угадать, где какой:

Сейчас производится проверка. Давайте дождемся завершения, чтобы посмотреть результат:

Проведем тот же тест на другом диске:

И еще раз, отправим в сон на две минуты и посмотрим результат:

Интересно, что в этом случае мы видим, что производители диска и компьютера, похоже, уже тестировали диск (на времени жизни в 0 часов и 12 часов). Я сам определенно был гораздо менее озабочен состоянием диска, чем они. Итак, поскольку я уже показал быстрые тесты, то и расширенный тоже запущу, чтобы посмотреть как это происходит.

Судя по всему на этот раз ждать придется гораздо дольше, чем при проведении короткого теста. Так что давайте посмотрим:

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *