Smartctl exe что это

S.M.A.R.T + Zabbix | Windows

Наткнулся на статью сис.админа Zerox на счёт мониторинга S.M.A.R.T. диска средствами Zabbix. Но что-то у меня никак не получалось по его записи. Поэтому я опишу свой опыт настройки это необходимой вещи.

Если вы здесь потому что вы начали майнить Chia можете написать мне все мои Контакты, могу предложить услугу по внедрению этого решения на ваши фермы, уже есть опыт.

Будем разворачивать решение с Github. По сути, эта запись просто перевод с небольшими пояснениями. 🙂

Все необходимые компоненты я сложил в архив, который можно скачать с Я.Диска (если ссылка сломалась пишите к комменты, стучите на почту, смотрите на github).

Возможности решения

Данное решает такие задачи:

Подготовка Zabbix-Server

Всё, что Вам потребуется, это добавить замечательный шаблон в свой Zabbix.

Подготовка Zabbix-Agent Windows

Установка smartmontools

Ничего необычного, просто устанавливаем smartmontools, как обычную программу. Единственный момент, не рекомендую менять путь, иначе его надо будет менять в конфиге агента и в скрипте.

Конфигурирование агента

Создаем папку scripts и помещаем туда наш скрипт smartctl-disks-discovery.ps1

Открываем zabbix_agentd.conf и правим

И добавляем пользовательскую проверку

Осталось перезапустить агента и привязать наш хост к шаблону.

Примерно через час прилетят данные. (Для отладки можно поменять время обнаружения, я обычно ставлю 10 минут, меняем 1h на 10m. Главное, не забыть обратно вернуть).

Smartctl exe что это. 2021 05 17 11 00 31. Smartctl exe что это фото. Smartctl exe что это-2021 05 17 11 00 31. картинка Smartctl exe что это. картинка 2021 05 17 11 00 31

Результат

Таким образом мы настроили мониторинг SSD и HDD дисков. Данное решение отлично показывает себя в проде. По критически важным дискам можно строить вот такие информативные графики. Мне нравится 🙂

Smartctl exe что это. 2021 05 17 11 05 10. Smartctl exe что это фото. Smartctl exe что это-2021 05 17 11 05 10. картинка Smartctl exe что это. картинка 2021 05 17 11 05 10

ТраблШутинг

У меня такая проблема возникала, когда забыл ставить smartmontools

Источник

Оценка технического состояния жестких дисков с использованием технологии S.M.A.R.T


Общие сведения о технологии S.M.A.R.T

Современные жесткие диски довольно “умные” устройства и, кроме основных присущих им как устройствам хранения и обработки данных свойств, поддерживают технологию самотестирования, анализа состояния, и накопления статистических данных об ухудшении собственных характеристик S.M.A.R.T. ( S elf- M onitoring A nalysis a nd R eporting T echnology). Основы S.M.A.R.T. были разработаны в 1995 г. совместными усилиями ведущих производителями жестких дисков (HDD). В последующие годы стандарты S.M.A.R.T дорабатывались в соответствии с изменениями технологий и оборудования ( SMART II и SMART III) и продолжают совершенствоваться в настоящее время.

Атрибуты состоят из нескольких полей, ( наиболее часто обозначаемых как Val, Worst, Tresh, RAW ), каждое из которых является определенным показателем, характеризующим техническое состояние накопителя на данный момент времени. Программы считывания S.M.A.R.T. выводят содержимое атрибутов, как правило, в виде нескольких колонок :

Формат командной строки smartctl :

smartctl параметры устройство

Примеры использования smartctl

По умолчанию, база данных хранится в файле /usr/share/smartmontools/drivedb.h

===== DEVICE SELF-TEST OPTIONS =====

Примеры использования smartctrl.

Пример отображаемых данных:

Расшифровка атрибутов S.M.A.R.T

Идентификаторы атрибутов указаны в десятичной системе счисления, а в скобках они же – в шестнадцатеричной.

Оценка технического состояния жесткого диска по данным S.M.A.R.T

Минимально информативный контроль состояния дисков может выполняться даже на уровне BIOS. В случае достижения критического значения любого атрибута, характеризующего работоспособность, при включенном мониторинге состояния S.M.A.R.T в настройках BIOS, загрузка операционной системы приостанавливается и на экран выводится сообщение:

Primary Master Hard Disk: S.M.A.R.T status BAD!, Backup and Replace.
Press F1 to Resume

Таким образом, без установки или запуска дополнительного программного обеспечения, имеется возможность вовремя определить факт критического состояния накопителя средствами Базовой Системы Ввода-Вывода (BIOS) при включении компьютера.

Изменение абсолютных значений атрибутов нужно рассматривать в динамике, и в логической взаимосвязи друг с другом.

Выполнение встроенных тестов S.M.A.R.T

Что означает, что диску отправлена команда на выполнение короткого теста, диск ее воспринял успешно, тест будет продолжаться 1 минуту, и для принудительного его прекращения можно воспользоваться командой smartctl –X.

Для запуска длинного теста используется команда:

В ответ на команду выводится информация о начале теста:

Как видно, длинный тест для данной модели накопителя будет выполняться 70 минут.

Результат выполнения можно проверить командой smartctl –l selftest /dev/sda

Список команд ATA для работы с S.M.A.R.T

Дополнительно по теме оборудования в Linux:

Источник

🐹 CentOS 7: Работа со S.M.A.R.T. Утилита smartmontools. Утилита smartctl.

Опубликовано 2020-06-25 · Обновлено 2021-05-31

Содержание:

1. О программе.

Инструмент позволяет тестировать файловую систему с большей надежностью. В современных жестких дисках имеется встроенный модуль самоконтроля S. M. A. R. T., который анализирует данные накопителя и помогает определить неисправность на первоначальной стадии. Smartmontools предназначен для работы с этим модулем.

Подробнее о Smartmontools можно узнать на сайте разработчиков, оттуда же можно и скачать последние версии данного программного обеспечения: http://www.smartmontools.org.

2. Установка программы.

Запуск установки производится через терминал:

3. Информация о дисках в системе.

Сначала узнайте какие жесткие диски подключены к вашей системе:

В выводе будет что-то подобное:

Smartctl exe что это. hdd check 07. Smartctl exe что это фото. Smartctl exe что это-hdd check 07. картинка Smartctl exe что это. картинка hdd check 07

Здесь sdX это имя устройства HDD подключенного к компьютеру.

Smartctl exe что это. hdd check 12. Smartctl exe что это фото. Smartctl exe что это-hdd check 12. картинка Smartctl exe что это. картинка hdd check 12

4. Проверка статуса устройства.

4.1. Если отключен S.M.A.R.T., то включаем его:

4.2. Для просмотра короткой информации о состоянии жесткого диска, вводится строка:

Smartctl exe что это. smartctl pic 16. Smartctl exe что это фото. Smartctl exe что это-smartctl pic 16. картинка Smartctl exe что это. картинка smartctl pic 16

ОТВЕТ: PASSED означает, что с данным HDD всё хорошо.

Этот тест может быть пройден ( PASSED ) или нет ( FAILED ). В последнем случае сбой неизбежен, начинайте резервное копирование данных с этого диска.

4.3. Если нужно выключить S.M.A.R.T.:

5. Отображение общей информации устройства.

Например, для /dev/sdb :

Smartctl exe что это. hdd check 08. Smartctl exe что это фото. Smartctl exe что это-hdd check 08. картинка Smartctl exe что это. картинка hdd check 08

Если вышеприведенная команда не работает, вам может потребоваться сообщить smartctl, какой тип интерфейса жесткого диска вы используете:

В данном примере мы сообщили компьютеру, что мы используем SATA устройство.

Хотя вы можете и не обратить внимания на версию SATA или ATA, это один из самых важных факторов при поиске замены устройству. Каждая новая версия ATA совместима с предыдущими. Например, старые устройства ATA-1 и ATA-2 прекрасно будут работать на ATA-6 и ATA-7 интерфейсах, но не наоборот. Когда версии ATA устройства и интерфейса не совпадают, возможности оборудования не будут полностью раскрыты.

В данном случае для замены лучше всего выбрать жесткий диск SATA 3.0.

Включите интеллектуальную возможность для диска S.M.A.R.T., если она отключена:

Если вы получили ответ «SMART Enable Automatic Offline failed: scsi error badly formed scsi parameters» означает, что для активации и использования этой замечательной функции нужно включить соответствующее значение в BIOS‘е про S.M.A.R.T.

Smartctl exe что это. smartctl pic 19. Smartctl exe что это фото. Smartctl exe что это-smartctl pic 19. картинка Smartctl exe что это. картинка smartctl pic 19

Иногда бывает так, что ваш BIOS и жесткий диск не поддерживают данную технологию.

6. Отображение подробной информации устройства.

Для просмотра подробной информации о состоянии жесткого диска, вводится строка:

Получим длинный ответ консоли о состоянии диска:

Следующая вещь которую можно посмотреть, когда выполняется диагностика HDD в CentOS 7, это таблица S.M.A.R.T. атрибутов.

Smartctl exe что это. hdd check 09. Smartctl exe что это фото. Smartctl exe что это-hdd check 09. картинка Smartctl exe что это. картинка hdd check 09

В S.M.A.R.T. таблице записаны параметры, определенные для конкретного диска разработчиком, а также порог отказа для этих параметров. Таблица заполняется автоматически и обновляется на основе прошивки диска.

7. Варианты тестов.

7.1. Просмотр сколько времени займут различные тесты:

7.2. Запуск короткого теста в фоновом режиме:

7.3. Запуск длинного теста в фоновом режиме:

Smartctl exe что это. smartctl pic 18. Smartctl exe что это фото. Smartctl exe что это-smartctl pic 18. картинка Smartctl exe что это. картинка smartctl pic 18

7.4. Просмотр результатов прохождения тестов:

7.5. Остановка (прерывание) теста:

7.6. Просмотр всей S.M.A.R.T. информации о диске:

Smartctl exe что это. smartctl test pic 01. Smartctl exe что это фото. Smartctl exe что это-smartctl test pic 01. картинка Smartctl exe что это. картинка smartctl test pic 01

7.7. Просмотр всей информации о диске, а не только S.M.A.R.T., включая возможные ошибки:

7.8. Просмотр S.M.A.R.T. атрибутов/показателей и их значений для диска:

8. Просмотр файла справки программы.

Для получения дополнительной информации вызывается справка:

Выход из справки — клавиша ‘ q ‘.

9. Настройка автоматической проверки устройств.

Поставим в автозапуск утилиту

# systemctl enable smartd

# systemctl start smartd

Проверим успех запуска:

Smartctl exe что это. hdd check 10. Smartctl exe что это фото. Smartctl exe что это-hdd check 10. картинка Smartctl exe что это. картинка hdd check 10

Автоматическая диагностика HDD в CentOS 7 настраивается очень просто.

В начале настройте Postfix 3 для отправки электронной почты с внутреннего системного «почтового ящика».

# настройка Postfix 3

Создадим резервную копию конфигурационного файла, на всякий случай:

# cp /etc/smartmontools/smartd.conf /etc/smartmontools/smartd.conf.original

Открываем текстовый редактор и модифицируем файл конфигурации:

Добавьте следующую строку:

Сохраните текстовый файл с настройками.

Сохраните изменения в текстовом редакторе и перезапустите smartd службу:

# systemctl restart smartd

Вы должны получить на электронную почту письмо о том, что программа была запущена успешно.

Smartctl exe что это. hdd check 11. Smartctl exe что это фото. Smartctl exe что это-hdd check 11. картинка Smartctl exe что это. картинка hdd check 11

Это будет работать только если на компьютере настроен почтовый сервер.

10. Автоматических проверок состояния дисков и оповещения в случае обнаружения ошибок.

Открываем текстовый редактор и модифицируем файл конфигурации:

Первым делом закомментируем хэшем все открытые опции DEVICESCAN :

Добавьте следующие строки:

Сохраните текстовый файл с настройками.

Теперь подробнее, что тут запрограммировано:

Проверка синтаксиса конфигурационного файла:

Smartctl exe что это. hdd check 13. Smartctl exe что это фото. Smartctl exe что это-hdd check 13. картинка Smartctl exe что это. картинка hdd check 13

Либо включением debug-режима:

Сохраните изменения в текстовом редакторе и перезапустите smartd службу:

# systemctl restart smartd

Также можно добавить опцию:

Сохраните изменения в текстовом редакторе и перезапустите smartd службу:

# systemctl restart smartd

11. Планирование графика проверки устройств.

Здесь T — тип/вид теста:

Остальные символы определяют дату и время теста:

Если несколько дисков, то добавляем аналогичные строки только меняем имена устройств /dev/sdb на имя другого диска.

Если вы хотите чтобы утилита сканировала и проверяла все устройства, которые есть в системе используйте вместо имени устройства директиву DEVICESCAN :

12. Синтаксис из smartd.conf.

Для качественного и успешного использования программного обеспечения нужно уметь его правильно настраивать, для этого требуется знать инструкцию, которую заботливо написали для нас разработчики.

Пример конфигурационного файла smartd.conf от 2015-08-27, который кто-то перевел на досуге для своего личного использования.

# smartd будет повторно читать файл конфигурации, если он получает HUP сигнал.

# Опция DEVICESCAN означает, что программа проигнорирует все строки с описанием устройств, которые будут перечислены в тексте файла конфигурации и при запуске просканирует только устройства ATA и SCSI. Для найденных устройств будут применены нижеперечисленные директивы. Для большинства пользователей рекомендуется закомментировать эту строку и явно перечислить устройства нуждающиеся в мониторинге.

# Альтернативная настройка для игнорирования отчетов о температуре и часах включения питания в системном журнале.

# Альтернативная настройка для сообщения информации о температуре в системном журнале.

# Альтернативная настройка для сообщения о изменениях температуры >=5 градусов Цельсия и минимальная/максимальная температура.

# Первый диск ATA/SATA или SCSI/SAS. Контролируйте все атрибуты, включите автоматический онлайн-сбор данных, автоматическое автосохранение атрибутов и начните короткую самопроверку каждый день между 2-3 часами ночи и продолжительную самопроверку по субботам с 3 до 4 утра.

# Мониторинг S.M.A.R.T. состояния, журнал ошибок ATA, журнал самопроверки и отслеживание изменений во всех атрибутах, кроме атрибута 194.

# Очень тихая проверка. Сообщения только о состоянии S.M.A.R.T. здоровья, если он не работает. В этом случае отправляется электронное письмо.

# Первые два SCSI диска. Это позволит контролировать все, что может видеть smartd монитор. Начните расширенные самотесты по средам с 6 до 7 вечера и воскресенья между 1-2 часами утра.

# Мониторинг четырех ATA дисков, подключенных к контроллеру 3ware 6/7/8000, который использует на 3w-xxxx драйвер. Начинайте длительные самотесты по воскресеньям между 1-2, 2-3, 3-4 часами, и 4-5 утра.

# Мониторинг двух ATA дисков, подключенных к контроллеру 3ware 9000, который использует драйвер 3w-9xxx (Linux, FreeBSD). Начните длительные самотесты по вторникам между 1-2 и 3-4 часами утра.

# Мониторинг трёх ATA дисков непосредственно подключен к HighPoint RocketRAID. Начинайте долго самотестирование по воскресеньям между 1-2, 2-3 и 3-4 часами утра.

# Мониторинг двух ATA дисков, подключенных к тому же PMPort, который подключен к HighPoint RocketRAID. Начинайте длительные самотесты по вторникам с 1-2 до 3-4 часов утра.

# Список директив для этого конфигурационного файла.

Источник

Мониторинг жёстких дисков при помощи SMART

Так уж вышло, что диски имеют свойство умирать. Но часто выяснить причину смерти накопителя бывает очень легко. Диски современных накопителей вращаются со скоростью в несколько тысяч оборотов в минуту. При этом расстояние от головки до поверхности диска составляет доли микрона. Часто диски круглосуточно работают в условиях повышенной загрязнённости или при неблагоприятном температурном режиме, в системах с очень высокой нагрузкой или не очень хорошим обслуживанием. Опытные пользователи хорошо знакомы с симптомами умирающего накопителя: система начинает работать нестабильно, зависает, ядро сообщает о каких-то трудно объяснимых ошибках. В большинстве случаев на восстановление утерянных данных может уйти весь день, при условии, конечно, что у вас есть резервные копии. Хотя, даже если у вас и есть копии всех важных данных, внезапный отказ жёсткого диска может показаться вам катастрофой.

В этой статье рассказывается о том, как при помощи утилиты smartctl и сервера smartd наблюдать за состоянием дисков в системе.

SMART (Self-Monitoring, Analysis and Reporting Technology) присутствует во всех современных жёстких дисках. Диски со SMART самостоятельно наблюдают за своей жизнедеятельностью и работоспособностью. Такие диски,в случае возникновения ошибок, сами могут определить, что что-то работает не так. Такая возможность в большинстве случаев поможет предотвратить сценарий «внезапного» отказа жёсткого диска. Практически все реализации SMART позволяют пользователям запускать самотестирование накопителей и просматривать значения параметров производительности и надёжности.

Начиная со стандарта ATA-4 введено требование удалить внутреннюю таблицу атрибутов. Вместо неё жёсткий диск должен отвечать на запросы о его состоянии ответами OK или NOT OK. Отрицательный ответ на запрос означает, что микропрограмма жёсткого диска определила, что тот скоро выйдет из строя. В стандарте ATA-5 было добавлено ведение протокола ошибок, а также набор команд для запуска самотестирования диска. Для того, чтобы воспользоваться всеми описанными возможностями, вам нужно знать, как при помощи smartmontools получать значения атрибутов SMART (большинство жёстких дисков имеют обратную совместимость с SFF-8035i), узнавать состояние диска, запускать самотестирование и анализировать протокол его работы (результаты последних 21 теста) и анализировать протокол ATA-ошибок жёсткого диска (информация о пяти последних ошибках).

smartctl

Далее отображаются поддерживаемые возможности вашего накопителя, а также примерное время выполнения различных вариантов самотестирования.

В приводимом примере 14-й атрибут (ID #194) отражает внутреннюю температуру диска.

Демон smartd

Конечно же, вы можете регулярно самостоятельно вручную отслеживать состояние дисков при помощи smartctl, однако это довольно нудное и утомительное занятие.

В пакете smartmontools имеется демон smartd, который умеет выполнять всю рутину по регулярной проверке состояния дисков. Этот демон отслеживает SMART-данные дисков и обнаруживает ошибки.
smartd может быть сконфигурирован таким образом, чтобы запускать определённые сценарии оболочки, а также отсылать уведомления на e-mail администраторам в случае обнаружения ошибок. По умолчанию, когда smartd запускается, он регистрирует диски, находящиеся в системе и затем опрашивает SMART дисков каждые 30 минут на предмет ошибок в значениях атрибутов, состояний, результатов самотестирования или увеличения количества ATA-ошибок.
По умолчанию все найденные ошибки протоколируются в /var/log/messages через syslog.

Управлять настройкой smartd можно при помощи файла конфигурации /etc/smartd.conf. Содержимое этого файла считывается smartd в момент его запуска. Каждая строка содержит директивы, относящиеся к одному диску. Конфигурационные файлы выглядят так:

В первом поле определяется путь к устройству. Директива -o on включает автоматический запуск оффлайн-тестов, а директива -S on включает функцию автоматического сохранения значений атрибутов. Директива -m совместно с e-mail адресом указывает smartd адрес для отсылки уведомлений о найденных ошибках. Директива -a заставляет smartd наблюдать за всеми доступными SMART-параметрами дисков. В приведённом примере конфигурации smartd будет протоколировать все изменения нормализованных значений атрибутов. Директива -I 194 указывает smartd игнорировать изменения значения атрибута #194, поскольку температура жёсткого диска довольно часто изменяется, а наличие в протоколе кучи сообщений об этом лишь будет мешать.

Источник

📑 Диагностика дисков в Ubuntu/Mint — пакет smartmontools

Пакет smartmontools состоит из двух утилит (smartctl и smartd), которые контролируют и следят за системными накопителями используя самопроверку, анализ и систему технологического отчёта (S.M.A.R.T.), встроенную в большинство современных ATA и SCSI жёстких дисков. Этот пакет основан на коде пакета smartsuite и включает поддержку ATA/ATAPI6 дисков.

Smartmontools состоит из двух утилит:

Пакет smartmontools присутствует в стандартных репозиториях Ubuntu/Mint и устанавливается очень просто:

$ sudo apt-get install smartmontools

Утилита smartctl

Информация о диске /dev/sda

Если S.M.A.R.T. отключен (SMART support is: Disabled), то для включения нужно выполнить команду

Но при этом нужно убедиться, что диск поддерживает технологию SMART:

Просмотр значений S.M.A.R.T. для устройства /dev/sda

Существует 2 типа атрибутов (колонка TYPE)

Быстрый опрос диска на предмет живучести, с предсказанием отказа диска в ближайшие 24 часа

Список поддерживаемых тестов и примерное время на каждый текст

Запуск теста на проверку читаемости секторов

Провести быстрый тест здоровья жесткого диска

Выполнить расширенные встроенные тесты для диска /dev/sda.

Команду можно использовать на работающей системе. Для просмотра результатов выполнения тестов используется команда вывода внутреннего журнала после завершения теста

Для просмотра всех возможностей

Утилита (демон) smartd

Для периодического тестирования дисков настроим демон smartd, для этого нужно: активировать smartd в /etc/default/smartmontools, задать настройки в /etc/smartd.conf, перезапустить демон sudo /etc/init.d/smartmontools restart;

Отредактируем файл /etc/default/smartmontools, удалив # перед start_smartd. Параметр smartd_opts отвечает за дополнительные опции для smartd, —interval говорит о периодичности проведения самодиагностики.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *