Перейти к основному содержанию

smartd пишет в лог высокую температуру

Linux 2

Прислали строчку из логов с комментарием, что диск греется:

smartd[1591]: Device: /dev/sdd [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 77 to 78

Фигасе, полез разбираться.

Если у нас стоит smartmontools и работает smartd, то в логах пишутся данные об изменении значений SMART дисков. Команды в помощь:

grep "smartd" /var/log/syslog*
grep "smartd.*/dev/sda" /var/log/syslog*

Или сразу:

cat /var/log/syslog | grep Airflow_Temperature_Cel

Получим:

Sep 27 06:29:46 srv smartd[1534]: Device: /dev/sdb [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 80 to 79
Sep 27 06:59:46 srv smartd[1534]: Device: /dev/sdc [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 77 to 76
Sep 27 07:29:46 srv smartd[1534]: Device: /dev/sdc [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 76 to 77

Но не всё так страшно, выведем все данные, нас интересует блок "Vendor Specific SMART Attributes with Thresholds":

smartctl -a /dev/sda | grep -A28 "SMART Attributes"

Смотрим:

ssh

Замечаем, что у Airflow_Temperature_Cel нормальное значение температуры 22 °C, то оно в колонке RAW_VALUE. А вот в колонке VALUE у нас значение 78 °F. Т.е. smartd пишет в лог значение в Фаренгейтах, беспокоиться не о чем.

Как вариант можно добавить атрибут -R в /etc/smartd.conf:

/dev/sda -R 190 -R 194 -R 231 -I 9
-R ID[!]
             [ATA  only] When tracking, report whenever the Raw value of Attribute ID changes.  (Normally smartd only tracks/reports changes of the Normalized Attribute values.)  ID must be a decimal integer in the range from 1 to
             255.  This Directive modifies the behavior of the '-p', '-u', and '-t' tracking Directives and has no effect without one of them.  This Directive may be given multiple times.
             If this Directive is given, it automatically implies the '-r' Directive for the same Attribute, so that the Raw value of the Attribute is reported.
             A common use of this Directive is to track the device Temperature (often ID=194 or 231).  It is also useful for understanding how different types of system behavior affects the values of certain Attributes.
             If the optional flag '!' is appended, a change of the Raw value is considered critical.  The report will be logged as LOG_CRIT and a warning email will be sent if '-m' is specified.  An example is '-R 5!' to warn when
             new sectors are reallocated.

Ссылки

https://forum.proxmox.com/threads/ssd-temperature-issues-smartd.98982/

Теги

 

Похожие материалы

Установка UniFi Controller на Ubuntu Server

Для управления Wi-Fi точками доступа требуется установить на сервер UniFi Controller. Контроллер помогает конфигурировать точки доступа, настраивать бесшовный роуминг и обновлять прошивки точек. Для дома или небольшого офиса - то что надо. Дёшево и сердито. Ubuntu Server может быть виртуальным.

Управление RAID контроллером LSI (Broadcom, Avago) с помощью StorCLI в Oracle Linux

Поступил вопрос написать о том, как разбиты диски на массивы в каком-то одном сервере Oracle Linux. Я, честно говоря, уже и не помню что мы там конфигурировали, воспользуемся средствами операционной системы и утилитой StorCLI.