Прислали строчку из логов с комментарием, что диск греется:
smartd[1591]: Device: /dev/sdd [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 77 to 78
Фигасе, полез разбираться.
Если у нас стоит smartmontools и работает smartd, то в логах пишутся данные об изменении значений SMART дисков. Команды в помощь:
grep "smartd" /var/log/syslog*
grep "smartd.*/dev/sda" /var/log/syslog*
Или сразу:
cat /var/log/syslog | grep Airflow_Temperature_Cel
Получим:
Sep 27 06:29:46 srv smartd[1534]: Device: /dev/sdb [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 80 to 79
Sep 27 06:59:46 srv smartd[1534]: Device: /dev/sdc [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 77 to 76
Sep 27 07:29:46 srv smartd[1534]: Device: /dev/sdc [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 76 to 77
Но не всё так страшно, выведем все данные, нас интересует блок "Vendor Specific SMART Attributes with Thresholds":
smartctl -a /dev/sda | grep -A28 "SMART Attributes"
Смотрим:
Замечаем, что у Airflow_Temperature_Cel нормальное значение температуры 22 °C, то оно в колонке RAW_VALUE. А вот в колонке VALUE у нас значение 78 °F. Т.е. smartd пишет в лог значение в Фаренгейтах, беспокоиться не о чем.
Как вариант можно добавить атрибут -R в /etc/smartd.conf:
/dev/sda -R 190 -R 194 -R 231 -I 9
-R ID[!]
[ATA only] When tracking, report whenever the Raw value of Attribute ID changes. (Normally smartd only tracks/reports changes of the Normalized Attribute values.) ID must be a decimal integer in the range from 1 to
255. This Directive modifies the behavior of the '-p', '-u', and '-t' tracking Directives and has no effect without one of them. This Directive may be given multiple times.
If this Directive is given, it automatically implies the '-r' Directive for the same Attribute, so that the Raw value of the Attribute is reported.
A common use of this Directive is to track the device Temperature (often ID=194 or 231). It is also useful for understanding how different types of system behavior affects the values of certain Attributes.
If the optional flag '!' is appended, a change of the Raw value is considered critical. The report will be logged as LOG_CRIT and a warning email will be sent if '-m' is specified. An example is '-R 5!' to warn when
new sectors are reallocated.
Ссылки
https://forum.proxmox.com/threads/ssd-temperature-issues-smartd.98982/