На сервере Dell PowerEdge R640 произошёл сбой. Сервер ругнулся на память, но продолжил работать.
The memory health monitor feature has detected a degradation in the DIMM installed in DIMM_A2. Reboot system to initiate self-heal process.
Сервер работает, сервисы доступны. Сняли нагрузку и перезагрузили сервер. Ошибка ушла, сервер весело жужжит. Всё в порядке. Казалось бы.
Потом смотрю, что-то глаза режет и не даёт покоя. А напрягает цифра доступной памяти в 368 ГБ. Погодите-ка. На сервере 6 планок по 64 ГБ. Суммарно должно быть 384 ГБ!
Статусы всех планок "OK". Всё работает. А 16 ГБ пропало... у 64 ГБ планки памяти.
Вот такой вот пердимонокль. Поеду переткну для начала. Если не поможет, будем менять...