Перейти к основному содержанию

Срок службы сервера

server

Для тех кто торопится:

Срок службы сервера — 5 лет.

Классификация основных средств, утвержденной постановлением Правительства РФ от 01.01.2002 № 1 относит серверы к электронно-вычислительной технике, 2-я амортизационная группа. Значит, срок полезного использования сервера можно установить в пределах от 2 лет и одного месяца до 3 лет.

Но мы не бухгалтеры, а сисадмины. Даже если сервер спишут, он всё равно останется в стойке. Реальный срок эксплуатации больше.

Через пять лет поддержка серверов прекращается, комплектующие достать сложно. Сервер ещё может продолжать работать, у кого-то железки продолжают трудиться и через 15 лет. Появляются новые стандарты и технологии. Требования бизнеса к сервисам возрастают, требования сервисов к железу возрастают. Железо стареет, электроника увядает. Даже если сервер держится молодцом, некоторые его компоненты могут выходить из строя.

Как продлить срок службы сервера?

Даже не так, не продлить срок службы, а уменьшить вероятность поломки и обеспечить непрерывность работы сервисов. Да и частоту своих поездок в ЦОД снизить.

Микроклимат

В первую очередь следует обратить внимание на параметры окружающей среды, на микроклимат в помещении. Сервер может располагаться в серверной, находиться в ЦОД (Центр Обработки Данных), или стоять под столом.

Требования к микроклимату по российским СН 512-78 (п.3):

  • Температура воздуха 18 - 20°С. Не более 25°С, не менее 14 °С.
  • Относительная влажность воздуха 20 - 70%. Не более 75% в холодный период, не более 65% в теплый период (для 25°С), не более 70% для температуры от 24°С и ниже.
  • Оптимальная скорость потока воздуха 0,2 м/с. Не более 0,3 м/с для холодного, 0,5 м/с для теплого периодов.
  • Запыленность воздуха в серверной не должна превышать 0,75 мг/м³, с размерами частиц не более 3 мкм. в помещениях обработки данных 2 мг/м³.

Требования к микроклимату по американскому стандарту TIA 942 (п.5.3.5.):

  • Температура воздуха по сухому термометру 20 - 25°С. Не более 25°С.
  • Точка нормальной настройки 22°С.
  • Контрольный диапазон изменений ±1°С.
  • Относительная влажность воздуха 40 - 50%.
  • Точка росы не более 21°С.
  • Скорость изменения температуры не более 5°С в час.

Электропитание

Я бы ещё к микроклимату добавил требования к стабильной работе электросети. Частые отключения электричества могут плохо сказаться на здоровье сервера. У меня есть один такой кандидат, он стоит в помещении, в котором постоянно отключают свет. После очередного отключения серверу стало плохо (уже на программном уровне). Срочно закупили источник бесперебойного питания и настроили штатное завершение работы операционной системы при длительном отключении электричества.

ИБП (UPS) Legrand KEOR Multiplug 800VA — выключение и включение сервера

Блоки питания сервера часто выходят из строя. На такой случай лучше выбирать сервер с возможностью горячей замены БП (hot plug) и резервированием. При выходе из строя одного из блоков питания сервер продолжает работать, сервисы доступны. Не выключая сервер можно извлечь блок питания и заменить на новый, по гарантии или за деньги — это уже другой вопрос.

Наличие двух и более блоков питания также позволяет запитать сервер по двум отдельным лучам электроснабжения. Если на одном луче питание отключается, то второй луч нас спасает.

Если два луча питания есть, а блок питания один, то позаботьтесь о резервировании сервера или используйте устройство типа ATS (Automatic Transfer Switch — устройство автоматического включения резерва):

APC Rack ATS AP7723 — стоечный автоматический переключатель нагрузки

Такая штука позволить запитать один блок питания от двух лучей. Дорого, но надёжно.

Нагрузка

Что выйдет из строя раньше: сервер с 10% загрузки или 100%? Явно тот, что нагружен сильнее. С другой стороны зачем вообще покупать сервер, если его не нагружать?

Соблюдаем баланс, практика показывает, что оборудование должно быть нагружено на 80%. Есть исключения из этого правила, когда дополнительная загрузка приносит доход больше, чем стоимость сдохших серверов. Обычно это какие-нибудь кластеры производительного железа, задача которых — считать. Такие сервисы обычно без проблем выдерживают потерю нескольких нод.

Горячая замена — hot plug

Используйте сервер с возможностью горячей замены компонентов. Менять можно диски, блоки питания, вентиляторы (вентиляторы ни разу не менял). Подозреваю, что вентиляторы могут выходить из строя в условиях повышенной запылённости. На этот случай обеспечьте возможность доступа к внутренним компонентам сервера (возможность выдвижения) без выключения самого сервера с помощью специальных приспособлений — рукавов.

RAID

Не забывайте использовать RAID-контроллеры для организации массивов высокой доступности. Это позволит сменить сбойный диск без остановки сервисов и потери данных.

На случай отключения питания используйте дополнительный кэш RAID-контроллера с питанием от батарейки. Батарейку нужно чаще менять, но купирование рисков потери данных в критичных сервисах важнее.

ЗИП — Запасные части, Инструменты и Принадлежности

На случай выхода из строя компонентов нужно иметь запчасти. Срок службы жёстких дисков, твердотельных накопителей, блоков питания и прочего железного барахла ограничен.

  • Cрок работы жесткого диска 3-5 лет. HDD служат дольше чем SSD.
  • Блоки питания — 3-5 лет.
  • Аккумуляторные батарейки — 3-5 лет (у меня часто дохнут).
  • Процессор — 10-20 лет при большой нагрузке. Устареет раньше чем сгорит.
  • GPU — 10 лет. Устареет раньше чем сгорит. При майнинге 2-3 года.
  • Материнская плата — 5-7 лет.
  • Оперативная память — долго. Некоторые производители дают пожизненную гарантию на оперативную память. Однако, для России пожизненная гарантия определяется периодом в 10 лет, не слишком "пожизненно". Ну и чек сохраняйте. Устареет раньше чем сгорит.
  • Корпус — здесь могут выйти из строя дисковые корзины и дополнительные платы. Точно срок не обнаружил, но думаю, что 5-7 лет.

Человеческий фактор

Работать с серверами должен человек, который понимает что он делает. Требуется высшее техническое образование и знание слов: заземление, статическое электричество, сопромат, физика, электрика, квантово-волновой дуализм, пиво.

Не забывайте про информационную безопасность.

Вместо заключения

Самое главное при продлении срока службы сервера помнить, что сервер всё равно сломается. На этот случай вам в помощь:

  • Виртуализация. Для переноса сервисов без остановки сервера.
  • Резервное копирование. Для восстановления данных.
  • Автоматизация. Чтобы поменьше бегать.
  • Мониторинг. Чтобы раньше всех узнать о сдохшем сервере.
  • Планирование. Для закупок и своевременной замене серверного оборудования.
  • И прочие Правила сисадмина.

Теги

 

Похожие материалы

Замена батарейки в HP Proliant DL360 Gen9

Не знаю почему, но батарейки в серверах HP Proliant DL360 Gen9 дохнут одна за одной, уже с десяток заменили. Возможно, партия такая была, не берусь судить. Новые батарейки пока работают без проблем. Вашему вниманию предлагается мини-инструкция по замене батарейки.

Теги

HP Proliant DL 120 Gen9 — установка платы Mellanox

Устанавливаем 10 GB плату Mellanox ConnectX-4 LX CX4121A в сервер HP Proliant DL 120 Gen9. На плате два порта SFP+, интерфейс PCIe3.0 x8. В комплекте к плате идёт низкопрофильная планка, она нам не понадобится, т.к. в сервереHP Proliant DL 120 Gen9 есть свободный полнопрофильный PCI слот.