Для тех кто торопится:
Срок службы сервера — 5 лет.
Классификация основных средств, утвержденной постановлением Правительства РФ от 01.01.2002 № 1 относит серверы к электронно-вычислительной технике, 2-я амортизационная группа. Значит, срок полезного использования сервера можно установить в пределах от 2 лет и одного месяца до 3 лет.
Но мы не бухгалтеры, а сисадмины. Даже если сервер спишут, он всё равно останется в стойке. Реальный срок эксплуатации больше.
Через пять лет поддержка серверов прекращается, комплектующие достать сложно. Сервер ещё может продолжать работать, у кого-то железки продолжают трудиться и через 15 лет. Появляются новые стандарты и технологии. Требования бизнеса к сервисам возрастают, требования сервисов к железу возрастают. Железо стареет, электроника увядает. Даже если сервер держится молодцом, некоторые его компоненты могут выходить из строя.
Как продлить срок службы сервера?
Даже не так, не продлить срок службы, а уменьшить вероятность поломки и обеспечить непрерывность работы сервисов. Да и частоту своих поездок в ЦОД снизить.
Микроклимат
В первую очередь следует обратить внимание на параметры окружающей среды, на микроклимат в помещении. Сервер может располагаться в серверной, находиться в ЦОД (Центр Обработки Данных), или стоять под столом.
Требования к микроклимату по российским СН 512-78 (п.3):
- Температура воздуха 18 - 20°С. Не более 25°С, не менее 14 °С.
- Относительная влажность воздуха 20 - 70%. Не более 75% в холодный период, не более 65% в теплый период (для 25°С), не более 70% для температуры от 24°С и ниже.
- Оптимальная скорость потока воздуха 0,2 м/с. Не более 0,3 м/с для холодного, 0,5 м/с для теплого периодов.
- Запыленность воздуха в серверной не должна превышать 0,75 мг/м³, с размерами частиц не более 3 мкм. в помещениях обработки данных 2 мг/м³.
Требования к микроклимату по американскому стандарту TIA 942 (п.5.3.5.):
- Температура воздуха по сухому термометру 20 - 25°С. Не более 25°С.
- Точка нормальной настройки 22°С.
- Контрольный диапазон изменений ±1°С.
- Относительная влажность воздуха 40 - 50%.
- Точка росы не более 21°С.
- Скорость изменения температуры не более 5°С в час.
Электропитание
Я бы ещё к микроклимату добавил требования к стабильной работе электросети. Частые отключения электричества могут плохо сказаться на здоровье сервера. У меня есть один такой кандидат, он стоит в помещении, в котором постоянно отключают свет. После очередного отключения серверу стало плохо (уже на программном уровне). Срочно закупили источник бесперебойного питания и настроили штатное завершение работы операционной системы при длительном отключении электричества.
ИБП (UPS) Legrand KEOR Multiplug 800VA — выключение и включение сервера
Блоки питания сервера часто выходят из строя. На такой случай лучше выбирать сервер с возможностью горячей замены БП (hot plug) и резервированием. При выходе из строя одного из блоков питания сервер продолжает работать, сервисы доступны. Не выключая сервер можно извлечь блок питания и заменить на новый, по гарантии или за деньги — это уже другой вопрос.
Наличие двух и более блоков питания также позволяет запитать сервер по двум отдельным лучам электроснабжения. Если на одном луче питание отключается, то второй луч нас спасает.
Если два луча питания есть, а блок питания один, то позаботьтесь о резервировании сервера или используйте устройство типа ATS (Automatic Transfer Switch — устройство автоматического включения резерва):
APC Rack ATS AP7723 — стоечный автоматический переключатель нагрузки
Такая штука позволить запитать один блок питания от двух лучей. Дорого, но надёжно.
Нагрузка
Что выйдет из строя раньше: сервер с 10% загрузки или 100%? Явно тот, что нагружен сильнее. С другой стороны зачем вообще покупать сервер, если его не нагружать?
Соблюдаем баланс, практика показывает, что оборудование должно быть нагружено на 80%. Есть исключения из этого правила, когда дополнительная загрузка приносит доход больше, чем стоимость сдохших серверов. Обычно это какие-нибудь кластеры производительного железа, задача которых — считать. Такие сервисы обычно без проблем выдерживают потерю нескольких нод.
Горячая замена — hot plug
Используйте сервер с возможностью горячей замены компонентов. Менять можно диски, блоки питания, вентиляторы (вентиляторы ни разу не менял). Подозреваю, что вентиляторы могут выходить из строя в условиях повышенной запылённости. На этот случай обеспечьте возможность доступа к внутренним компонентам сервера (возможность выдвижения) без выключения самого сервера с помощью специальных приспособлений — рукавов.
RAID
Не забывайте использовать RAID-контроллеры для организации массивов высокой доступности. Это позволит сменить сбойный диск без остановки сервисов и потери данных.
На случай отключения питания используйте дополнительный кэш RAID-контроллера с питанием от батарейки. Батарейку нужно чаще менять, но купирование рисков потери данных в критичных сервисах важнее.
ЗИП — Запасные части, Инструменты и Принадлежности
На случай выхода из строя компонентов нужно иметь запчасти. Срок службы жёстких дисков, твердотельных накопителей, блоков питания и прочего железного барахла ограничен.
- Cрок работы жесткого диска 3-5 лет. HDD служат дольше чем SSD.
- Блоки питания — 3-5 лет.
- Аккумуляторные батарейки — 3-5 лет (у меня часто дохнут).
- Процессор — 10-20 лет при большой нагрузке. Устареет раньше чем сгорит.
- GPU — 10 лет. Устареет раньше чем сгорит. При майнинге 2-3 года.
- Материнская плата — 5-7 лет.
- Оперативная память — долго. Некоторые производители дают пожизненную гарантию на оперативную память. Однако, для России пожизненная гарантия определяется периодом в 10 лет, не слишком "пожизненно". Ну и чек сохраняйте. Устареет раньше чем сгорит.
- Корпус — здесь могут выйти из строя дисковые корзины и дополнительные платы. Точно срок не обнаружил, но думаю, что 5-7 лет.
Человеческий фактор
Работать с серверами должен человек, который понимает что он делает. Требуется высшее техническое образование и знание слов: заземление, статическое электричество, сопромат, физика, электрика, квантово-волновой дуализм, пиво.
Не забывайте про информационную безопасность.
Вместо заключения
Самое главное при продлении срока службы сервера помнить, что сервер всё равно сломается. На этот случай вам в помощь:
- Виртуализация. Для переноса сервисов без остановки сервера.
- Резервное копирование. Для восстановления данных.
- Автоматизация. Чтобы поменьше бегать.
- Мониторинг. Чтобы раньше всех узнать о сдохшем сервере.
- Планирование. Для закупок и своевременной замене серверного оборудования.
- И прочие Правила сисадмина.