Перейти к основному содержанию

Правила сисадмина

Системный администратор

Набор правил или примет системного администратора, которые помогут начинающим сисадминам в их труде. Кто-то познаёт дзен самостоятельно, а кому-то поможет одно из правил ниже.

Люди делают глупости

Юзеры тупые, начальство — идиоты, админ сам дурак.

Человеческий фактор — одна из основных причин сбоев в работе. Я не туда нажала, он не тот сервер перезагрузил, ты не тот провод выдернул, мы забыли продлить лицензии, а они не оплатили картридж для принтера. Итог один — ой!

Бороться с этим можно несколькими способами:

  • Лишаем прав. Отбираем права у всех, потом выдаём понемногу, когда эти права действительно нужны.
  • Проводим обучение. Капаем на мозги начальству и HR, чтобы организовали обучение сотрудников. Или организуем сами. Можно даже письма рассылать с памятками. Например: "Юзер, помни! Не заблокировал комп — получил леща!"
  • Удаляем лишние программы с рабочих компьютеров.
  • Не выкладываем релизы перед выходными, праздниками и в мораторий.
  • Резервируем, документируем, автоматизируем, стандартизируем, мониторим. Об этом ниже.

Правило пяти минут

Если у кого-то что-то не работает, то нужно пойти попить чай. В большинстве случаев проблема решается без вас. Очень помогает в этом случае система заявок. Примите заявку, позвоните через пять минут уточнить, нужна ли ещё помощь.

Если случилась крупная авария, то чай тем более не помешает, а пять минут может растянуться на несколько часов. Сначала думай, а потом делай.

Если у вас какой-то новый проект, то месяц планирования сэкономит год. Чая понадобится много. Зато не придётся потом переделывать заново.

Ломается всё

Всё что имеет движущиеся части — ломается. Жёсткие диски, принтеры, вентиляторы, всё это имеет свой срок службы, это расходники, планируйте замену заранее.

Всё что работает на электричестве — ломается. Оперативная память, процессоры, материнские платы, SSD, блоки питания, всё это имеет свойство гореть, плавиться, взрываться, выходить из строя.

Всё что не имеет движущихся частей и не работает на электричестве — ломается. Оборудование и материальные ценности может затопить, унести ветром, пропасть. Его могут украсть, конфисковать, отобрать, потерять, подарить, продать, забыть. Оно может сгореть в пожаре или провалиться в пропасть.

ПО тоже ломается, пароли забываются, даже сотрудники заболевают или уходят в декрет.

А всё что не ломается — можно сломать.

Бороться с этим тоже можно. Не держите яйца в одной корзине, имейте запасные варианты, настраивайте резервирование.

Документация не бывает лишней

Документация нужна для того, чтобы вспомнить забытое, для обучения новых сотрудников. А ещё чтобы не звонить уволившемуся админу и не спрашивать пароль. Часть документации может быть зашифрована или распечатана и спрятана в сейф. Информационную безопасность никто не отменял.

Если документация хранится в базе данных, то она рано или поздно сломается!

Автоматизация победит хаос

Когда серверов становится много, то писать скрипты и автоматизировать рутинные процессы придётся. Лучше начать заранее.

Говорят, что роботы скоро заменят человека. Останутся только инженеры, которые будут проектировать роботов, и админы, которые будут этих роботов эксплуатировать. Со временем роботы сами станут делать новых роботов и заменят инженеров.

Резервная копия должна быть

Есть три вида сисадминов. Первые не делают бэкап, вторые делают бэкап, а третьи проверяют, что бэкап восстанавливается. Как вы думаете, кто крепче спит по ночам?

Резервная копия помогает не только восстановить данные, но и получить срез данных за прошедший промежуток времени без остановки системы.

Вовремя сделанный перед обновлением снапшот экономит время и нервы.

Стандартизация избавит от лишнего ПО

У меня был случай, когда в одной компании работали одновременно несколько систем, которые выполняли одни и те же функции:

  • Itilium
  • Redmine
  • Jira
  • Bugzilla
  • Ещё что-то, даже не помню что

Решение о закупке принималось без участия системного администратора, а повесили все системы на отдел эксплуатации. В итоге не осталось ни одной.

Мониторинг — глаза и уши админа

И персональный будильник тоже. Не забываем про логирование, логи — тоже мониторинг.

Бесплатного сыра не бывает

Железо, которое стоит дёшево, ненадёжно. Нужно искать компромисс между ценой и качеством.

Технику нужно менять

Парк техники нужно обновлять раз в пять лет. Или хотя бы в семь. Кто не поменяет, тот останется у разбитого корыта. Есть и обратная сторона, для некоторых задач можно купить БУ сервер предыдущих поколений, иногда это экономически выгодно.

Не все обновления одинаково полезны

Информационная безопасность говорит: "Накатывайте обновления, закрывайте дыры!" А я вам говорю, что не стоит спешить. Нельзя бездумно всё обновлять, есть большой шанс, что после обновления что-то не заработает. Имейте возможность откатить изменения. Обновите сначала часть инфраструктуры и убедитесь, что всё неделю отработает без сбоев. На откат изменений может уйти больше времени, чем на само обновление. Естественное, критические обновления никто не отменял, здесь проверочная неделя сокращается.

Теги

 

Похожие материалы

Zabbix шаблон для мониторинга сервера Supermicro X10DRi

Делюсь полезным шаблоном для мониторинга сервера Supermicro X10DRi.  Если быть более точным, то у сервера нет имени, у него материнка X10DRi-T и корпус 4 юнита. Только что собрал. В шаблоне 5 приложений, 53 элемента данных, 39 триггеров и 5 графиков. Мониторим по IPMI. 

CacheVault CVPM02 для контроллера MegaRAID SAS 9380-8i8e

Устанавливаем батарейки для контроллеров MegaRAID SAS 9380-8i8e. Модуль покупается дополнительно: Батарейка. Продукт: CacheVault CVPM02. PN: 05-50038-00. В коробке: CacheVault Power Module (CVPM02) with 10” and 24” remote cable extender.