Перейти к основному содержанию

Правила сисадмина

Системный администратор

Набор правил или примет системного администратора, которые помогут начинающим сисадминам в их труде. Кто-то познаёт дзен самостоятельно, а кому-то поможет одно из правил ниже.

Люди делают глупости

Юзеры тупые, начальство — идиоты, админ сам дурак.

Человеческий фактор — одна из основных причин сбоев в работе. Я не туда нажала, он не тот сервер перезагрузил, ты не тот провод выдернул, мы забыли продлить лицензии, а они не оплатили картридж для принтера. Итог один — ой!

Бороться с этим можно несколькими способами:

  • Лишаем прав. Отбираем права у всех, потом выдаём понемногу, когда эти права действительно нужны.
  • Проводим обучение. Капаем на мозги начальству и HR, чтобы организовали обучение сотрудников. Или организуем сами. Можно даже письма рассылать с памятками. Например: "Юзер, помни! Не заблокировал комп — получил леща!"
  • Удаляем лишние программы с рабочих компьютеров.
  • Не выкладываем релизы перед выходными, праздниками и в мораторий.
  • Резервируем, документируем, автоматизируем, стандартизируем, мониторим. Об этом ниже.

Правило пяти минут

Если у кого-то что-то не работает, то нужно пойти попить чай. В большинстве случаев проблема решается без вас. Очень помогает в этом случае система заявок. Примите заявку, позвоните через пять минут уточнить, нужна ли ещё помощь.

Если случилась крупная авария, то чай тем более не помешает, а пять минут может растянуться на несколько часов. Сначала думай, а потом делай.

Если у вас какой-то новый проект, то месяц планирования сэкономит год. Чая понадобится много. Зато не придётся потом переделывать заново.

Ломается всё

Всё что имеет движущиеся части — ломается. Жёсткие диски, принтеры, вентиляторы, всё это имеет свой срок службы, это расходники, планируйте замену заранее.

Всё что работает на электричестве — ломается. Оперативная память, процессоры, материнские платы, SSD, блоки питания, всё это имеет свойство гореть, плавиться, взрываться, выходить из строя.

Всё что не имеет движущихся частей и не работает на электричестве — ломается. Оборудование и материальные ценности может затопить, унести ветром, пропасть. Его могут украсть, конфисковать, отобрать, потерять, подарить, продать, забыть. Оно может сгореть в пожаре или провалиться в пропасть.

ПО тоже ломается, пароли забываются, даже сотрудники заболевают или уходят в декрет.

А всё что не ломается — можно сломать.

Бороться с этим тоже можно. Не держите яйца в одной корзине, имейте запасные варианты, настраивайте резервирование.

Документация не бывает лишней

Документация нужна для того, чтобы вспомнить забытое, для обучения новых сотрудников. А ещё чтобы не звонить уволившемуся админу и не спрашивать пароль. Часть документации может быть зашифрована или распечатана и спрятана в сейф. Информационную безопасность никто не отменял.

Если документация хранится в базе данных, то она рано или поздно сломается!

Автоматизация победит хаос

Когда серверов становится много, то писать скрипты и автоматизировать рутинные процессы придётся. Лучше начать заранее.

Говорят, что роботы скоро заменят человека. Останутся только инженеры, которые будут проектировать роботов, и админы, которые будут этих роботов эксплуатировать. Со временем роботы сами станут делать новых роботов и заменят инженеров.

Резервная копия должна быть

Есть три вида сисадминов. Первые не делают бэкап, вторые делают бэкап, а третьи проверяют, что бэкап восстанавливается. Как вы думаете, кто крепче спит по ночам?

Резервная копия помогает не только восстановить данные, но и получить срез данных за прошедший промежуток времени без остановки системы.

Вовремя сделанный перед обновлением снапшот экономит время и нервы.

Стандартизация избавит от лишнего ПО

У меня был случай, когда в одной компании работали одновременно несколько систем, которые выполняли одни и те же функции:

  • Itilium
  • Redmine
  • Jira
  • Bugzilla
  • Ещё что-то, даже не помню что

Решение о закупке принималось без участия системного администратора, а повесили все системы на отдел эксплуатации. В итоге не осталось ни одной.

Мониторинг — глаза и уши админа

И персональный будильник тоже. Не забываем про логирование, логи — тоже мониторинг.

Бесплатного сыра не бывает

Железо, которое стоит дёшево, ненадёжно. Нужно искать компромисс между ценой и качеством.

Технику нужно менять

Парк техники нужно обновлять раз в пять лет. Или хотя бы в семь. Кто не поменяет, тот останется у разбитого корыта. Есть и обратная сторона, для некоторых задач можно купить БУ сервер предыдущих поколений, иногда это экономически выгодно.

Не все обновления одинаково полезны

Информационная безопасность говорит: "Накатывайте обновления, закрывайте дыры!" А я вам говорю, что не стоит спешить. Нельзя бездумно всё обновлять, есть большой шанс, что после обновления что-то не заработает. Имейте возможность откатить изменения. Обновите сначала часть инфраструктуры и убедитесь, что всё неделю отработает без сбоев. На откат изменений может уйти больше времени, чем на само обновление. Естественное, критические обновления никто не отменял, здесь проверочная неделя сокращается.

Теги

 

Похожие материалы