Набор правил или примет системного администратора, которые помогут начинающим сисадминам в их труде. Кто-то познаёт дзен самостоятельно, а кому-то поможет одно из правил ниже.
Люди делают глупости
Юзеры тупые, начальство — идиоты, админ сам дурак.
Человеческий фактор — одна из основных причин сбоев в работе. Я не туда нажала, он не тот сервер перезагрузил, ты не тот провод выдернул, мы забыли продлить лицензии, а они не оплатили картридж для принтера. Итог один — ой!
Бороться с этим можно несколькими способами:
- Лишаем прав. Отбираем права у всех, потом выдаём понемногу, когда эти права действительно нужны.
- Проводим обучение. Капаем на мозги начальству и HR, чтобы организовали обучение сотрудников. Или организуем сами. Можно даже письма рассылать с памятками. Например: "Юзер, помни! Не заблокировал комп — получил леща!"
- Удаляем лишние программы с рабочих компьютеров.
- Не выкладываем релизы перед выходными, праздниками и в мораторий.
- Резервируем, документируем, автоматизируем, стандартизируем, мониторим. Об этом ниже.
Правило пяти минут
Если у кого-то что-то не работает, то нужно пойти попить чай. В большинстве случаев проблема решается без вас. Очень помогает в этом случае система заявок. Примите заявку, позвоните через пять минут уточнить, нужна ли ещё помощь.
Если случилась крупная авария, то чай тем более не помешает, а пять минут может растянуться на несколько часов. Сначала думай, а потом делай.
Если у вас какой-то новый проект, то месяц планирования сэкономит год. Чая понадобится много. Зато не придётся потом переделывать заново.
Ломается всё
Всё что имеет движущиеся части — ломается. Жёсткие диски, принтеры, вентиляторы, всё это имеет свой срок службы, это расходники, планируйте замену заранее.
Всё что работает на электричестве — ломается. Оперативная память, процессоры, материнские платы, SSD, блоки питания, всё это имеет свойство гореть, плавиться, взрываться, выходить из строя.
Всё что не имеет движущихся частей и не работает на электричестве — ломается. Оборудование и материальные ценности может затопить, унести ветром, пропасть. Его могут украсть, конфисковать, отобрать, потерять, подарить, продать, забыть. Оно может сгореть в пожаре или провалиться в пропасть.
ПО тоже ломается, пароли забываются, даже сотрудники заболевают или уходят в декрет.
А всё что не ломается — можно сломать.
Бороться с этим тоже можно. Не держите яйца в одной корзине, имейте запасные варианты, настраивайте резервирование.
Документация не бывает лишней
Документация нужна для того, чтобы вспомнить забытое, для обучения новых сотрудников. А ещё чтобы не звонить уволившемуся админу и не спрашивать пароль. Часть документации может быть зашифрована или распечатана и спрятана в сейф. Информационную безопасность никто не отменял.
Если документация хранится в базе данных, то она рано или поздно сломается!
Автоматизация победит хаос
Когда серверов становится много, то писать скрипты и автоматизировать рутинные процессы придётся. Лучше начать заранее.
Говорят, что роботы скоро заменят человека. Останутся только инженеры, которые будут проектировать роботов, и админы, которые будут этих роботов эксплуатировать. Со временем роботы сами станут делать новых роботов и заменят инженеров.
Резервная копия должна быть
Есть три вида сисадминов. Первые не делают бэкап, вторые делают бэкап, а третьи проверяют, что бэкап восстанавливается. Как вы думаете, кто крепче спит по ночам?
Резервная копия помогает не только восстановить данные, но и получить срез данных за прошедший промежуток времени без остановки системы.
Вовремя сделанный перед обновлением снапшот экономит время и нервы.
Стандартизация избавит от лишнего ПО
У меня был случай, когда в одной компании работали одновременно несколько систем, которые выполняли одни и те же функции:
- Itilium
- Redmine
- Jira
- Bugzilla
- Ещё что-то, даже не помню что
Решение о закупке принималось без участия системного администратора, а повесили все системы на отдел эксплуатации. В итоге не осталось ни одной.
Мониторинг — глаза и уши админа
И персональный будильник тоже. Не забываем про логирование, логи — тоже мониторинг.
Бесплатного сыра не бывает
Железо, которое стоит дёшево, ненадёжно. Нужно искать компромисс между ценой и качеством.
Технику нужно менять
Парк техники нужно обновлять раз в пять лет. Или хотя бы в семь. Кто не поменяет, тот останется у разбитого корыта. Есть и обратная сторона, для некоторых задач можно купить БУ сервер предыдущих поколений, иногда это экономически выгодно.
Не все обновления одинаково полезны
Информационная безопасность говорит: "Накатывайте обновления, закрывайте дыры!" А я вам говорю, что не стоит спешить. Нельзя бездумно всё обновлять, есть большой шанс, что после обновления что-то не заработает. Имейте возможность откатить изменения. Обновите сначала часть инфраструктуры и убедитесь, что всё неделю отработает без сбоев. На откат изменений может уйти больше времени, чем на само обновление. Естественное, критические обновления никто не отменял, здесь проверочная неделя сокращается.