Перейти к основному содержанию

Правила сисадмина

Системный администратор

Набор правил или примет системного администратора, которые помогут начинающим сисадминам в их труде. Кто-то познаёт дзен самостоятельно, а кому-то поможет одно из правил ниже.

Люди делают глупости

Юзеры тупые, начальство — идиоты, админ сам дурак.

Человеческий фактор — одна из основных причин сбоев в работе. Я не туда нажала, он не тот сервер перезагрузил, ты не тот провод выдернул, мы забыли продлить лицензии, а они не оплатили картридж для принтера. Итог один — ой!

Бороться с этим можно несколькими способами:

  • Лишаем прав. Отбираем права у всех, потом выдаём понемногу, когда эти права действительно нужны.
  • Проводим обучение. Капаем на мозги начальству и HR, чтобы организовали обучение сотрудников. Или организуем сами. Можно даже письма рассылать с памятками. Например: "Юзер, помни! Не заблокировал комп — получил леща!"
  • Удаляем лишние программы с рабочих компьютеров.
  • Не выкладываем релизы перед выходными, праздниками и в мораторий.
  • Резервируем, документируем, автоматизируем, стандартизируем, мониторим. Об этом ниже.

Правило пяти минут

Если у кого-то что-то не работает, то нужно пойти попить чай. В большинстве случаев проблема решается без вас. Очень помогает в этом случае система заявок. Примите заявку, позвоните через пять минут уточнить, нужна ли ещё помощь.

Если случилась крупная авария, то чай тем более не помешает, а пять минут может растянуться на несколько часов. Сначала думай, а потом делай.

Если у вас какой-то новый проект, то месяц планирования сэкономит год. Чая понадобится много. Зато не придётся потом переделывать заново.

Ломается всё

Всё что имеет движущиеся части — ломается. Жёсткие диски, принтеры, вентиляторы, всё это имеет свой срок службы, это расходники, планируйте замену заранее.

Всё что работает на электричестве — ломается. Оперативная память, процессоры, материнские платы, SSD, блоки питания, всё это имеет свойство гореть, плавиться, взрываться, выходить из строя.

Всё что не имеет движущихся частей и не работает на электричестве — ломается. Оборудование и материальные ценности может затопить, унести ветром, пропасть. Его могут украсть, конфисковать, отобрать, потерять, подарить, продать, забыть. Оно может сгореть в пожаре или провалиться в пропасть.

ПО тоже ломается, пароли забываются, даже сотрудники заболевают или уходят в декрет.

А всё что не ломается — можно сломать.

Бороться с этим тоже можно. Не держите яйца в одной корзине, имейте запасные варианты, настраивайте резервирование.

Документация не бывает лишней

Документация нужна для того, чтобы вспомнить забытое, для обучения новых сотрудников. А ещё чтобы не звонить уволившемуся админу и не спрашивать пароль. Часть документации может быть зашифрована или распечатана и спрятана в сейф. Информационную безопасность никто не отменял.

Если документация хранится в базе данных, то она рано или поздно сломается!

Автоматизация победит хаос

Когда серверов становится много, то писать скрипты и автоматизировать рутинные процессы придётся. Лучше начать заранее.

Говорят, что роботы скоро заменят человека. Останутся только инженеры, которые будут проектировать роботов, и админы, которые будут этих роботов эксплуатировать. Со временем роботы сами станут делать новых роботов и заменят инженеров.

Резервная копия должна быть

Есть три вида сисадминов. Первые не делают бэкап, вторые делают бэкап, а третьи проверяют, что бэкап восстанавливается. Как вы думаете, кто крепче спит по ночам?

Резервная копия помогает не только восстановить данные, но и получить срез данных за прошедший промежуток времени без остановки системы.

Вовремя сделанный перед обновлением снапшот экономит время и нервы.

Стандартизация избавит от лишнего ПО

У меня был случай, когда в одной компании работали одновременно несколько систем, которые выполняли одни и те же функции:

  • Itilium
  • Redmine
  • Jira
  • Bugzilla
  • Ещё что-то, даже не помню что

Решение о закупке принималось без участия системного администратора, а повесили все системы на отдел эксплуатации. В итоге не осталось ни одной.

Мониторинг — глаза и уши админа

И персональный будильник тоже. Не забываем про логирование, логи — тоже мониторинг.

Бесплатного сыра не бывает

Железо, которое стоит дёшево, ненадёжно. Нужно искать компромисс между ценой и качеством.

Технику нужно менять

Парк техники нужно обновлять раз в пять лет. Или хотя бы в семь. Кто не поменяет, тот останется у разбитого корыта. Есть и обратная сторона, для некоторых задач можно купить БУ сервер предыдущих поколений, иногда это экономически выгодно.

Не все обновления одинаково полезны

Информационная безопасность говорит: "Накатывайте обновления, закрывайте дыры!" А я вам говорю, что не стоит спешить. Нельзя бездумно всё обновлять, есть большой шанс, что после обновления что-то не заработает. Имейте возможность откатить изменения. Обновите сначала часть инфраструктуры и убедитесь, что всё неделю отработает без сбоев. На откат изменений может уйти больше времени, чем на само обновление. Естественное, критические обновления никто не отменял, здесь проверочная неделя сокращается.

Теги

 

Похожие материалы

Тестируем 10G SFP+ платы HP и Mellanox на серверах HP Proliant DL360 Gen9

Задача - проверить пропускную способность 10G сети между виртуальными машинами на разных гипервизорах.