Перейти к основному содержанию

Правила сисадмина

Системный администратор

Набор правил или примет системного администратора, которые помогут начинающим сисадминам в их труде. Кто-то познаёт дзен самостоятельно, а кому-то поможет одно из правил ниже.

Люди делают глупости

Юзеры тупые, начальство — идиоты, админ сам дурак.

Человеческий фактор — одна из основных причин сбоев в работе. Я не туда нажала, он не тот сервер перезагрузил, ты не тот провод выдернул, мы забыли продлить лицензии, а они не оплатили картридж для принтера. Итог один — ой!

Бороться с этим можно несколькими способами:

  • Лишаем прав. Отбираем права у всех, потом выдаём понемногу, когда эти права действительно нужны.
  • Проводим обучение. Капаем на мозги начальству и HR, чтобы организовали обучение сотрудников. Или организуем сами. Можно даже письма рассылать с памятками. Например: "Юзер, помни! Не заблокировал комп — получил леща!"
  • Удаляем лишние программы с рабочих компьютеров.
  • Не выкладываем релизы перед выходными, праздниками и в мораторий.
  • Резервируем, документируем, автоматизируем, стандартизируем, мониторим. Об этом ниже.

Правило пяти минут

Если у кого-то что-то не работает, то нужно пойти попить чай. В большинстве случаев проблема решается без вас. Очень помогает в этом случае система заявок. Примите заявку, позвоните через пять минут уточнить, нужна ли ещё помощь.

Если случилась крупная авария, то чай тем более не помешает, а пять минут может растянуться на несколько часов. Сначала думай, а потом делай.

Если у вас какой-то новый проект, то месяц планирования сэкономит год. Чая понадобится много. Зато не придётся потом переделывать заново.

Ломается всё

Всё что имеет движущиеся части — ломается. Жёсткие диски, принтеры, вентиляторы, всё это имеет свой срок службы, это расходники, планируйте замену заранее.

Всё что работает на электричестве — ломается. Оперативная память, процессоры, материнские платы, SSD, блоки питания, всё это имеет свойство гореть, плавиться, взрываться, выходить из строя.

Всё что не имеет движущихся частей и не работает на электричестве — ломается. Оборудование и материальные ценности может затопить, унести ветром, пропасть. Его могут украсть, конфисковать, отобрать, потерять, подарить, продать, забыть. Оно может сгореть в пожаре или провалиться в пропасть.

ПО тоже ломается, пароли забываются, даже сотрудники заболевают или уходят в декрет.

А всё что не ломается — можно сломать.

Бороться с этим тоже можно. Не держите яйца в одной корзине, имейте запасные варианты, настраивайте резервирование.

Документация не бывает лишней

Документация нужна для того, чтобы вспомнить забытое, для обучения новых сотрудников. А ещё чтобы не звонить уволившемуся админу и не спрашивать пароль. Часть документации может быть зашифрована или распечатана и спрятана в сейф. Информационную безопасность никто не отменял.

Если документация хранится в базе данных, то она рано или поздно сломается!

Автоматизация победит хаос

Когда серверов становится много, то писать скрипты и автоматизировать рутинные процессы придётся. Лучше начать заранее.

Говорят, что роботы скоро заменят человека. Останутся только инженеры, которые будут проектировать роботов, и админы, которые будут этих роботов эксплуатировать. Со временем роботы сами станут делать новых роботов и заменят инженеров.

Резервная копия должна быть

Есть три вида сисадминов. Первые не делают бэкап, вторые делают бэкап, а третьи проверяют, что бэкап восстанавливается. Как вы думаете, кто крепче спит по ночам?

Резервная копия помогает не только восстановить данные, но и получить срез данных за прошедший промежуток времени без остановки системы.

Вовремя сделанный перед обновлением снапшот экономит время и нервы.

Стандартизация избавит от лишнего ПО

У меня был случай, когда в одной компании работали одновременно несколько систем, которые выполняли одни и те же функции:

  • Itilium
  • Redmine
  • Jira
  • Bugzilla
  • Ещё что-то, даже не помню что

Решение о закупке принималось без участия системного администратора, а повесили все системы на отдел эксплуатации. В итоге не осталось ни одной.

Мониторинг — глаза и уши админа

И персональный будильник тоже. Не забываем про логирование, логи — тоже мониторинг.

Бесплатного сыра не бывает

Железо, которое стоит дёшево, ненадёжно. Нужно искать компромисс между ценой и качеством.

Технику нужно менять

Парк техники нужно обновлять раз в пять лет. Или хотя бы в семь. Кто не поменяет, тот останется у разбитого корыта. Есть и обратная сторона, для некоторых задач можно купить БУ сервер предыдущих поколений, иногда это экономически выгодно.

Не все обновления одинаково полезны

Информационная безопасность говорит: "Накатывайте обновления, закрывайте дыры!" А я вам говорю, что не стоит спешить. Нельзя бездумно всё обновлять, есть большой шанс, что после обновления что-то не заработает. Имейте возможность откатить изменения. Обновите сначала часть инфраструктуры и убедитесь, что всё неделю отработает без сбоев. На откат изменений может уйти больше времени, чем на само обновление. Естественное, критические обновления никто не отменял, здесь проверочная неделя сокращается.

Теги

 

Похожие материалы

MSSQL — ошибка при восстановлении лога транзакций

Пытаюсь настроить зеркало, снимаю полный бэкап и бэкап лога. Затем пытаюсь восстановить базу на зеркале. Бэкап bak нормально восстанавливается, а бэкап trn не восстанавливается с ошибкой: The log in this backup set terminates at LSN 26204000001366300001, which is too early to apply to the database. A more recent log backup that includes LSN 26204000001367500001 can be restored.

Теги

HPE Proliant DL580 Gen10 — описание и фото

HPE ProLiant DL580 Gen10 — это легко расширяемый четырёхпроцессорный сервер в корпусе высотой 4U с высокой производительностью, масштабируемостью. Процессоры Intel Xeon Scalable. Этот сервер предоставляет до 6 Тб памяти с быстродействием 2666 млн транзакций в секунду и до 16 слотов PCIe 3.0, а также обеспечивает простое автоматизированное управление благодаря HPE OneView и HPE iLO 5. Сервер HPE ProLiant DL580 Gen10 идеально подходит для выполнения важных бизнес-задач и запуска приложений, интенсивно работающих с данными и рассчитанных на четырехпроцессорные системы. Эти серверы подходят для сред, где критическим требованием является приемлемый уровень производительности.