После сбоя на кластере vCenter HA столкнулся с проблемой. Резервное копирование vCenter сломалось. Служба VMware Postgres Archiver не хочет запускаться. При попытке запуска службы из командной строки ошибка:
service-control --start vmware-postgres-archiver
An error occurred while starting service 'vmware-postgres-archiver'
Ошибка не очень информативная, нужно смотреть логи.
cd /var/log/vmware/vpostgres/
cat pg_archiver.log-0.stderr
ERROR pg_archiver unexpected termination of replication stream: ERROR: requested WAL segment 000000040000035700000048 has already been removed
Postgres Archiver не может прочитать WAL лог, поскольку его уже нет. Шустрее надо читать. Посмотрим что там с архивами.
cd /storage/archive/vpostgres/
ls -Fla
Видим, что 12 октября (а сейчас уже 17-е) что-то сломалось и служба не может закончить архивировать WAL лог. Архив 000000040000035700000048.gz.partial остался незаконченным. И тут всё сломалось, служба не знает что делать. Пока не пнёшь — не полетит.
Что делать? Похожий вопрос нашёл на форуме:
Кластер vCenter HA у меня уже разобран, так что эти архивы пока не особо нужны. Что-делать: да ничего тут не сделаешь. Будем чистить. Останавливаем службы:
service-control --stop vmware-postgres-archiver vmware-vpostgres
И чистим содержимое /storage/archive/vpostgres/.
Папка пуста. Запускаем службы:
service-control --start vmware-postgres-archiver vmware-vpostgres
Теперь всё запустилось.
cd /storage/archive/vpostgres/
ls -Fla