суббота, 22 ноября 2008 г.

VMware Distributed Power Management

Пару недель назад, блогосферу, связанную с темой виртуализации, облетел видеоролик, где наглядно показывается работа DPM [Distributed Power Management]. Конечно, всё это хорошо и, вроде бы, в VMware VI4 эта функция перестанет быть экспериментальной, но... Есть одно маленькое НО. Готовы ли производители железа поддерживать эту функцию? Поясню на примере. В позапрошлый четверг, один из наших DBA делал какой-то maintenance на SQL на одном из production серверов. Maintenance был запланированным и все соответствующие службы оповещены. В конце работы потребовалось сделать reboot. Сделали. И сервер умер. Вернее умер RAID-контроллер на нём. А SQL этот, часть очень важной системы в нашем банке. Не спрашивайте меня, почему, если это такой важный сервер, он не стоял на кластере - не мой дизайн и не моя имплементация. Суть в том, что пока вызвали техника, пока он поменял контроллер, а замена затянулась на несколько часов из-за его [техника] криворукости и вылилась в то, что сервер нужно было восстанавливать с backup'а, прошло очень много времени. По этому поводу, у нас была проведена небольшая планёрка. Главной темой там был вопрос о том, как избежать подобных ситуаций. И там же мы говорили о том, что большинство железячных проблем происходит либо во время reboot'ов, либо из-за них. Теперь вернёмся к DPM. Эта функция предполагает ежедневное выключение и включение серверов. А теперь представьте себе во сколько раз возрастёт количество поломок. Нет, я ни в коем случае не берусь утверждать, что каждое выключение/включение приведёт к появлению новой неисправности, но я уверен, что их количество увеличится в разы. В связи с этим, применение функции DPM в производственных средах, на сегодняшний день, мне кажется сомнительным.

1 комментарий:

  1. ИМХО наоборот -
    при частых ребутах можно избежать проблем "неизвестно когда установленными" патчами и дравйверами, а также стандартные части привыкают хранить на сайте "на всякий случай",
    а вообще чем реже ребут - тем устойчивей система :-))))

    ОтветитьУдалить