Инфраструктурный мониторинг что контролирует

Мониторинг инженерной инфраструктуры в дата-центре. Часть 1. Основные моменты

Статью про устройство мониторинга в дата-центре мы обещали еще в сентябре. Тема обширная, одной статьей тут не отделаться, поэтому решили сделать серию постов. Начнем с базовых моментов, о которых важно помнить при проектировании и настройке мониторинга. Затем подробно остановимся на основных инженерных системах (энергоснабжение и холодоснабжение) и расскажем про инструменты для их мониторинга.

В статьях будем делиться своим опытом, тем, что пробовали и используем сами в собственных дата-центрах. На полноту не претендуем, зато все будет из жизни, а не из учебника.

В комментариях можно попробовать повлиять на редакторскую политику и предложить для рассмотрения интересные именно для вас аспекты мониторинга.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

С организационными моментами вроде разобрались, приступим к азбуке мониторинга в редакции DataLine :). Итак, сегодня речь пойдет о концептуальных вещах, которые нужно учитывать на этапе проектирования, внедрения и настройки системы мониторинга. Сабж рассмотрим на примере нашего мониторинга, построенного на базе Nagios и Cacti.

Что такое мониторинг

В этой серии статей мы будем говорить о “классическом” мониторинге, т.е. без автоматизированного управления.

Мониторинг можно трактовать по-разному: как систему и как процесс. В нашем случае это две стороны одной медали – одно без другого существовать не может.

Мониторинг как система помогает непрерывно собирать, хранить и анализировать параметры оборудования и систем. Он снабжает данными, на основе которых инженер делает выводы о текущем состоянии и о возможном будущем поведении наблюдаемого объекта.

Система мониторинга дает лишь вводную информацию, дальше дело за людьми и процессами. Четкие регламенты в штатных и аварийных ситуациях, выстроенная система уведомления ответственных лиц – все это превращает мониторинг из простого сбора данных в полезный инструмент для управления инфраструктурой.

Когда нужно озадачиться системой мониторинга

Тогда же, когда и начинаете проектировать инженерную инфраструктуру. Если заниматься мониторингом уже после запуска дата-центра, то какое-то время служба эксплуатации будет работать вслепую. Дежурные инженеры не смогут отслеживать ошибки в работе оборудования, пропустят предаварийные ситуации. Единственный доступный способ мониторинга в такой ситуации – это физический обход всех инженерных систем и ИТ-оборудования.

Пример 1: дата-центр запустили в эксплуатацию. Первые месяцы зал был почти пустой и из трех кондиционеров работал только один. С заполнением зала температура в зале выросла. Так как мониторинга нет, то службе эксплуатации будет сложно определить момент, когда включить второй, а в случае аварии – резервный.

Наверстать пробел с мониторингом на этапе эксплуатации будет сложно, а иногда и невозможно без остановок в работе серверной или дата-центра. Например, чтобы установить анализаторы тока в распределительные щиты, придется отключать как минимум один луч. В худшем случае под них может не оказаться места, тогда совершенно новый шкаф нужно будет модернизировать или менять вовсе.

Есть хорошее выражение: невозможно управлять тем, что нельзя измерить. Это как раз про эксплуатацию инженерной инфраструктуры без мониторинга. Продумывайте мониторинг заранее.

За чем нужно следить

Мониторинг инженерной инфраструктуры нужно вести по возможности на трех уровнях: автономные датчики, оборудование и системы в целом.

Под автономными датчиками мы в первую очередь подразумеваем датчики протечек, температурные датчики, датчики объема и движения.

Пример 2: отключился распределительный щит в машинном зале. Если мы мониторим оборудование по отдельности, то понадобится время, чтобы понять источник поломки – щит или ИБП, от которого он питается. Если же у нас перед глазами будет схема всей системы, то мы быстро увидим слабое звено.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует
Схема системы энергоснабжения, показывающая все оборудование в одной цепочке.

Документация по мониторингу

По мере того, как определяемся с объектами и параметрами мониторинга, составляем документацию по системе. В ней фиксируем:

Независимость и резервирование системы мониторинга

Под мониторинг лучше использовать отдельное серверное и сетевое оборудование с выделенным сетевым сегментом.

Серверы должны быть зарезервированы так, чтобы при выходе из строя одного из серверов мониторинг продолжил работать на втором. Совсем хорошо, если серверы кластера разнесены по разным машинным залам. В одном из следующих постов подробно рассмотрим устройство и принцип работы подобного кластера.

Мониторы, на которые выводятся схемы, уведомления, также должны быть подключены к бесперебойному питанию с резервом. По сети также — сетевые розетки подключены к разным коммутаторам. Так дежурные инженеры не останутся наедине потухшими экранами, когда в дата-центре происходит что-то интересное.

Единый центр мониторинга

Всю информацию с датчиков, оборудования и систем нужно сводить в единый интерфейс и выборочно отображать на экранах в центре мониторинга.
За всем этим хозяйством должен следить круглосуточно хотя бы один дежурный инженер. Здесь же все уведомления регистрируются в виде инцидентов на ответственных лиц или отделы.
Это своего рода ЦУП и первый рубеж обороны в случае аварии в дата-центре.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует
Центр мониторинга на площадке OST.

Визуализация

Следить за работой дата-центра только с помощью уведомлений можно, но для наглядности основные инженерные системы и их параметры стоит визуализировать в виде схем и карт.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует
Сводная схема дата-центра OST-2.

Со схемой дежурному инженеру будет легче понять, в каком машинном зале находится сломанный кондиционер, что происходит с температурой в ближайшем холодном коридоре. Кроме того, визуализация дает возможность увидеть взаимосвязь между отдельными элементами инженерной системы и быстрее определить первоисточник проблемы.

Разное время опроса для разных систем

Учитывайте специфику инженерных систем при настройке времени опроса. Для системы энергоснабжения чем чаще будут сниматься показания, тем лучше. Например, в нашем мониторинге значения напряжения снимаются каждую секунду. А для кондиционеров, это слишком часто, достаточно и минутного интервала.

Устанавливайте разное время опроса для разных систем. Так вы не пропустите важных событий и не перегрузите систему слишком частыми запросами.

Правильно выбранные пороговые значения для уведомлений

Прописывайте критические значения, по достижении которых будут срабатывать оповещения. Лучше предусмотреть как минимум два уровня оповещения – предупреждения и критические ошибки. В Nаgios, например, такому разделению соответствуют warning и critical:

При необходимости корректируйте пороговые значения для разных типов уведомлений.

Примеры warning и alarm
Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Все сообщения об авариях должны быть актуальными. Если на экране висит сообщение об аварии, то значит, что она произошла только что. Как только это уведомление зарегистрировано в виде инцидента на ответственное лицо, оно должно пропасть с экрана.

Четкий регламент действий при аварийных ситуациях

Не пропустить аварию важно, но еще важнее правильно на нее среагировать и запустить процесс реакции на инцидент.

У дежурного инженера должна быть четкая инструкция, по которой он действует, и контакты людей, которых нужно оповестить в случае аварийной ситуации.

Вся информация должна быть перед глазами и ясно сформулирована, чтобы инженеру не приходилось тратить время на поиски или расшифровывание пунктов инструкции.

Для удобства дежурных инженеров каждое уведомление можно сопроводить всплывающей подсказкой с контактами ответственного лица и инструкцией. Регламенты же прописываются заранее и проверяются на жизнеспособность во время плановых тестирований.

Не заставляйте дежурного инженера придумывать план действий с нуля, когда в дата-центре авария.

Оповещение по email и смс

Вещь полезная при правильном использовании. Для небольших серверных такие оповещения могу заменить круглосуточного дежурного инженера. В большом дата-центре это своего рода резервирование дежурного инженера. Но и здесь важно не перестараться и не рассылать уведомления ответственным лицам по любому чиху.

Если будет много оповещений по некритичным ошибкам (выше мы называли их warning), то со временем их просто начнут игнорировать, и серьезная авария останется незамеченной.

Сбор статистики

Помимо онлайн-мониторинга, полезно собирать и долгосрочную статистику. Это позволит оценить параметры в динамике, выявить значения, приводящие к аварийным ситуациям. С этой статистикой можно делать выводы по работе оборудования при различной нагрузке, разных погодных условиях. Эта же информация потом используется для разбора полетов после аварий.

Это все моменты, которые мы хотели бы отметить отдельно, прежде чем пускаться в рассказы про мониторинг конкретных инженерных систем. В следующей статье разберем, что и как нужно мониторить в системе энергоснабжения дата-центра и серверной.

Источник

Системы мониторинга ИТ

Магазины, рестораны, аптеки

Госкомпании, органы власти

Это интересно

Мониторинг ИТ систем является составной частью управления информационной инфраструктурой предприятия, заключающейся в постоянном наблюдении и периодическом анализе ИТ объектов с отслеживанием динамики происходящих с ними изменений. Ключевой задачей систем мониторинга ИТ является получение, сохранение и анализ информации о состоянии подконтрольных элементов ИТ структуры компании. Специальная программа позволяет оперативно отреагировать на возникшую проблему в работе ИТ сервисов, а также эффективно предотвращать возникновение неполадок.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Поставщики данной услуги выделяют 2 уровня ИТ мониторинга:

Системы мониторинга ИТ инфраструктуры предназначены для контроля над работоспособностью следующих компонентов: сетевое и серверное оборудование, бизнес ПО. Под контролем программы мониторинга должны находится группы объектов, информация о которых необходима администраторам.

Внедрение комплексной системы мониторинга ИТ помогает предприятию:

Системы мониторинга ИТ сервисов ориентированы в первую очередь на показатели степени доступности, а также качества предоставления сервисов на основе оценки пользователей. В процессе создания системы происходит формирование каталога ИТ сервисов. Определяются показатели доступности и уровня качества каждого сервиса и его зависимость от других компонентов информационной структуры компании. Система проводит мониторинг ИТ компонентов и формирует показатели работы сервисов. Мониторинг ИТ систем полезен системным администраторам, ИТ руководителям и менеджерам ИТ сервисов.

Система мониторинга ИТ сервисов помогает компании:

Комплексные системы мониторинга работоспособности ИТ инфраструктуры

Внедрение автоматизированной системы мониторинга ИТ и контроль работы информационной инфраструктуры способно повысить уровень качества ее функционирования с помощью быстрого выявления и ликвидации сбоев и неполадок, а также предотвращения их возникновения в будущем, в первую очередь, для наиболее критичных для бизнеса компании сервисов.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Специализированные фирмы предлагают полный цикл услуг по созданию и эксплуатации систем мониторинга ИТ, позволяющих эффективно решать следующие вопросы:

Профилированные в данной сфере компании занимаются проектированием, внедрением в эксплуатацию и поддержкой систем ИТ мониторинга. Проведение экспертизы перед началом проекта внедрения поможет правильно выбрать и интегрировать друг с другом необходимые продукты для ведения мониторинга элементов инфраструктуры, что, в свою очередь, позволит в подходящие сроки и наиболее полно выполнить задачи клиентской компании по повышению уровня надежности и качества работы ИТ.

Подходы к созданию комплексной системы мониторинга

В процессе построения системы мониторинга применяют 2 подхода:

Как показывает практика, наибольший эффект достигается при использовании комбинации данных двух подходов.

Построение систем мониторинга от инфраструктуры

Этот подход предусматривает организацию наблюдения за основными аппаратными и программными компонентами с настройкой отдельных консолей для выполнения задач различных администраторов на основе их специализации. Главной целью является помощь ИТ специалистам в оперативном выявлении и ликвидации проблем, появляющихся при функционировании ИТ структуры.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Организация системы мониторинга от ИТ сервисов

Применение данного подхода заключается в формировании каталога услуг и отвечает методологии сервисного подхода к управлению ИТ (ITSM). Предполагается, что для каждого сервиса (услуги) должна быть разработана своя сервисно-ресурсная модель, отражающая взаимодействие между сервисом и другими компонентами инфраструктуры, нужными для его работы. С использованием сервисно-ресурсной модели проводится процедура настройки программы мониторинга с целью контроля функционирования ИТ сервиса и всех связанных с ним компонентов инфраструктуры. Этот подход способствует тому, что системные консоли становятся полезными не только отвечающим за поддержку определенных сервисов ИТ специалистов, но и диспетчерской службе, а также руководству ИТ отдела.

Техническая сторона мониторинга

Для сбора данных о состоянии информационных ресурсов и сервисов применяют специализированное программное обеспечение. Важной задачей становится правильный выбор и интеграция продуктов, лучше всего подходящих для самого полного и качественного выполнения требований клиентской организации к мониторингу ИТ систем и ресурсов.

Что входит в комплексную систему мониторинга

Мониторинг серверов и рабочих станций:

Мониторинг приложений и сервисов:

Внедрение систем мониторинга ИТ

Проект внедрения системы начинается с процесса базовой инсталляции продуктов и заканчивается окончательной их настройкой под нужды конкретного заказчика. Большинство программ поставляются уже в комплекте с готовой настройкой мониторинга определенных типов ресурсов. Это помогает значительно сократить сроки внедрения. Конечно, для того, чтобы проект был реализован в оптимальное время и без ошибок, даже начальная установка программы должна выполняться силами специалистов, обладающих опытом инсталляции, настройки и использования программного продукта.

Интеграция с другими информационными системами (CMDB, HelpDesk и др.) является важным этапом при внедрении системы ИТ мониторинга, которая не может работать изолированно от других. В большинстве случаев становится необходимо обеспечить ее взаимодействие со службой поддержки для регистрации в автоматическом режиме инцидентов, а также с системой инвентаризации ресурсов ИТ.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Техническую поддержку, как правило, осуществляют интеграторы системы в рамках ИТ аутсорсинга. Для клиентской компании это удобно тем, что она может решать все вопросы, связанные с мониторингом его инфраструктуры, в одной точке, что особенно важно при использовании многокомпонентной системы, содержащей программы от различных производителей.

Сопровождение системы мониторинга также часто входит в пакет услуг, предоставляемых интегратором. Даже если система была сдана в эксплуатацию с полной документацией, после проведения внедрения в большинстве случаев требуется определенное время, чтобы системные администраторы, работающие в клиентской компании, смогли научиться ею управлять. Для этого им потребуется перенять опыт у представителей фирмы, занимавшейся конфигурированием системы. Наиболее целесообразным будет воспользоваться помощью специалистов интегратора для тонкой настройки внедренной системы. К тому же услуга сопровождения системы мониторинга, предоставляемая аутсорсинговой компанией, позволит сократить число системных администраторов на предприятии.

Источник

5 лучших бесплатных систем мониторинга ИТ-инфраструктуры

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Бизнес нуждается в системах для мониторинга ИТ-инфраструктуры, чтобы обеспечить запуск и последующую работу необходимых ему сетевых систем и сервисов. Однако осуществление мониторинга различных составных частей ИТ-инфраструктуры может стать для вас настоящей головной болью, если вы не смогли для этих целей выбрать подходящее правильное решение. Независимо от масштабов управляемой вами инфраструктуры, будь она небольшого размера или уровня предприятия, вы в любом случае не сможете обойтись без надежного инструментария для мониторинга. Даже если вы просто владелец персонального сайта, вы все равно нуждаетесь в круглосуточном мониторинге доступности вашего ресурса.

Существует многоженство программных продуктов, как коммерческих, так и бесплатных (с открытым исходным кодом), которые могут помочь вам осуществлять мониторинг вашей ИТ инфраструктуры и уведомлять о любых сбоях. Учитывая большое количество предложений на рынке, не просто найти нужный вам вариант, который впишется в ваш ценовой диапазон. Хорошие новости для многих из нас заключаются в том, что на рынке доступны мощные решения для мониторинга ИТ-инфраструктуры с открытым исходным кодом. Спасибо сообществам разработчиков программного обеспечения с открытым исходным кодом за их работу.

Давайте взглянем на лучшие варианты из доступных на рынке бесплатных систем мониторинга ИТ-инфраструктуры и определим, что подойдет вам.

1. Nagios

Сообщество Nagios (https://www.nagios.org/), ведущее свою историю с 1999 года, является одним из лидеров отрасли в области решений для мониторинга ИТ-инфраструктуры любого масштаба — от малого до корпоративного уровня.

Программное решение для мониторинга компьютерных систем и сетей Nagios способно осуществлять мониторинг практически любых компонентов, включая сетевые протоколы, операционные системы, системные показатели, приложения, службы, веб-сервера, веб-сайты, связующее программное обеспечение (Middleware) и т. д..

Базовая функциональность системы для мониторинга Nagios реализована на ядре Core 4, который обеспечивает высокий уровень производительности за счет меньшего потребления ресурсов сервера.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Вы можете, используя плагин, интегрировать его практически с любым типом стороннего программного обеспечения, причем, скорее всего, этот плагин кто-то уже написал (https://www.nagios.org/projects/nagios-plugins/).

Если вы используете связующее программное обеспечение (Middleware), вы можете использовать Nagios для мониторинга WebLogic, WebSphere, JBoss, Tomcat, Apache, URL, Nginx и т. д..

Краткий перечень доступных возможностей:

2. Zabbix

Система мониторинга служб и состояний компьютерной сети Zabbix (https://www.zabbix.com/) — это великолепное бесплатное программное обеспечение уровня предприятия, предназначенное для осуществления мониторинга всего: от производительности и доступности серверов и сетевого оборудования до веб-приложений и базы данных.

Zabbix используется тысячами компаний по всему миру, включая DELL, Salesforce, ICANN, Orange и т. д.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Zabbix-сервер и Zabbix-агент могут быть установлены на такие платформы, как Linux, AIX, Solaris, MacOS X, FreeBSD, OpenBSD, HP-UX и т. д., кроме того, реализована поддержка агентов для установки на решения на базе операционных систем семейства Windows.

Кроме того, Zabbix поддерживает осуществление мониторинга через SNMP (Simple Network Management Protocol, Простой протокол сетевого управления) и предоставляет лучшую отчетность.

Краткий перечень доступных возможностей:

Если вы хотите больше узнать о том, как использовать Zabbix для крупных организаций, вы можете пройти курс он-лайн обучения от Packt Publishing (https://www.udemy.com/zabbix-network-monitoring-essentials/).

3. Cacti

Приложение для мониторинга сети Cacti (https://www.cacti.net/) — это еще один программный инструмент с открытым исходным кодом для мониторинга сети, который может быть установлен на Linux или Windows. Он собирает различные статистические данные за определенные временные интервалы и позволяет отобразить их в графическом виде при помощи набора утилит RRDTool.

Cacti работает с SNMP и представляет сетевую статистику в виде простых для понимания графиков.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Cacti требуется MySQL, Apache или IIS с поддержкой PHP.

Краткий перечень доступных возможностей:

4. OpenNMS

Высокоуровневая программная платформа для мониторинга сетей и сетевых устройств OpenNMS (https://www.opennms.org/en) позволит вам создать решение сетевого мониторинга для любой ИТ-инфраструктуры промышленного масштаба. Вы можете собирать системные показатели с помощью JMX, WMI, SNMP, NRPE, XML HTTP, JDBC, XML, JSON и т. д.

С помощью OpenNMS вы можете в вашей сети, как обнаруживать связи сетевых топологий на втором уровне модели OSI, так и отслеживать неполадки в маршрутизации на уровне 3. Эта система мониторинга не использует агентов, а построена на событийно-ориентированной архитектуре, а также поддерживает работу в связке с системой агрегации данных и отображения графиков в реальном времени Grafana.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

OpenNMS имеет встроенные модули формирования отчетности, а это означает, что вы можете просматривать отчеты в виде красивых дашбордов (dashboard, аналитических информационных панелей) и диаграмм. В целом, OpenNMS получил прекрасный пользовательский интерфейс.

Вы также можете установить OpenNMS в Docker — программный инструментарий для управления изолированными Linux-контейнерами.

Краткий перечень доступных возможностей:

5. Icinga

Бесплатная программная система для мониторинга компьютерных систем и сетей Icinga (https://icinga.com/) позволит вам осуществлять мониторинг всех доступных систем в вашей сети. Она поддерживает различные способы предупреждений, а также предоставит вам базу данных для ваших отчетов об уровне обслуживания.

Icinga, история которой началась в 2009 году, как ответвление от системы мониторинга Nagios, с выходом Icinga версии 2 смогла полностью освободиться от «оков» ядра Nagios, став быстрее, проще в настройке и значительно лучшее масштабируемой.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Краткий перечень доступных возможностей:

Выводы

Таким образом, если ваш бюджет уперся в серьезные финансовые ограничения, то вышеперечисленное программное обеспечение для сетевого мониторинга все равно сможет помочь вам наладить контроль над различными аспектами вашей ИТ-инфраструктуры. Все эти системы доступны бесплатно, поэтому вы можете загрузить их и начать свое знакомство с ними уже сегодня.

Подписывайтесь на рассылку, делитесь статьями в соцсетях и задавайте вопросы в комментариях!

Источник

Всё под контролем. Зачем нужны системы мониторинга инженерной инфраструктуры центров обработки данных

Я ведущий инженер компании «ЛАНИТ-Интеграция». Работаю здесь больше 20 лет. Последние семь лет занимаюсь инженерным обеспечением ЦОДов: устанавливаю и запускаю оборудование в работу.

С каждым годом появляется всё больше требований к надежности и удобству использования дата-центров. Однако этого нельзя добиться, если сосредоточиться только на резервных копиях систем и качестве отдельных элементов. На рынке понимают эту простую мысль, поэтому компании всё чаще внедряют единую систему мониторинга. Если коротко, она следит за инженерной инфраструктурой ЦОД и помогает избежать аварийных ситуаций.

В статье я расскажу о готовых программно-аппаратных решениях мониторинга, которые мы с коллегами используем в проектах.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Источник

Для начала расскажу о том, из чего состоит основа центра обработки данных. Её разделяют на три составляющих.

Для уверенности, что все системы работают в штатном режиме, нужен постоянный контроль, который и даёт мониторинг.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Мониторинг помогает инженерам, обслуживающим ЦОД, комфортнее работать. Без него специалисты должны либо жить и трудиться всё время рядом со шкафами, либо выходить из кабинета и бежать к ним каждый раз, когда возникла какая-то проблема или есть подозрения, что она может случиться.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Мониторинг в реальном времени показывает, как работает инфраструктура ЦОД. За показателями, как правило, следит дежурная смена. При возникновении отклонения или нештатной ситуации сотрудники дежурной смены могут вовремя предотвратить критическую ситуацию или же свести её последствия к минимуму. Также система мониторинга собирает данные о параметрах, статусе оборудования, следит за сроками сервисного обслуживания, наработанными часами и т.д.

Что именно контролирует система мониторинга и какие задачи решает?

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Защита от людей

К сожалению, статистика говорит, что множество аварийных ситуаций с техникой возникает по вине человека. Именно поэтому мониторинг в том числе следит не только за параметрами, но и за теми, кто имеет доступ к ЦОД и кто/что в нем делает.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Существует множество различных систем, так или иначе позволяющих контролировать параметры и работу различных типов оборудования — мониторинг IT-систем, мониторинг СКС/ЛВС, мониторинг инженерных систем и т.д.

По типу реализации системы делятся на программные, аппаратные и гибридные решения.

По уровню контроля системы мониторинга делятся на распределенные и централизованные.

Распределенные системы позволяют отслеживать состояние одного или нескольких однотипных устройств.

Централизованные системы дают возможность объединить всё контролируемое оборудование, в том числе и несколько распределенных систем, в единую систему, позволяющую наблюдать за работой всего оборудования в «одном окне».

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Из чего состоит

Уже много лет мы с коллегами работаем с системой мониторинга NetBotz и системой управления инфраструктурой ЦОД StruxureWare Data center Expert от APC by Schneider Electric. У нашей команды есть партнёрская сертификация направления DCIM.

У большинства производителей инженерного оборудования существуют комплексные решения. С их помощью можно создать инженерную инфраструктуру ЦОД «под ключ» и собрать систему мониторинга «из кубиков».

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Предсказуемо, что главная проблема таких систем — это подключение оборудования сторонних производителей. Бывает, что такие системы поддерживают некоторые типы и модели оборудования сторонних производителей, но для корректного подключения и отображения параметров очень часто требуются дополнительные действия и время.

Например для подключения устройств других брендов, подключаемых по протоколу MODBUS к системе Data center Expert от APC, не входящих в список поддерживаемого, приходиться обращаться в службу поддержки. При этом нужно предоставить технические данные на подключаемое оборудование, заполнить несколько форм и подождать около месяца. Своими силами это сделать практически невозможно.

Установка и настройка

От теории к практике. Первую систему мониторинга мы установили в 2010 году. Всего мы реализовали более 15 систем мониторинга ЦОД. С одной стороны, работа каждый раз одинакова, с другой стороны, у каждого заказчика свои условия и требования, поэтому каждый проект запоминается чем-то своим. Ниже я расскажу о самых интересных проектах за последние несколько лет.

НИС ГЛОНАСС

Два центра обработки данных находились в Москве и в Санкт-Петербурге. Их связали единой системой мониторинга инженерной инфраструктуры. В этом проекте впервые пришлось разделять права пользователей для доступа к группам устройств. Как это? Специалисты из Москвы контролировали все устройства в обоих ЦОД, а специалисты в Санкт-Петербурге контролировали только свою часть оборудования.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Проект для металлургического комбината

Нашей команде впервые пришлось «прикручивать» к системе мониторинга StruxureWare Data center Expert оборудование сторонних производителей, дизель-генераторную установку, щит автоматики и щит управления системой кондиционирования. Не обошлось без помощи западных специалистов службы поддержки производителя системы мониторинга. Они за месяц написали драйверы для нужных нам устройств.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Научно-исследовательское подразделение госкорпорации

Здесь помимо стандартного решения мы впервые реализовали мониторинг щита вводного распределительного устройства с автоматическими рубильниками, управляемого программируемым реле ZelioLogic, щита распределения питания с контролем состояния автоматических выключателей на контроллере Acti-9 SmartLink и счетчиков электроэнергии PowerLogic от компании Schneider Electric.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Технопарк

Мы впервые в стране реализовывали системы мониторинга и системы управления инфраструктурой ЦОД с применением 190 беспроводных датчиков температуры и влажности, расположенными в 6 машинных залах и 4 аппаратных.

Инфраструктурный мониторинг что контролирует. Смотреть фото Инфраструктурный мониторинг что контролирует. Смотреть картинку Инфраструктурный мониторинг что контролирует. Картинка про Инфраструктурный мониторинг что контролирует. Фото Инфраструктурный мониторинг что контролирует

Относительно скоро стартует ещё один крупный проект. Для нас это будет новый опыт. Предстоит внедрять системы мониторинга RAMOS и систему управления инфраструктурой ЦОД Aegis DCIM (чешский производитель CONTEG). Возможно, снова появится повод, о чём вам рассказать.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *