В мире ІТ-услуг с его налаженными автоматизированными по эталону процессами, где человеческий фактор сведен к минимуму, все не так идеально, как хотелось бы. И сбои в предоставлении ІТ-услуг также случаются. Услуга может работать некорректно или и вовсе быть недоступной, кто-то может заполучить несанкционированный доступ к данным. То есть, может случиться любое событие, которое не является частью нормального функционирования сервиса. Все это в ITIL называется «инцидентом».
Управление инцидентами и проблемами — ключевые процессы в ІТ-менеджменте. Они очень схожи между собой, и одновременно существенно отличаются. Рассмотрим каждый из этих процессов и способы их реализации на примере системы bpm’online service. Почему именно эту систему мы выбрали в качестве образца? Готовые процессы, заложенные в bpm’online service, соответствуют рекомендациям библиотеки ITIL и содержат правильную последовательность процедур. Но прежде чем продолжить, давайте разберемся с терминологией.
Инцидентом в ITIL называют любое отклонение от нормального функционирования ІТ-сервиса — его прерывание (если оно не было запланировано) или снижение качества услуги в целом. Сбой конфигурационной единицы, не успевший отобразиться на качестве сервиса, также считается инцидентом.
Клиент может не ощутить наличие инцидента. То есть, сбой был устранен в автоматическом режиме до того, как успел оказать влияние на качество сервиса или нанести урон репутации бизнеса. В других случаях инциденты могут оказать крайне негативное влияние на бизнес и привести к финансовым потерям. В этом случае крайне важно оперативно минимизировать это отрицательное воздействие на бизнес. Как это сделать? Если это возможно, то быстро «починить», в более тяжелом случае — восстановить основные функции, если предпринятые меры не сработали — прибегнуть к обходному решению.
Обходным решением называют комплекс мер для устранения или минимизации негативного влияния инцидента на бизнес, если в текущий момент полное его разрешение не является возможным.
Для эффективного управления деятельностью ІТ-подразделений, необходимо определить четкий порядок действий. Для этого, в соответствии с рекомендациями библиотеки ITIL, должен быть выстроен процесс управления инцидентами.
Управление инцидентами (Incident Management) — процесс, основное предназначение которого — управление жизненным циклом инцидентов. Он содержит ряд действий для минимизации или устранения негативных воздействий сбоев в работе инфраструктуры на нормальное функционирование сервиса.
Инцидент может возникнуть в любой части инфраструктуры. Информация об этом консолидируется в Service Desk, а источниками могут быть как сами пользователи, так и системы мониторинга, сервер.
Мероприятия по управлению инцидентами, в частности, в системе bpm’online service, которую мы изначально взяли за образец, заключаются в следующем:
В основе этой системы управления инцидентами лежит комплексный процесс, но при этом состоиящий из ряда отдельных подпроцессов. Каждый из них запускается отдельно, в зависимости от текущего состояния обращения и изменений, которые в него вносит оператор.
Система также предоставляет возможность анализировать эффективность работы с обращениями по таким метрикам:
Проблемой называют корневую причину одного или нескольких обращений (как тех, которые уже возникли, так и возможных). Например, проблемой может быть регулярная поломка определенного узла. В терминологии ITIL «проблема» — это инцидент или группа инцидентов с общей неизвестной причиной.
Процесс управления проблемами — это ряд действий, основной целью которых является:
То есть, процесс управления проблемами Itil носит реактивный и проактивный характер.
Управление проблемами (на примере рассматриваемой системы bpm’online service), подразумевает выполнение таких действий:
Работая с возникшими проблемами, специалистам службы поддержки нередко приходится анализировать часть ІТ-инфраструктуры. Дело в том, что причина может крыться в связанных конфигурационных единицах, например. В системе bpm’online service все зарегистрированные взаимосвязи между этими единицами или сервисами сформированы в единую сервисно-ресурсную модель. Это значительно упрощает поиск проблемы и позволяет оценить возможные причины сбоя в работе того или иного элемента ІТ-инфраструктуры.