エンジニア

インシデント管理とは?プロセスや問題管理との違いを解説

2020年09月21日

インシデント管理

企業運営において「インシデント管理」は、ユーザーにとって快適なシステムやサービスを提供する上で欠かせないものです。しかし「インシデントと言われても、何のことかいまいちわからない」と思われる方もいらっしゃるかもしれません。
インシデントとはITシステムやサービスの使用に関して起こるトラブルであり、適切な管理が必要になります。
今回はインシデント管理について知りたいITの初心者向けに、インシデント管理と類似する「問題管理」との違いやインシデント管理のプロセスなどについてご紹介していきます。

インシデント管理とは

インシデント管理(incident management)とは、ユーザーが利用しているシステムに何らかの問題が発生した際に早急に問題に対応し、正常な状態に戻してサービスの可用性を維持することを指します。これらの業務は主にシステム部門が担うことになります。

インシデントとは

ここで触れるインシデントは「ITシステムやサービスの質が低下して、ビジネスおよびユーザーに悪影響を与える現象が発生していること」と定義できます。具体的には下記のような例がインシデントに該当します。

  • 経理システムにデータを入力中にフリーズが発生し、入力ができなくなった
  • いつもはログインできる勤怠管理システムにログインできない
  • ログインパスワードを忘れてしまいシステムが利用できない


今やどの業種でもITシステムやサービスの利用は不可欠です。ビジネスをしている限り、必ずインシデントは発生するといってよいでしょう。

ITILとは

インシデントについて理解するには、「ITIL」を参照するとよいでしょう。
ITIL(Information Technology Infrastructure Library)とはITサービスを管理する際に役立つ成功事例をまとめた書籍群です。世界中でITサービスマネジメントのテンプレートとして広く普及しており、「ITIL 4」が現在の最新バージョンとなります。企業だけでなく世界中の政府もITILを参考にしながらIT管理を行っています。
ITILを理解できると効率的なシステム管理ができるようになり、ITにおけるリスクにも適切に対処できるようになるでしょう。

インシデント管理と問題管理の違い

インシデント管理は問題管理と混同されることが多い概念でもあります。
先述した通り、インシデント管理ではトラブルの発生したユーザーから内容を聞き出して、正常な状態に戻せるよう対処を行っていきます。ユーザーが速やかにシステム利用を再開できるように迅速に解決に当たることが重要です。
対して問題管理とはインシデントの元となった根本的な原因を解決するプロセスを指します。具体的には下記のような原因を究明していきます。

  • メモリ不足
  • 社内ネットワークの一部機器の故障
  • ユーザーの操作ミス


インシデントが発生する原因を解決しないと、その場でインシデントを解決できても同じ問題がまた発生してビジネスに支障が出る恐れがあります。インシデントを解決した後は問題管理を行い、根本的なインシデント発生原因を取り除く必要があるでしょう。
確実に原因を探し出して解決するために問題管理には時間を掛けてください。

インシデント管理のよくある課題

インシデント管理にはさまざまな課題が付きまといます。
課題を解決するにはインシデント管理ツールの導入がおすすめです。インシデント管理ツールを使うと下記のようなメリットを得ることが可能です。


  • インシデント管理業務の進捗状況や対応履歴などが一目で分かる
  • インシデント管理の流れや知見などをツール上で共有して管理の属人化を防げる
  • インシデント管理業務が効率化されて定着しやすくなる


インシデント管理でよく発生する課題には、次のようなものがあります。

インシデントに誰が対応しているかわからない

インシデント管理において、誰がどういった対応を行っているかを社内で把握できるようにしておくのは重要です。複数の人間にインシデント内容が共有されると他チームの手助けも借りやすくなります。
しかしインシデント対応が社内で体系化されておらず誰が対応しているかわからない状態だと、連携が難しくなります。結果的にインシデント対応に時間が掛かりユーザーをいらつかせてしまうかもしれません。

過去のインシデント管理データに抜けがある

インシデント管理で収集されたデータはナレッジベースとして蓄積しておく必要があります。蓄積ができれば次から同じような質問があった際、担当者がスムーズに解決できるようになるからです。
しかし過去のインシデント管理データに抜けがある場合情報の参照ができないので、同じような質問に対していちいち時間を取られてしまい非効率になります。対応方法といった必要な項目を網羅して、ナレッジベースにその都度蓄積することが重要です。

理想的なインシデント管理のプロセス

ここからは、理想的なインシデント管理のプロセスを解説していきます。

ステップ①インシデント検出

まずは解決すべきインシデントを検出します。
インシデントを検出するにはユーザーからの連絡で知る方法と、管理ツールを使ってアラート機能で検出する方法の2種類があります。ツールでインシデント検出を自動化しておくと、スピーディーにインシデントを発見して課題解決に当たれるようになるでしょう。

ステップ②インシデントの分析

次にインシデントの内容を把握し、いくつかの項目を元にインシデント内容を整理します。

  • 担当者
  • 種類
  • 優先度合
  • 難易度


これらは内容を整理する際に基準となる項目の一例です。ナレッジベースに同じような対応内容が共有されていれば、参照しながら内容を分析します。分析を通じて自分だけで対応ができる内容と判断できれば、ステップ④に移ります。

ステップ③エスカレーションによるインシデント解消

ステップ②の時点でサポート担当者がインシデントを解消できなかった場合、上司やマネージャーなど対応のできる上位者にエスカレーションを行って引き継ぎを行う必要があります。この際、分析した内容を過不足なくエスカレーション先に伝えるのが重要です。
ツールがあれば画面ですぐインシデントを共有できるので、時間が掛からなくて便利です。

ステップ④インシデントの管理

担当者はインシデントに関する対応策を立てて、適切と思われる方法で解決を行っていきます。無事インシデントが解消したらナレッジベースに内容を記録していきます。なお、その場ですぐ解決するものではなく暫く様子を見る必要がある場合は、対応が完全に終わるまで継続してインシデントをフォローしていくのもポイントです。

ステップ⑤インシデントの解決と終了

インシデントが完全に解決したら、関係者へ報告を行ってから対応を終了させます。新しいインシデントが発生した場合は、また①~⑤を繰り返していきます。
対応数が増えるほどナレッジベースが貯まり管理は効率化します。問題管理で根本的な原因を解決してインシデント発生数を減らしながら、インシデントへ対応できる環境を構築しましょう。

まとめ

今回はインシデント管理、そして類似する「問題管理」との違いやインシデント管理のプロセスなどについて解説してきました。
インシデントはITシステムやサービスを使う限り必ず起こります。発生した際は被害を最小限にとどめられるように迅速に問題を解決して、問題管理により再発防止を行っていくことが重要です。
ぜひITILについても理解を深めインシデント管理を適切に行ってみてください。

この記事を書いた人

QEEE編集部

QEEEmagazineはマーケター、人事、エンジニア、営業企画などの企画者に役立つコンテンツをそれぞれ領域のスペシャリストが発信していきます。

投稿一覧へ

他サービスはこちら