(導入部分) | 一言二言謝罪の言葉を述べ、これから事象内容について説明する導入文章を書こう。なおここは謝罪の部分であるので丁寧な口調を使う。 |
概要 | 事象の概要を書く。簡単な5W1H的説明を述べる。次項の影響範囲も含めて、サマリー表などを横に書き添えるのも良いアイディア。 |
発生日時 | 障害は発生した時間を書く。”YYYY年MM月DD日 hh:mm〜YYYY年MM月DD日 hh:mm”形式が良いだろう。時間は”hh:30頃”といった形でも良いが、SLAなどに関係する場合は正確に書く。 |
影響範囲 | 障害が発生していた場所や、影響を受けたユーザーの数、その条件などを書く。その時点でわかっている範囲でできるだけ具体的に説明する。数字が変化する可能性があればその旨も言及する。場合によってはユーザー数などは補填・補償に関係するので正確な数字が求められる。 |
経緯 | 事象の発生とその対処、完了までの一連の流れを時系列で説明する(完了していないのであれば現時点まで)。”MM/DD hh:mm 説明" という書き方。表にしても良い。誰と誰がどうやりとりしたかといった自分たち以外のステークホルダー含めて、対応や連絡・報告のアクションの流れも記述する。 |
原因 | 直接的原因と間接的原因を書く。直接的原因とは問題事象の発生トリガーとなった原因である。例えばバグだったりオペミスだったり物理故障だったりである。間接的原因は、背景要因の説明であり、なぜそれを発生させたのかの分析の説明である。例えばテストが不十分だった、仕様や設計の考慮漏れだった、などといった理由である。原因がまだ調査中の段階で一旦出す場合は「調査中」とし、書ける情報を書いておく。 |
対応 | 原因を踏まえて、問題を解決する対応策などを説明する。(場合によっては報告書を出す段階ではすでに対応済みであるかもしれない。)当座の間でのワークアラウンドを「暫定対応」とし、根治的な改善改修を「恒久対応」とする、といった形で段階を分けて対応を計画し、説明する場合がある。開発のインパクトやスケジュールなどを勘案する必要があるためである。 |
再発防止策 | 前述の恒久対応の延長として説明することもある。同様の事象を再発させないために講じた対策を説明する。これはチームだったりプロジェクトだったり会社だったりで対応することになるので、必要に応じてPDCAサイクルに組み込んだり、ルール化・標準化したりと、開発・運用の品質向上として関係者全体で取り組むことになる。 |
その他 | 残タスクや検討事項、提案事項など、補足や備考など、付記しておきたいことを書く。 |