ServiceNow
デモで惚れて現場が固まる——評価指標の作り方と期待値すり合わせの実務
- RFP
- 評価
- 導入準備

- 目次

1. 問題提起:デモに惚れて、現場が固まる

会議室で、まず出てくる言葉は「とりあえずデモを見ましょう」です。この流れ自体が悪いわけではありません。ただ、ここで判断を急ぐと、「結局どう回すのか」「誰が判断するのか」が決まらないまま進み、作業はあるのに前に進まない状態が起こりやすくなります。
画面がきれいで、自動化が多く見える。そうした第一印象で選ぶと、運用に入ってから「思っていたのと違う」「結局、手作業が減らない」という声が出がちです。本来確かめたいのは、日々の仕事のどこで手が止まり、その詰まりがどう解けるかです。ここでつまずきやすいのが、評価指標の作り方と期待値のすり合わせです。デモを先に見ると、「何を基準に良し悪しを決めるのか」「どの水準を期待しているのか」が言語化されないまま進みがちです。その結果、評価が印象頼みになり、後から認識のズレが表に出ます。
2. 現状の誤解・よくある状態:見せ方主導とすれ違い
デモは「見せたい場所」を上手に見せます
デモは、仕立ての良いスーツに少し似ています。自社に合うかどうかは、実際の業務で着てみないと分かりません。操作性、拡張性、保守性、運用コストの四つを、ユースケースごとに見ないと、どうしても印象に引っ張られます。
操作性は「完了までに何クリックか」。
拡張性は「テーブルやワークフローを増やしても、使い勝手や性能が落ちないか」。
保守性は「設定の標準や変更ルールが整理されているか」。
運用コストは「FTE(人の作業時間換算)をどれだけ減らせるか」。
こうした具体で見ると、「このユースケースで使えるか」「どこが割り切りになるか」を判断しやすくなります。
「見やすい=使いやすい」とは限りません
見た目が良いダッシュボードでも、CMDB(構成管理データベース)とつながらなければ、データはすぐ古くなります。それでは、障害対応や優先度判断、次に取るべき対応を決める材料として使いにくくなります。
Tanium(エンドポイントの可視化・操作基盤)やEDR(Endpoint Detection & Response:端末の検知と対応)、ITSM(ITサービス管理)との連携も同様です。このあたりが曖昧なままだと、導入後に「想定より手作業が多い」と感じやすくなります。
期待値ギャップは、小さなズレの積み重ねで生まれます
ベンダーは「できること」を説明します。一方で現場は「こう動いてほしい」と思い描きます。
ゼロトラスト(境界に頼らず、利用者と端末の状態で守る考え方)や、シャドーIT(管理外で使われているIT資産)は、特に解釈が分かれやすいところです。用語と水準を先に合わせないと、評価を重ねるほどズレが広がっていきます。
3. 原因分析:評価軸と合意形成の欠落
ユースケースに結びつく評価軸がない
「何を」「どの順で」「どのレベルまで」やるのか。ここが曖昧だと、評価はどうしても好み寄りになります。たとえば「インシデント対応を早くしたい」なら、MTTR(復旧までにかかる平均時間)を下げるために、どこを短くするのかを見る必要があります。アサイン時間なのか、再割り当てなのか。軸が決まると、見る画面や操作は自然に絞れます。
重みづけがないと、点数は散らばります
操作性も大事、保守性も大事。それでも「全部同じ重さ」では選びきれません。業務側は操作性を重く見がちですし、運用側は保守性を重視します。最初に重みを合意しておくと、議論は感覚論から離れやすくなります。
Fit/Gapが曖昧なまま進む
Fit/Gap(要件に対する適合と差分)が曖昧だと、PoC(概念実証)がどこへ向かうのか分からなくなります。差分が出たときに設定で吸収するのか。運用ルールを変えるのか。アドオンを作るのか。この三つを並べ、判断の順番を決めておかないと、迷いが増えます。
4. 解決アプローチ:ユースケース基準の評価設計

ユースケースごとに、評価観点を固定する
まず、代表的なユースケースを三つほど選びます。
- 起票からクローズまで。
- 変更管理の承認。
- 資産情報の更新。
この程度で十分です。
それぞれについて、操作性・拡張性・保守性・運用コストを同じ観点で見ます。CMDB連携や、Tanium/EDRとのデータ往復、ITSMプロセスの自動化範囲も、事前に明確にします。ゼロトラスト前提の権限設計も、最初に言葉をそろえておくと誤解が減ります。
スコアリングは「重み」と「基準」を先に決める
スコアリングシートは、項目・重み・採点基準で作ります。「5点とは何か」を、文章で決めておくのがコツです。操作性であれば「3クリック以内で記録でき、承認が自動で起案される」。拡張性なら「ユースケース追加後も、性能が基準内に収まる」。重みは合計100%で配分します。
デモ依頼は「見せる順」と「前提」を指定する
見せ方に左右されないため、デモはシナリオで依頼します。ユースケース、前提データ、操作ロール、期待する結果を時系列で書きます。
たとえば、アラートから起票し、CMDBの関連CIを自動補完。Tanium情報で端末隔離を起案し、EDRの検知結果と突き合わせて承認。ここまで具体に書くと、再現性が高まります。
Fit/Gapの回避策は、セットで考える
差分が出たら、設定で吸収、運用変更、アドオンの順で検討します。アドオンは保守に影響しやすいため、最後に回すのが無難です。
誰が決めるかは、RACI(役割分担表)で明確にします。これだけでも、会議の迷いは減ります。
合意形成は「段取り」で決まる
関係者が多いほど、期待値は広がります。下書き合意、評価会、最終合意。この三段階を踏むと、話が進みやすくなります。
5. 実務ステップ:スコアリング、デモ依頼、Fit/Gap、PoC、決裁の流れ
ステップ1:スコアリングシートを作る
ステップ2:デモリクエストをシナリオ化する
ステップ3:Fit/Gapを判定し、対策を選ぶ
ステップ4:PoCを設計する
ステップ5:決裁資料にリスクと緩和策を載せる
6. 効果:期待値ギャップを抑え、運用を前に進める
評価の基準がユースケースにあると、議論は整理されます。「できるかどうか」ではなく、「どのやり方が現実的か」に目が向きます。デモをシナリオ化し、Fit/Gapの考え方を定型にすると、導入後のすれ違いは減ります。PoCの成功条件と撤退ラインを決めておけば、判断も早くなります。
結果として、期待値ギャップが小さくなり、現場は動きやすくなります。
7. 結論:「現場が回るか」を測る評価へ

評価の目的は、良さそうな製品を選ぶことではありません。現場が実際に回るかどうかを、確かめることです。操作性、拡張性、保守性、運用コスト、それぞれの重みは、組織ごとに違います。
重みと基準を合意し、見せ方に流されないデモと、迷わないPoCを設計する。その積み重ねが、「思っていたのと違う」を減らし、運用改善につながります。
8. まず始めるチェックリスト
- 代表ユースケースを三つ選ぶ
- 評価観点と重み(合計100%)を合意する
- 採点基準を文章で定義する
- デモリクエストをシナリオ化する
- Fit/Gapの対処方針とRACIを決める
- PoCの成功条件と撤退ラインを数値で定める
- 決裁資料にリスクと緩和策を添える