ServiceNow

2026/06/15

デモで惚れて現場が固まる——評価指標の作り方と期待値すり合わせの実務

RFP
評価
導入準備

目次

1. 問題提起：デモに惚れて、現場が固まる
2. 現状の誤解・よくある状態：見せ方主導とすれ違い
3. 原因分析：評価軸と合意形成の欠落
4. 解決アプローチ：ユースケース基準の評価設計
5. 実務ステップ：スコアリング、デモ依頼、Fit/Gap、PoC、決裁の流れ
6. 効果：期待値ギャップを抑え、運用を前に進める
7. 結論：「現場が回るか」を測る評価へ
8. まず始めるチェックリスト

1. 問題提起：デモに惚れて、現場が固まる

会議室で、まず出てくる言葉は「とりあえずデモを見ましょう」です。この流れ自体が悪いわけではありません。ただ、ここで判断を急ぐと、「結局どう回すのか」「誰が判断するのか」が決まらないまま進み、作業はあるのに前に進まない状態が起こりやすくなります。

画面がきれいで、自動化が多く見える。そうした第一印象で選ぶと、運用に入ってから「思っていたのと違う」「結局、手作業が減らない」という声が出がちです。本来確かめたいのは、日々の仕事のどこで手が止まり、その詰まりがどう解けるかです。ここでつまずきやすいのが、評価指標の作り方と期待値のすり合わせです。デモを先に見ると、「何を基準に良し悪しを決めるのか」「どの水準を期待しているのか」が言語化されないまま進みがちです。その結果、評価が印象頼みになり、後から認識のズレが表に出ます。

2. 現状の誤解・よくある状態：見せ方主導とすれ違い

デモは「見せたい場所」を上手に見せます

デモは、仕立ての良いスーツに少し似ています。自社に合うかどうかは、実際の業務で着てみないと分かりません。操作性、拡張性、保守性、運用コストの四つを、ユースケースごとに見ないと、どうしても印象に引っ張られます。

操作性は「完了までに何クリックか」。
拡張性は「テーブルやワークフローを増やしても、使い勝手や性能が落ちないか」。
保守性は「設定の標準や変更ルールが整理されているか」。
運用コストは「FTE（人の作業時間換算）をどれだけ減らせるか」。

こうした具体で見ると、「このユースケースで使えるか」「どこが割り切りになるか」を判断しやすくなります。

「見やすい＝使いやすい」とは限りません

見た目が良いダッシュボードでも、CMDB（構成管理データベース）とつながらなければ、データはすぐ古くなります。それでは、障害対応や優先度判断、次に取るべき対応を決める材料として使いにくくなります。

Tanium（エンドポイントの可視化・操作基盤）やEDR（Endpoint Detection & Response：端末の検知と対応）、ITSM（ITサービス管理）との連携も同様です。このあたりが曖昧なままだと、導入後に「想定より手作業が多い」と感じやすくなります。

期待値ギャップは、小さなズレの積み重ねで生まれます

ベンダーは「できること」を説明します。一方で現場は「こう動いてほしい」と思い描きます。

ゼロトラスト（境界に頼らず、利用者と端末の状態で守る考え方）や、シャドーIT（管理外で使われているIT資産）は、特に解釈が分かれやすいところです。用語と水準を先に合わせないと、評価を重ねるほどズレが広がっていきます。

3. 原因分析：評価軸と合意形成の欠落

ユースケースに結びつく評価軸がない

「何を」「どの順で」「どのレベルまで」やるのか。ここが曖昧だと、評価はどうしても好み寄りになります。たとえば「インシデント対応を早くしたい」なら、MTTR（復旧までにかかる平均時間）を下げるために、どこを短くするのかを見る必要があります。アサイン時間なのか、再割り当てなのか。軸が決まると、見る画面や操作は自然に絞れます。

重みづけがないと、点数は散らばります

操作性も大事、保守性も大事。それでも「全部同じ重さ」では選びきれません。業務側は操作性を重く見がちですし、運用側は保守性を重視します。最初に重みを合意しておくと、議論は感覚論から離れやすくなります。

Fit/Gapが曖昧なまま進む

Fit/Gap（要件に対する適合と差分）が曖昧だと、PoC（概念実証）がどこへ向かうのか分からなくなります。差分が出たときに設定で吸収するのか。運用ルールを変えるのか。アドオンを作るのか。この三つを並べ、判断の順番を決めておかないと、迷いが増えます。

4. 解決アプローチ：ユースケース基準の評価設計

ユースケースごとに、評価観点を固定する

まず、代表的なユースケースを三つほど選びます。

起票からクローズまで。
変更管理の承認。
資産情報の更新。

この程度で十分です。

それぞれについて、操作性・拡張性・保守性・運用コストを同じ観点で見ます。CMDB連携や、Tanium／EDRとのデータ往復、ITSMプロセスの自動化範囲も、事前に明確にします。ゼロトラスト前提の権限設計も、最初に言葉をそろえておくと誤解が減ります。

スコアリングは「重み」と「基準」を先に決める

スコアリングシートは、項目・重み・採点基準で作ります。「5点とは何か」を、文章で決めておくのがコツです。操作性であれば「3クリック以内で記録でき、承認が自動で起案される」。拡張性なら「ユースケース追加後も、性能が基準内に収まる」。重みは合計100％で配分します。

デモ依頼は「見せる順」と「前提」を指定する

見せ方に左右されないため、デモはシナリオで依頼します。ユースケース、前提データ、操作ロール、期待する結果を時系列で書きます。

たとえば、アラートから起票し、CMDBの関連CIを自動補完。Tanium情報で端末隔離を起案し、EDRの検知結果と突き合わせて承認。ここまで具体に書くと、再現性が高まります。

Fit/Gapの回避策は、セットで考える

差分が出たら、設定で吸収、運用変更、アドオンの順で検討します。アドオンは保守に影響しやすいため、最後に回すのが無難です。

誰が決めるかは、RACI（役割分担表）で明確にします。これだけでも、会議の迷いは減ります。

合意形成は「段取り」で決まる

関係者が多いほど、期待値は広がります。下書き合意、評価会、最終合意。この三段階を踏むと、話が進みやすくなります。

5. 実務ステップ：スコアリング、デモ依頼、Fit/Gap、PoC、決裁の流れ

ステップ1：スコアリングシートを作る

ステップ2：デモリクエストをシナリオ化する

ステップ3：Fit/Gapを判定し、対策を選ぶ

ステップ4：PoCを設計する

ステップ5：決裁資料にリスクと緩和策を載せる

6. 効果：期待値ギャップを抑え、運用を前に進める

評価の基準がユースケースにあると、議論は整理されます。「できるかどうか」ではなく、「どのやり方が現実的か」に目が向きます。デモをシナリオ化し、Fit/Gapの考え方を定型にすると、導入後のすれ違いは減ります。PoCの成功条件と撤退ラインを決めておけば、判断も早くなります。

結果として、期待値ギャップが小さくなり、現場は動きやすくなります。

7. 結論：「現場が回るか」を測る評価へ

評価の目的は、良さそうな製品を選ぶことではありません。現場が実際に回るかどうかを、確かめることです。操作性、拡張性、保守性、運用コスト、それぞれの重みは、組織ごとに違います。

重みと基準を合意し、見せ方に流されないデモと、迷わないPoCを設計する。その積み重ねが、「思っていたのと違う」を減らし、運用改善につながります。

8. まず始めるチェックリスト

代表ユースケースを三つ選ぶ
評価観点と重み（合計100％）を合意する
採点基準を文章で定義する
デモリクエストをシナリオ化する
Fit/Gapの対処方針とRACIを決める
PoCの成功条件と撤退ラインを数値で定める
決裁資料にリスクと緩和策を添える