ServiceNow

デモで惚れて現場が固まる——評価指標の作り方と期待値すり合わせの実務

  • RFP
  • 評価
  • 導入準備
デモで惚れて現場が固まる——評価指標の作り方と期待値すり合わせの実務

目次

1. 問題提起:デモに惚れて、現場が固まる 

会議室で、まず出てくる言葉は「とりあえずデモを見ましょう」です。この流れ自体が悪いわけではありません。ただ、ここで判断を急ぐと、「結局どう回すのか」「誰が判断するのか」が決まらないまま進み、作業はあるのに前に進まない状態が起こりやすくなります。 

画面がきれいで、自動化が多く見える。そうした第一印象で選ぶと、運用に入ってから「思っていたのと違う」「結局、手作業が減らない」という声が出がちです。本来確かめたいのは、日々の仕事のどこで手が止まり、その詰まりがどう解けるかです。ここでつまずきやすいのが、評価指標の作り方と期待値のすり合わせです。デモを先に見ると、「何を基準に良し悪しを決めるのか」「どの水準を期待しているのか」が言語化されないまま進みがちです。その結果、評価が印象頼みになり、後から認識のズレが表に出ます。 


2. 現状の誤解・よくある状態:見せ方主導とすれ違い 

デモは「見せたい場所」を上手に見せます 

デモは、仕立ての良いスーツに少し似ています。自社に合うかどうかは、実際の業務で着てみないと分かりません。操作性、拡張性、保守性、運用コストの四つを、ユースケースごとに見ないと、どうしても印象に引っ張られます。 

操作性は「完了までに何クリックか」。 
拡張性は「テーブルやワークフローを増やしても、使い勝手や性能が落ちないか」。 
保守性は「設定の標準や変更ルールが整理されているか」。 
運用コストは「FTE(人の作業時間換算)をどれだけ減らせるか」。 

こうした具体で見ると、「このユースケースで使えるか」「どこが割り切りになるか」を判断しやすくなります。 

「見やすい=使いやすい」とは限りません 

見た目が良いダッシュボードでも、CMDB(構成管理データベース)とつながらなければ、データはすぐ古くなります。それでは、障害対応や優先度判断、次に取るべき対応を決める材料として使いにくくなります。 

Tanium(エンドポイントの可視化・操作基盤)やEDR(Endpoint Detection & Response:端末の検知と対応)、ITSM(ITサービス管理)との連携も同様です。このあたりが曖昧なままだと、導入後に「想定より手作業が多い」と感じやすくなります。 

期待値ギャップは、小さなズレの積み重ねで生まれます 

ベンダーは「できること」を説明します。一方で現場は「こう動いてほしい」と思い描きます。 

ゼロトラスト(境界に頼らず、利用者と端末の状態で守る考え方)や、シャドーIT(管理外で使われているIT資産)は、特に解釈が分かれやすいところです。用語と水準を先に合わせないと、評価を重ねるほどズレが広がっていきます。 


3. 原因分析:評価軸と合意形成の欠落 

ユースケースに結びつく評価軸がない 

「何を」「どの順で」「どのレベルまで」やるのか。ここが曖昧だと、評価はどうしても好み寄りになります。たとえば「インシデント対応を早くしたい」なら、MTTR(復旧までにかかる平均時間)を下げるために、どこを短くするのかを見る必要があります。アサイン時間なのか、再割り当てなのか。軸が決まると、見る画面や操作は自然に絞れます。 

重みづけがないと、点数は散らばります 

操作性も大事、保守性も大事。それでも「全部同じ重さ」では選びきれません。業務側は操作性を重く見がちですし、運用側は保守性を重視します。最初に重みを合意しておくと、議論は感覚論から離れやすくなります。 

Fit/Gapが曖昧なまま進む 

Fit/Gap(要件に対する適合と差分)が曖昧だと、PoC(概念実証)がどこへ向かうのか分からなくなります。差分が出たときに設定で吸収するのか。運用ルールを変えるのか。アドオンを作るのか。この三つを並べ、判断の順番を決めておかないと、迷いが増えます。 


4. 解決アプローチ:ユースケース基準の評価設計

ユースケースごとに、評価観点を固定する 

まず、代表的なユースケースを三つほど選びます。 

  1. 起票からクローズまで。 
  2. 変更管理の承認。 
  3. 資産情報の更新。 

この程度で十分です。 

それぞれについて、操作性・拡張性・保守性・運用コストを同じ観点で見ます。CMDB連携や、Tanium/EDRとのデータ往復、ITSMプロセスの自動化範囲も、事前に明確にします。ゼロトラスト前提の権限設計も、最初に言葉をそろえておくと誤解が減ります。 

スコアリングは「重み」と「基準」を先に決める 

スコアリングシートは、項目・重み・採点基準で作ります。「5点とは何か」を、文章で決めておくのがコツです。操作性であれば「3クリック以内で記録でき、承認が自動で起案される」。拡張性なら「ユースケース追加後も、性能が基準内に収まる」。重みは合計100%で配分します。 

デモ依頼は「見せる順」と「前提」を指定する 

見せ方に左右されないため、デモはシナリオで依頼します。ユースケース、前提データ、操作ロール、期待する結果を時系列で書きます。 

たとえば、アラートから起票し、CMDBの関連CIを自動補完。Tanium情報で端末隔離を起案し、EDRの検知結果と突き合わせて承認。ここまで具体に書くと、再現性が高まります。 

Fit/Gapの回避策は、セットで考える 

差分が出たら、設定で吸収、運用変更、アドオンの順で検討します。アドオンは保守に影響しやすいため、最後に回すのが無難です。 

誰が決めるかは、RACI(役割分担表)で明確にします。これだけでも、会議の迷いは減ります。 

合意形成は「段取り」で決まる 

関係者が多いほど、期待値は広がります。下書き合意、評価会、最終合意。この三段階を踏むと、話が進みやすくなります。 


5. 実務ステップ:スコアリング、デモ依頼、Fit/Gap、PoC、決裁の流れ 

ステップ1:スコアリングシートを作る 

ステップ2:デモリクエストをシナリオ化する 

ステップ3:Fit/Gapを判定し、対策を選ぶ 

ステップ4:PoCを設計する 

ステップ5:決裁資料にリスクと緩和策を載せる 


6. 効果:期待値ギャップを抑え、運用を前に進める 

評価の基準がユースケースにあると、議論は整理されます。「できるかどうか」ではなく、「どのやり方が現実的か」に目が向きます。デモをシナリオ化し、Fit/Gapの考え方を定型にすると、導入後のすれ違いは減ります。PoCの成功条件と撤退ラインを決めておけば、判断も早くなります。 

結果として、期待値ギャップが小さくなり、現場は動きやすくなります。


7. 結論:「現場が回るか」を測る評価へ

評価の目的は、良さそうな製品を選ぶことではありません。現場が実際に回るかどうかを、確かめることです。操作性、拡張性、保守性、運用コスト、それぞれの重みは、組織ごとに違います。 

重みと基準を合意し、見せ方に流されないデモと、迷わないPoCを設計する。その積み重ねが、「思っていたのと違う」を減らし、運用改善につながります。 


8. まず始めるチェックリスト 

  • 代表ユースケースを三つ選ぶ 
  • 評価観点と重み(合計100%)を合意する 
  • 採点基準を文章で定義する 
  • デモリクエストをシナリオ化する 
  • Fit/Gapの対処方針とRACIを決める 
  • PoCの成功条件と撤退ラインを数値で定める 
  • 決裁資料にリスクと緩和策を添える 

合わせて読みたい記事