社内RAGや社内ナレッジグラフを入れたあと、いちばん迷いやすいのは「結局、何を見れば成功と言えるのか」です。検索回数が増えた、AIが返事をした、そんな数字だけではまだ判断できません。大事なのは、現場の仕事が楽になったか、そして仕組みが壊れずに回っているかです。

この記事でいうナレッジ運用は、会社の引き出しにしまってあるノウハウを、必要なときにAIが参照して使える形に整えることです。RAGは「参照」、ナレッジグラフは「関係」、KPIは「成果を測るための物差し」と考えると、役割が分かりやすくなります。

成果の見方は、レシピ本にたとえると整理しやすいです。本が開かれているかを見るのが入口、実際に料理できたかを見るのが業務成果、古い分量や抜け漏れがないかを見るのが健全性です。ナレッジ運用も同じで、「利用されているか」「役立っているか」「壊れていないか・育っているか」の3層で見ると、判断がぶれにくくなります。

入口 利用されているか

本が開かれているかを見る。

成果 役立っているか

実際に料理できたかを見る。

土台 壊れていないか・育っているか

古い分量や抜け漏れがないかを見る。

1. ナレッジ運用とは何か

ここで扱うのは、社内FAQ、手順書、過去の回答、運用メモなどを、AIが必要なときに引き出して使う運用です。モデルを再学習して知識を埋め込む話ではなく、外に置いた知識を検索して参照し、回答や判断に役立てる運用だと思ってください。

このとき、RAGは「探して読んで答える仕組み」、ナレッジグラフは「知識どうしのつながりを見えるようにする仕組み」です。KPIは、その仕組みが本当に現場で効いたかを確かめるための数字です。つまり、ナレッジ運用は資料置き場ではなく、仕事に使われる状態まで持っていく活動だと言えます。

RAG 参照

探して読んで答える仕組み

Knowledge Graph 関係

知識どうしのつながりを見えるようにする仕組み

KPI 成果

現場で効いたかを確かめるための数字

2. まず見るべき3層モデル

ナレッジ運用の成果は、次の3層で見ると整理しやすくなります。

01 利用されているか
02 役立っているか
03 壊れていないか・育っているか

最初の層は入口です。使われていなければ、どれだけ内容が良くても成果にはつながりません。
次の層は仕事の中身です。使った結果、対応が早くなったか、迷いが減ったか、手直しが少なくなったかを見ます。
最後の層は土台です。古い情報が混ざっていないか、参照が切れていないか、誰も直さない状態になっていないかを見ます。

この3層を分けると、「見た目は使われているが、実は役立っていない」「便利そうに見えるが、古い情報で危ない」といった状態を見落としにくくなります。

3. 指標をどう見るか

ここでは、社内FAQで問い合わせ対応を支える場面を例にします。ポイントは、検索回数だけを追わないことです。回数が増えても、答えにたどり着けていなければ現場はまだ楽になっていません。だからこそ、指標は「利用」「役立ち」「健全性」に分けて見る必要があります。

Layer 01

利用されているか

使われていなければ、どれだけ内容が良くても成果にはつながりません。

検索成功率
探した人が迷子になっていないかを見る
検索後の行動率
読んだだけで終わらず、申請や対応に進んだかを見る
自己解決率
問い合わせに回らず済んだかを見る
実利用者数
同じ人の繰り返しではなく、広がっているかを見る
Layer 02

役立っているか

対応が早くなったか、迷いが減ったか、手直しが少なくなったかを見ます。

回答採用率
担当者が大きく直さずに送れたかを見る
一次解決率
再問い合わせが減っているかを見る
対応時間短縮
以前より早く終わっているかを見る
人手修正率
下書きとしてどのくらい使えるかを見る
Layer 03

壊れていないか・育っているか

古い情報、参照切れ、誰も直さない状態を見落とさないための土台です。

参照切れ率
リンク切れや権限不足で止まっていないかを見る
誤回答率
現場に危ない答えが出ていないかを見る
更新遅延・古い情報率
ルール変更に追いつけているかを見る
所有者カバー率・根拠付き率
直す人と根拠が決まっているかを見る
観点 指標 何がわかるか 初心者向けの見方
利用されているか 検索成功率 必要なFAQや手順にたどり着けたか 探した人が迷子になっていないかを見る
利用されているか 検索後の行動率 検索のあとに次の行動へ進めたか 読んだだけで終わらず、申請や対応に進んだかを見る
利用されているか 自己解決率 人に聞かずに解決できたか 問い合わせに回らず済んだかを見る
利用されているか 実利用者数 何人が実際に使ったか 同じ人の繰り返しではなく、広がっているかを見る
役立っているか 回答採用率 AIの答えがそのまま使えたか 担当者が大きく直さずに送れたかを見る
役立っているか 一次解決率 1回の対応で解決できたか 再問い合わせが減っているかを見る
役立っているか 対応時間短縮 対応がどれだけ速くなったか 以前より早く終わっているかを見る
役立っているか 人手修正率 どれだけ手直ししたか 下書きとしてどのくらい使えるかを見る
壊れていないか・育っているか 参照切れ率 必要な知識に届かなかった割合 リンク切れや権限不足で止まっていないかを見る
壊れていないか・育っているか 誤回答率 間違った案内が出た割合 現場に危ない答えが出ていないかを見る
壊れていないか・育っているか 更新遅延 変更から更新までの遅れ ルール変更にすぐ追いつけているかを見る
壊れていないか・育っているか 古い情報率 期限切れや旧版が残っている割合 もう使わない情報が混ざっていないかを見る
壊れていないか・育っているか 所有者カバー率 責任者が設定されている割合 直す人が決まっているかを見る
壊れていないか・育っているか 根拠付き率 参照元までたどれる割合 どこを見て答えたか説明できるかを見る

3-1. 利用は、回数だけで見ない

検索回数や閲覧数が増えても、問い合わせが減っていなければ成果とは言えません。たとえば「経費精算 例外」を何度も調べているだけなら、使われてはいても、まだ探しづらい可能性があります。利用を見るときは、検索成功率、検索後の行動率、自己解決率、実利用者数をセットで見ます。

3-2. 役立ちを見ると、業務の短さが見える

役立っているかを見るときは、回答採用率や一次解決率だけでは足りません。対応時間短縮と人手修正率も合わせて見ると、「便利そう」ではなく「本当に仕事が短くなったか」が見えてきます。もし毎回大きく書き直しているなら、答えの下書きとしてはまだ弱いということです。

3-3. 健全性は、鮮度と責任で判断する

壊れていないかを見るときは、参照切れ率と誤回答率をまず押さえます。前者は必要な知識に届いているか、後者は危ない案内が出ていないかを直接教えてくれます。そこに更新遅延、古い情報率、所有者カバー率、根拠付き率を重ねると、ナレッジが「育っているか」も見えてきます。育つとは、単に増えることではなく、更新され、責任があり、根拠がたどれる状態を保つことです。

3-4. ナレッジグラフは「つながりの質」も見る

ナレッジグラフを使っている場合は、項目の数だけでなく、つながり方の質を見る必要があります。たとえば、ノード/エッジの網羅率は、必要な知識や関係がどれだけ表に出ているかを示します。関係の正確性は、AとBの結びつきが本当に正しいかを確かめる指標です。

さらに、経路探索成功率を見ると、ある質問から関連知識へたどり着けるかが分かります。孤立ノード率が高いなら、登録されていても他の知識とつながっていない状態です。見た目は立派でも、探せない・つながらない・たどれないなら、ナレッジグラフとしての価値は出にくいので、こうした指標で「使える関係」になっているかを確認します。

4. 指標はどう決めるか

最初から細かく作り込みすぎる必要はありません。大切なのは、指標ごとに定義、取得元、頻度、集計担当を決めて、毎回同じ見方で追えるようにすることです。

頻度は、変化の速いものと遅いものを分けるだけでも十分です。たとえば、検索ログや参照切れは週次で見たほうが早く気づけます。一方で、一次解決率や対応時間短縮は、月次でならして見たほうがぶれにくいです。週次は異常検知、月次は判断の確定と考えると、会議の役割も整理しやすくなります。

01 定義

何を成果として数えるかを決める。

02 取得元

利用ログ、検索ログ、問い合わせ管理票などを見る。

03 頻度

週次は異常検知、月次は判断の確定に分ける。

04 集計担当

運用担当、現場リーダー、品質責任者などを決める。

指標 定義 取得元 頻度 集計担当
利用頻度 一定期間にどれだけ使われたか 利用ログ、検索ログ 週次、月次 運用担当
一次解決率 1回の対応で解決できた割合 問い合わせ管理票、再問い合わせログ 月次 問い合わせ管理担当
対応時間短縮 ナレッジ利用で短くなった時間 作業記録、ヒアリング記録 月次 業務改善担当
回答採用率 AIの回答をそのまま使えた割合 回答ログ、編集履歴 週次 現場リーダー
参照切れ率 参照先に到達できなかった割合 エラーログ、権限エラー 週次 システム担当
誤回答率 正しくない回答が確認された割合 差戻し記録、QA記録 月次 品質責任者
更新遅延 変更依頼から実更新までの遅れ 更新依頼票、版管理履歴 月次 ナレッジオーナー
所有者カバー率 責任者が設定されている割合 台帳、管理一覧 月次 運用責任者

成果の判定は、導入前比、目標値、警戒ラインの3つで見ると分かりやすいです。導入前の実績があるならそれを基準にし、まだないなら初月の値を仮の基準にします。

たとえば、利用頻度は導入前比で1.2倍以上を目安にし、一次解決率は60%以上、対応時間短縮は10%以上をひとまずの目安にします。健全性では、参照切れ率1%未満、誤回答率2%未満、所有者カバー率100%を最初の基準にすると、危険な状態を早く見つけやすくなります。これらの数値は、あくまで初期の仮置きです。業務の重要度が高いならもっと厳しく、まだ立ち上げ段階なら少し緩くするなど、成熟度とリスクに合わせて調整してください。

導入前比 利用頻度 1.2倍以上
目標値 一次解決率 60%以上
警戒ライン 誤回答率 2%未満

5. 失敗しやすい見方と最初の運用ルール

ナレッジ運用は、見方を間違えるとすぐに形だけの管理になります。よくある失敗は次の4つです。

回数だけを見る。検索回数が増えても、業務が速くなっていなければ意味が薄いです。

部署ごとに数字を分断する。全体像が見えず、どこで詰まっているかも分かりにくくなります。

古いナレッジを現役扱いする。制度変更前のFAQが残ると、AIはもっともらしく古い答えを返します。

更新責任者を決めない。誰も直さない状態では、知識はすぐに使えなくなります。

最初の1か月は、指標を増やしすぎないことが大切です。見るべきものは、利用、役立ち、更新健全性の3つで十分です。公開前に所有者を決め、制度や手順が変わったら更新日と根拠を残し、月1回だけ3層をまとめて確認する。この小さな運用だけでも、ナレッジは置きっぱなしではなく、回る仕組みに近づきます。

6. 指標を見たあと、何を直すか

指標は、眺めるためではなく、次の一手を決めるためにあります。数字を見たあとに何を直すかまで決めておくと、会議が感想で終わりません。

利用が低い 入口を直す

よく使うFAQをトップに置く。検索語のゆれを辞書に足す。現場の言い方に見出しを寄せる。

役立ちが低い 回答の使いやすさを直す

回答の粒度を揃える。テンプレートを見直す。不要な前置きを減らす。

健全性が低い 根拠と更新を直す

壊れたリンクを修正する。根拠元を明記する。所有者と更新期限を設定する。

カテゴリ ありがちなサイン 具体的な打ち手
利用が低い 検索回数も実利用者数も少ない。入口に入ってきていない よく使うFAQをトップに置く。検索語のゆれを辞書に足す。現場の言い方に見出しを寄せる
利用が低い 開いてはいるが、途中で離脱している 答えの前に結論を置く。長い手順は分割する。関連FAQへの導線を追加する
役立ちが低い 回答採用率が低く、毎回大きく直している 回答の粒度を揃える。テンプレートを見直す。不要な前置きを減らす
役立ちが低い 一次解決率が伸びない、対応時間も短くならない 実際の問い合わせを元にFAQを作り直す。例外ケースを追加する。AIの答え方を実務向けに修正する
健全性が低い 参照切れや誤回答が増えている 壊れたリンクを修正する。根拠元を明記する。高リスク項目は人手確認をはさむ
健全性が低い 古い情報が残り、誰も直していない 所有者を必ず付ける。更新期限を設定する。旧版を非公開にする

こうして見ると、指標は単なる集計結果ではなく、改善の入口になります。どの数字が悪いかで、直す場所もかなり違います。だからこそ、最初から全部を一度に直そうとせず、利用・役立ち・健全性のどこに原因があるかを分けて考えるのが大切です。

まとめ

ナレッジ運用の成果は、「使われたか」だけでは判断できません。現場で役立ち、古くならずに回り続けているかまで見て、はじめて成果と言えます。

初心者が最初に見るなら、利用、役立ち、更新健全性の3つで十分です。見方をそろえれば、社内RAGや社内ナレッジグラフは、単なる仕組みではなく、仕事を少しずつ楽にする資産として育っていきます。

Next step

自社のナレッジ運用で見るべき指標を整理する。

問い合わせ、教育、コンテンツ生成、社内検索など、最初に成果を見たい業務に合わせて、追うべき指標と運用ルールを一緒に整理できます。