「AIの活用実績は正直に語れている」という前提は、もう通用しない

2026-06-15 2026-06-15

phenogen

公開日： 2026年06月14日
カテゴリ： AI人材・組織
　　　　　 AI導入・活用

この記事の要点

世界4大監査法人の一つKPMGでさえ、AI活用レポートに事実誤認・誇張が混入し公開停止に追い込まれた
AIに関する「語り方」の問題は、大企業も中小企業も同じ土俵で起きている
社内のAI活用を報告・評価するとき、「使った感想」と「測定できた成果」は明確に分けなければならない
「フィノジェン式AI報告信頼性チェック」で自社の語り方を今すぐ点検できる
正しく語ることが、社内の信頼と継続的なAI推進を支える最大の土台になる

「うちはAIを活用できています」——この一言は、今や多くの会社の資料やミーティングで当たり前に登場する言葉になった。しかし2026年6月、その「語り方」自体が揺らぐ事件が起きた。

世界的な会計・コンサルティング大手のKPMGが、自社のAI活用レポートを公開直後に取り下げた。複数の企業導入事例に、事実と異なる記述や誇張表現が混入していたことが発覚したためだ。報告書を作成・監査する立場の大手監査法人が、AI関連の「語り方」で信頼を損なったという皮肉な構図は、業界を超えて多くの推進担当者に問いを投げかけている。「うちの会社のAI活用の語り方は、本当に正確か？」と。

比較する前に：この記事の読み方

この記事では「AI活用の語り方」を3つの軸で比較・整理する。具体的には「印象ベースの語り方」「数字ベースの語り方」「検証可能な語り方」という3つのアプローチを対比しながら、中小企業の推進担当者が今日から実践できる水準を提案する。

ツールの優劣を比べる記事ではない。あなたの会社のAI活用を「社内で正しく評価し、正直に報告する」ための軸を整理する記事だ。

比較表

観点	印象ベースの語り方	数字ベースの語り方	検証可能な語り方
根拠の形式	「使っている感触」「便利になった気がする」	「作業時間が30%短縮」などの数値	測定方法・期間・条件が明示されている
再現性	誰が読んでも同じ解釈にはならない	数字の出どころが不明なことが多い	他の人が同じ方法で確認できる
信頼リスク	誇張・記憶違いが混入しやすい	根拠が曖昧なまま独り歩きしやすい	地味だが長期的な信頼を築ける
社内の反応	共感は得やすいが批判も受けやすい	「本当に？」と疑問を持たれることがある	「きちんとやっている」と評価されやすい
KPMGの事件との対応	今回の問題の核心はここにある	数字があっても検証できなければ同じリスク	このレベルを目指すことが今後の基準になる

「印象ベースの語り方」：向いている場面・向いていない場面

向いている場面：
- 社内の雰囲気を変えるための最初の一歩、導入前の空気づくり
- 経営会議の前段で「こういう可能性がある」と関心を喚起するとき

向いていない場面：
- 経営判断の根拠として提示するとき
- 社外（取引先・金融機関・顧客）に対してAI活用状況を説明するとき
- 来期の予算や体制を決めるための報告資料

フィノジェン現場から
「AIを使っていると伝えたら取引先に『どんな成果が出ていますか？』と聞かれ、答えられなかった」という声をよく聞く。印象ベースの語り方は社内の共感には有効でも、外部への説明責任を果たせないケースが多い。

「数字ベースの語り方」：向いている場面・向いていない場面

向いている場面：
- 経営層や管理職に進捗を報告するとき
- AI導入の継続投資を判断してもらうとき

向いていない場面：
- 測定方法や条件が不明確なまま数字だけを強調するとき
- 短期間の試験的な利用データを「効果あり」として一般化するとき

今回のKPMGのケースで問題になったのは、まさにこの段階だ。数字や事例が「ある」ように見えても、その測定方法や出典が確認できなければ、信頼の根拠にならない。

「AIをたくさん使った」は成果ではない——Amazonが社内ランキングを廃止して気づいたこと、中小企業が今すぐ設定すべきAI評価の3つの軸でも触れたとおり、「使用量」と「成果」は別物だ。数字があることと、その数字が信頼できることも別物である。

フィノジェン現場から
「週に何時間削減できたか集計してみたが、測る前と後で仕事の中身が変わっていたので比較できなかった」という会社が少なくない。数字を出す前に「何を・どう測るか」を決めることが先になる。

「検証可能な語り方」：向いている会社・向いていない会社

向いている会社：
- AI推進担当者がいて、記録を残す習慣がある
- 「失敗した試みも含めて正直に報告する」文化がある
- 社外への説明機会（融資・取引先・採用など）が増えている

向いていない会社：
- AI活用をまだ試し始めたばかりで、測定の仕組みが整っていない（→ まず「印象ベース」で始め、次の段階を目指す）
- 成果を出すより先に「報告書の体裁を整えること」が目的になっている

「検証可能な語り方」は、完璧な報告書を作ることが目的ではない。「誰かが後から確認しようとしたとき、根拠をたどれる状態にしておく」ということだ。それだけでKPMGが陥ったリスクの大部分を回避できる。

結論：状況別おすすめ

まずAI活用への関心を社内で広めたいなら → 印象ベースの語り方から始め、小さな成功体験を積み上げる
経営層や管理職に継続投資を説明したいなら → 数字ベースに移行し、測定条件を明示する習慣をつける
社外への説明責任・長期的な信頼構築を重視するなら → 検証可能な語り方を目指し、記録と測定の仕組みを整える

いきなり「検証可能な語り方」を目指す必要はない。今の自社のステージを正確に把握し、一段ずつ積み上げることが重要だ。

読む前に確認しておきたい言葉

言葉	一言で言うと	身近な例え
ハルシネーション	AIが事実と異なる「嘘」を自信満々に出力すること	記憶が曖昧なまま報告書に書いてしまう状態
検証可能性	他の人が同じ方法で確認できる状態	レシートや作業ログが残っていること
Faithful Uncertainty	AIが「わからない」と正直に留保して答える仕組み	「確認してから返答します」と言える担当者の状態

▶ 「一番いいAIを使えばいい」は間違いだった——Microsoftトップが語る費用対効果の発想が、中小企業のAI運用を変えるもあわせてご覧ください。
▶ 「このAIツール、来年も使えますか？」OpenAI・PerplexityのIPO申請が示す、中小企業がベンダー選びで今すぐ持つべき3つのチェックリストもあわせてご覧ください。

フィノジェンの見解：フィノジェン式AI報告信頼性チェック

自社のAI活用の「語り方」がどの段階にあるか、3つの問いで確認してほしい。

問い①：あなたの会社のAI活用報告に「どうやって測ったか」が書かれているか？

「時間が短縮された」「品質が上がった」という記述があるとき、その測定方法と期間が明示されているかを確認する。なければ、それは印象ベースの語り方だ。印象ベースが悪いわけではないが、「成果が出た」と断言する根拠にはならない。まず「何を・どの期間で・誰が測ったか」を記録する習慣から始めるとよい。

問い②：その数字や事例を、担当者以外の人が確認しようとしたら確認できるか？

KPMGの問題で問われたのは、まさにこの点だ。担当者の記憶や感覚にしか存在しない情報は、いくら数字の形をしていても「検証可能」とは言えない。作業ログ、ツールの使用履歴、業務記録——いずれかの形で根拠をたどれる状態にしておくことが、報告の信頼性を守る最低ラインになる。Google Workspaceの利用ログや、kintoneのような業務管理ツールに記録を残すだけでも大きく違う。

問い③：AI活用の「うまくいかなかったこと」も同じ場で語られているか？

成功事例だけを集めた報告は、結果として誇張になりやすい。「試したが効果が出なかった」「想定より時間がかかった」という情報を同じ温度感で共有できている組織は、AI活用の語り方として最も信頼性が高い。Perplexityで調べた情報が間違っていた、Notion AIで作った文章を修正する手間がかかったといった「失敗の記録」を隠さないことが、長期的な推進を支える。

よくある質問

Q. KPMGのような大きな会社の話が、うちのような中小企業に関係あるのでしょうか？

直接的なリスクは異なりますが、「語り方の問題」は規模に関係なく起きます。社内でのAI活用報告に誇張や曖昧な表現が混じると、経営判断の質が下がります。また取引先や金融機関にAI活用状況を説明する機会が増えている今、根拠のない語り方は信頼を損なうリスクになります。「うちは小さいから関係ない」ではなく、「小さいからこそ正直な語り方が信頼につながる」と考えることをお勧めします。

Q. 測定の仕組みを整えるには、専門的なツールや知識が必要ですか？

いいえ、最初は難しい仕組みは不要です。Excelやスプレッドシートに「作業内容・所要時間・AIを使ったか否か」を記録するだけで十分な出発点になります。Google Workspaceを使っている会社であれば、スプレッドシートにテンプレートを作るだけで記録が始められます。重要なのは精度よりも継続性です。まず1人の担当者が1週間分だけ記録してみることから始めてください。

Q. 社内でAI活用を報告するとき、「まだ成果が出ていない」と伝えても大丈夫ですか？

むしろ正直に伝えることが推奨されます。「成果が出ていないこと」を隠して無理に成果があるように語ると、後で修正が必要になり信頼を損ないます。「この期間試したが、現時点では〇〇の理由で効果が見えにくい。次のステップとして△△を試す予定」という形で語ることが、経営層にとって最も意思決定しやすい情報提供の形です。AIを入れる前に「うちの仕事を言葉にする」ことが最初の壁——中小企業がAI導入で失敗しない準備の3ステップも参考になります。

Q. AIが出力した文章や数字をそのまま報告書に使うのはリスクがありますか？

はい、リスクがあります。今回のKPMG事件も、AIのハルシネーション（事実と異なる出力）が原因の一つとして指摘されています。AIが出力した数字・事例・固有名詞は、必ず担当者が一次情報で確認する習慣が必要です。Google研究者が提案した「Faithful Uncertainty（AIが不確かな情報に留保をつけて答える仕組み）」のように、AIツール側の改善も進んでいますが、現時点では人間側の確認が不可欠です。Perplexityのような情報検索AIを使う場合でも、出力された参考URLを実際に開いて確認することを習慣にしてください。

Q. フィノジェンに相談するとどうなりますか？

まず無料相談から始められます。相談では「自社のAI活用の現状を整理し、どの段階にいるかを一緒に確認する」ところからスタートします。「何を測ればよいか」「社内でどう報告すれば信頼されるか」という具体的な問いにも、現場経験をもとに答えます。「何が問題かもよくわからない」という段階でも歓迎します。

行動プラン

今週中にできること（コストゼロ・1時間以内）
- 直近のAI活用報告や社内資料を1件取り出し、「どうやって測ったか」が書かれているか確認する
- AI作業の記録用スプレッドシートを1枚作り、「日付・作業内容・AIを使ったか・感想」の4列を用意する

今月中にできること
- 推進担当者と経営者が「成功した取り組み」と「うまくいかなかった取り組み」を両方共有する場を30分設ける

3か月後の理想像
社内のAI活用報告に「測定方法」と「うまくいかなかった事例」が自然に含まれるようになり、経営判断の質と社内の信頼感が同時に高まっている状態。

参考文献

KPMG Pulls Report on AI Usage Due to Apparent Hallucinations - https://techcrunch.com/2026/06/13/kpmg-pulls-report-on-ai-usage-due-to-apparent-hallucinations/
└ 今回の記事の主要事件であるKPMGのAI活用レポート取り下げの詳細を確認するために参照
Google Researchers Introduce "Faithful Uncertainty" Allowing LLMs to Offer Best Guesses Instead of Hallucinations - https://venturebeat.com/orchestration/google-researchers-introduce-faithful-uncertainty-allowing-llms-to-offer-best-guesses-instead-of-hallucinations
└ AIのハルシネーション問題への技術的アプローチを理解するために参照。語り方の信頼性と関連する
PixelRAG Beats Text Parsers on Accuracy and Cuts AI Agent Token Costs 10x - https://venturebeat.com/data/pixelrag-beats-text-parsers-on-accuracy-and-cuts-ai-agent-token-costs-10x
└ AI出力の精度改善における最新動向として、検証可能性の議論の背景理解に参照
OpenAI Faces Investigation from State Attorneys General - https://techcrunch.com/2026/06/13/openai-faces-investigation-from-state-attorneys-general/
└ AI企業の「説明責任」問題が規制当局の論点になっている背景として参照
Anthropic Shuts Down Fable, Mythos Models Following Trump Admin Directive - https://arstechnica.com/ai/2026/06/anthropic-shuts-down-fable-mythos-models-following-trump-admin-directive/
└ AIツールの供給リスクと企業の調達・評価方針の変化を示す事例として参照
Oracle Q4 2026 Earnings Call Summary - https://www.businessinsider.jp/article/2606-earnings-oracle-corporation-q4-2026-earnings-call-summary/
└ AI活用が企業評価・投資判断に与える影響の規模感を理解するために参照
中小企業のDX推進に関する調査（中小企業庁） - https://www.chusho.meti.go.jp/
└ 中小企業のAI・デジタル活用の現状と課題を把握するために参照
AIの信頼性・透明性に関するガイドライン（総務省） - https://www.soumu.go.jp/
└ AI活用の報告・評価における信頼性の基準として参照

著者より

私がこの問題を聞いて最初に感じたのは「他人事ではない」という感覚でした。KPMGほどの組織でも起きるなら、日々のAI活用報告に追われている推進担当者が同じ落とし穴に入ることは十分ありえます。「語り方を正直にする」ことは地味に見えますが、これが長く推進を続けるための一番の武器だと現場で実感しています。