- 1. 導入:なぜ今「RAG×MCP」を学ぶべきか
- 〈比較表〉まずは全体像をサクッと
- 1-2. なぜRAG×MCPは「社会の常識」になるの?
- 1-3. 本記事で手に入ること
- 1-4. 読み方ガイド(途中で挫折しないコツ)
- 私のRAG×MCPの体験談
- 2. 基礎の超要約:RAG / MCPを1分でつかむ
- 3. 本編:RAG×MCPを一気に理解する「7ステップ」
- 3-2. ステップ2|RAGの土台づくり(データ整備)
- 3-3. ステップ3|ベクトルDBと埋め込みの最小構成
- 3-4. ステップ4|プロンプト設計と根拠提示
- 3-5. ステップ5|MCPの理解(最短)
- 3-6. ステップ6|MCPで業務データと接続する
- 3-7. ステップ7|評価・運用(落とし穴を回避)
- 4. すぐ使える事例の紹介(写経できる“型”だけ)
- 4-2. 営業/CS向けドキュメントQA(回答+起票・通知まで)
- まとめ
1. 導入:なぜ今「RAG×MCP」を学ぶべきか
1-1.いま、働いていてこんな悩みはありませんか?
社内に情報はあるのに、探すor聞く→読むor教えてもらう→理解が面倒(ムダが多い)
情報が溜まっているツールやデータの形式がバラバラでつながらない(手作業が残る)
AIが流行っているが、誤情報やセキュリティが不安で一歩目が出ない
ここを助けるのが
RAG(ラグ)=AIが資料を探して、根拠つきで答えるしくみ。
MCP(エムシーピー)=AIが会社のツールと安全につながるしくみ。
です。
〈比較表〉まずは全体像をサクッと
| 項目 | RAG(検索拡張生成) | MCP(モデル・コンテキスト・プロトコル) | 一緒に使うと |
|---|---|---|---|
| 役目 | AIが資料を探して要点を答える | AIが社内ツールと安全につなぐ | 探す→答える→手続きまで一気通貫 |
| 強み | 根拠を出せる/最新の情報もOK | 最小の権限で安全+記録が残る | 回答と同時に申請等まで進める |
| 例 | マニュアルを引用して答える | DriveやCRMへ接続 | 申請フォーム自動表示 |
たとえると:
RAGは「図書室でぴったりの本を取ってきて、そのページを見せながら説明する先輩」
MCPは「USBケーブルのように、AIから各ツールへ安全に道具をつなぐ差し口」
1-2. なぜRAG×MCPは「社会の常識」になるの?
①情報収集が検索から“会話”へ移行してきているから。
今までは「ググって読む」。
これからはAIに聞くと、根拠つきで返ってくる。
この体験が社内においても当たり前になっていきます。
②バラバラのデータを“安全につなげられる”から
MCPがあると、AIがDriveや社内システムに必要なときだけ、必要最低限の権限で接続できます。
不用意に、漏れちゃいけない情報を、お客さんに回答してしまうことはありません。
③根拠がない答えはNGという要求にもこたえられるから
仕事では「どこに書いてある?」が超大事。
RAGは出典(どの資料にそれが書いてあるのか)を示しやすい。
信頼できる情報か、人間が判断できます。
やらない方がコスパが悪いから
RAGとMCPを組み合わせれば、問い合わせ対応や返答作業が大幅に短くなります。
システムを1,000万円で入れて、年収300万円の人を4人減らせるなら・・・
残念ですが、経営的にはやらない理由がないですよね。
これは、情報を探してきて回答するだけの人は淘汰されてしまう。とも言えますね。
大手が着々と採用を進めているから
主要なAI(Claude / GPT)やクラウドも、RAGやMCPの仕組みを整えています。
使いやすい土台がそろってきたので、どの会社もWEBサイトをもっているのと同じように、
どの会社にもその会社専用のデータベースが出来上がっていきます。
1-3. 本記事で手に入ること
- RAGとMCPを1分 で理解(次の章でサクッと)
- 実装するための実務~7ステップ~(目標設定→運用→評価までの解説)
- そのまま真似できる事例(FAQ、営業/CS)
ゆーてっく今後、ますます導入が進んでいくRAG×MCPの仕組みと実務ステップを前もって知っておきましょう。
AIができる仕事の限界を知ることで、今後自分が身に着けるべきスキルや経験が浮かび上がってきます。
1-4. 読み方ガイド(途中で挫折しないコツ)
- 最短コース:2章(超要約)→3章(7ステップ)
- じっくり:1章→2章→3章→4章(事例)→5章(チェック)
- 今すぐ動く:3章の各ステップ末尾にある「今やること」だけ先に実行
私のRAG×MCPの体験談
私の会社のシステム関連問い合わせはRAGのように検索すると、それに応じて回答をくれます。
社内問い合わせで使ったとき、AIが規程のページを見せながら答えるので、みんな安心して使えています。
さらに、MCPで申請フォームを自動で開くようにしたら、問い合わせと手入力が減り、「もう前には戻れない」と感じています。
参考(この章で触れた情報)
- Model Context Protocol(公式解説/Anthropic):https://www.anthropic.com/news/model-context-protocol
- Model Context Protocol 公式サイト:https://modelcontextprotocol.io/
- MCPのアーキテクチャ概要:https://modelcontextprotocol.io/docs/concepts/architecture
- NVIDIA「What Is RAG?」:https://blogs.nvidia.com/blog/what-is-retrieval-augmented-generation/
- NVIDIA「RAG 101(基礎解説)」:https://developer.nvidia.com/blog/rag-101-demystifying-retrieval-augmented-generation-pipelines/
- Azure 参考実装「gpt-rag-mcp」:https://github.com/Azure/gpt-rag-mcp
根拠:RAGは「正確性と最新性の強化」手法、MCPは「AI↔外部システムの標準接続」。両者の補完で実務が繋がります。 Anthropic+3NVIDIA Blog+3NVIDIA Developer+3
2. 基礎の超要約:RAG / MCPを1分でつかむ
2-1. RAGとは(埋め込み→検索→生成)

RAG(ラグ)=検索拡張生成。
かんたんに言うと、AIが先に社内の資料を探してから答えるしくみです。
RAGのポイントは3つだけ。
ポイント①
文章を数の並び(ベクトル)に変える
これを埋め込みと言って、意味が近い文章どうしが近づきます。
文章を数の並びに変換すると何がいいの?
これができる!その1:意味で探せる(キーワードに縛られない)
同じ意味なら、言い回しが違ってもヒットします。
例:「定期代の申請」⇔「通勤費の精算」⇔「交通費の手当」
これができる!その2:表記ゆらぎに強い(表記ゆれ・誤字・略語)
「マニュアル」/「取説」/「トリセツ」/「manual」でも近くに並ぶので、
AIがマニュアルとトリセツって同じ意味なんだな。と理解してくれます。
これができる!その3:文脈でマッチする
単語の一致ではなく、前後の意味まで加点。
例:「リモート時の残業」は「在宅勤務の時間外」に近づく。
ポイント②
似ている資料をベクトルDBから探す
マニュアルや社内Wikiなどから関連が高い部分だけを取り出します。
ベクトルDB=“意味で探せる図書館の本棚(例)
文章や画像をベクトル(意味の数列)に変えて保存し、
質問もベクトルにして“意味が近い順”に検索して一瞬でお目当ての情報を見つけます。
ポイント③ 見つけた資料を“根拠”として答える
引用や出典を付けやすいので、まちがい(幻覚)を減らせます。最新情報にも強いです。NVIDIA Blog
たとえば・・・RAGは図書室で該当ページを開いてから説明する先輩。
出典元となった社内資料が明確だから、信用してOK、ということですね。
2-2. MCPとは(AI用“接続の標準規格”=外部ツール/データと安全接続)

MCP(エムシーピー)=Model Context Protocol。
これはAI用のUSB端子みたいなもの。ほかのツールにも差せる差し口。
もしこれがないと、AIは毎回バラバラの線で道具につながることになり、
危ない・面倒・壊れやすい状態になります。
MCPは、下の4つの“よくある道具”にAIを安全につなぐためのツールです。
① Drive(ドライブ)=みんなのファイル置き場
- 例:Google ドライブ、OneDrive など
- イメージ:学校の共有フォルダ。プリント(PDF)や写真、表などを入れておく場所。
- 何が便利?:AIがここから必要な資料だけ読んで答えを作れる。
- MCPだと:「見るだけ」など最小限の権限で接続。編集や削除は禁止にもできる。
② CRM(シーアールエム)=お客さんノート
- 正式名:Customer Relationship Management(顧客管理)
- イメージ:お店の顧客カード。名前、連絡先、過去のやり取り、見積の履歴がまとまった名簿。
- 何が便利?:AIが「この会社との最近のやり取りは?」に要点で答えられる。
- MCPだと:検索だけOKにするなど、できることを限定して安全に使える。
③ Wiki(ウィキ)=社内の百科事典/共同ノート
- 例:Confluence、Notion、社内Wiki など
- イメージ:学校のきまりノート。ルール、手順、マニュアル、よくある質問をみんなで書き足す場所。
- 何が便利?:AIが最新版のやり方を見つけて、根拠付きで説明できる。
- MCPだと:最新版だけ読む、機密ページは入れないなど細かく制御できる。
④ チケット(課題管理)=依頼票・修理伝票
- 例:Jira、Zendesk、ServiceNow、GitHub Issues など
- イメージ:「やることカード」。何を・誰が・いつまでに、を記録して進捗を追うもの。
- 何が便利?:AIが質問に答えたついでに依頼票を作成したり、担当者へ自動で通知できる。
- MCPだと:「作成だけ」「状態を更新だけ」といったボタン化ができ、承認ステップも挟める。
RAG×MCPの仕組みの主役は3つ(誰が何をする?)

たとえ:ホスト=教室、クライアント=連絡係、サーバー=各教室の先生。
役割:許可された道具(ツール)だけを実行し、結果を返す。
ホスト(Host)=AIアプリ本体
- 例:あなたが使うチャット画面。
- 役割:質問を受け取り、AIの答えを表示する「居場所」。
クライアント(Client)=通訳兼配線係
- 役割:ホストの中で、AIの「この道具を使ってくれ」という依頼が通じるように翻訳・配線する。
- イメージ:連絡係が、正しい先生(サーバー)に正しい依頼を回す。
サーバー(Server)=道具の受付窓口
役割:許可された道具(ツール)だけを実行し、結果を返す。
RAG(正しい情報を根拠付で教えてくれる先輩)だけがいて、
MCP(AI用の接続口)がないとどうなるの?
例|経費の質問を社内のAIにした場合・・・
MCPなし:回答はできても、正しい申請フォームを安全に開けない
MCPあり:RAGで規程を根拠提示→MCPで閲覧専用のフォルダから既定の最新版を参照→申請フォームをユーザーに自動表示できる!
例|不具合対応(顧客対応)をAIを使って行った場合・・・
MCPなし:回答後、別画面で人がやることカードを作成。→抜け漏れが起きるし、お客さんの待ち時間も長くなる。
MCPあり:RAGで回答を送信→MCPでやることカードを自動で起票&社内チャットへの通知まで自動でやってくれる。しかも誰が何をしたかログも残るので、抜け漏れの確認もOK!
2-3. RAG×MCPの関係(RAG=事実参照、MCP=行動・連携/一緒に使うと業務に直結)
かんたんに言うと:
・RAGは「AIに資料を持ってこさせる」仕組み
・MCPは「AIに安全なコンセント(接続口)を与える」仕組み
3. 本編:RAG×MCPを一気に理解する「7ステップ」
ここからは実務上の順番です。
簡単に理解していただくことを念頭に書いていきます。
具体的にRAGをどう作るの?社内の資料はどうやって読み込ませるの?
等の超具体的な内容は別の記事で詳しく説明します。
開発する予定がない方も
ふーん、こんな流れで問い合わせの自動化とかってするんだなー
くらいに理解しておいてください!
3-1. ステップ1|目的定義と対象範囲
まず“AIに何をさせたいか”をひとつに絞る。
対象が広いと品質が散ります。最初は次のどれか:
- (A) 社内FAQ:経費/勤怠/PC/規程 など
- (B) ドキュメントQA:製品仕様/マニュアル/手順書
- (C) 営業・CS支援:見積条件/不具合の一次対応/導入要件
KPI(効果を測るものさし)も先に決める:
- 根拠つき正答率(引用と合っているか)
- 一次回答率(人の手なしで解決した割合)
- 削減時間(検索→読解→要約→転記の短縮)
やること
- A/B/Cから1つだけ選ぶ
- KPIを3つ決め、目標値を置く(例:正答率80%/一次60%/月100時間削減)
3-2. ステップ2|RAGの土台づくり(データ整備)
RAGの質は材料=読み込ませる社内文書の質と量で決まります。
順番は「整える → 分ける → 目印を付ける」。
- 最新版だけ集める(旧版は「除外フォルダ」へ退避)
- チャンク設計(= 文章を羅列ではなく小分けにしておく作業):
- 文章:見出し単位(1〜3段落)
- 表:行/セル単位で取れる形に
- メタデータ(タグ)を付ける:
- 部門/版数/更新日/機密区分等(例:人事_経費規程_v3_2025-08-01_社外秘)
やること
- 対象の資料10〜50本を選ぶ
- 見出しで分割+更新日/版/機密のタグ付け
3-3. ステップ3|ベクトルDBと埋め込みの最小構成
埋め込み=文章を意味ベクトルに変換。
ベクトルDB=「意味の近さ」で上位を高速検索する倉庫。
- 埋め込みモデル:日本語強め/多言語対応のどちらかを選定
- ベクトルDB:まずはFAISSやChromaなど軽量でOK
- 検索設定の初期値:
- Top-k = 3〜5(該当した文章の上位何件を回答の参考にするか
やること
- 10本だけ埋め込み→Top-k=3で検索
- 代表10問で「取れたチャンク」が質問意図に合うか目視
- 合わなければ、チャンク長/タグ/モデルの順で見直し
3-4. ステップ4|プロンプト設計と根拠提示
プロンプト=AIへの指示書。
ここで問い合わせしてきたユーザーへの“答え方”を型にします。
- 出力の型(鉄板):
- 結論(先にズバッと)
- 根拠(出典名/見出し/該当文/更新日/リンク)
- 次の一歩(フォームや担当、関連Q&A)
- ガードレール:
- 根拠がないときははっきりと「不明」と回答させる
- 推測禁止、曖昧質問には聞き返しテンプレで確認
- 口調:社内向けはていねい+短文、専門語は(カッコで説明) 等
やること
- 「結論→根拠→次の一歩」テンプレを1つ作成
- テスト3問で同じ形に出るか確認
- 根拠の必須項目(出典/見出し/更新日/場所)をルール化して必ず出力するようにする
3-5. ステップ5|MCPの理解(最短)
MCP=AIとツールの“接続口”。
登場人物は3つだけ覚えれば十分:
ホスト:AIアプリ本体(チャット画面)
クライアント:通訳・配線係(AIの指示を正しい入口へ)
サーバー:道具の玄関(Drive/お客さんノート=CRM/社内百科=Wiki/依頼票=チケット 等)
やり取りはJSON-RPCという標準の文法で行い、
「見るだけ/検索だけ/作成だけ」の最小権限とログ(誰が・何を・いつ)で安全運用ができます。
やること
- 自社のホスト/クライアント/サーバーを1枚図にする
- サーバーごとに許可する道具(ツール)をメニュー表にする
- 例:Drive=ファイル検索のみ、Wiki=閲覧のみ、チケット=作成のみ
3-6. ステップ6|MCPで業務データと接続する
接続は“小さく・安全に”始めます。
(極端ですが、すべての社内資料へのアクセス+編集権限を与えてエラーですべて消える。とか最悪)
推奨の順番(書き込みはテストして最後に実装):
- 共有Drive(閲覧のみ)
- Wiki/Confluence(最新版を読むだけ)
- チケット/CRM(限定的に書き込みを解放)
守りの4点セットも最初から:
- 最小権限(必要機能だけ)
- 鍵(APIキー)は分離・命名・期限・定期交換
- ホワイトリスト(許可した入口だけAIに開放する)
- ログ保存+重要操作は人の目で確認をする
やること
- 読み取り専用の1系統だけ接続してみる
- 「Drive → RAG → 根拠つき回答」まで処理通す
- 台帳(発行者/用途/期限)を作る
3-7. ステップ7|評価・運用(落とし穴を回避)
“作って終わり”が一番の罠。
2週間サイクルで測る → 直すを回します。
KPI(最低これだけ)
- 根拠つき正答率
- 一次回答率
- 平均応答時間
- 削減時間(1件◯分×件数×人数)
直し方の順番
- データ(不足/古い/チャンク大きすぎ・小さすぎ)
- 検索(Top-k・MMR・メタデータ絞り)
- プロンプト(結論→根拠→次の一歩、推測禁止)
コスト・遅延の三種の神器
- キャッシュ(同質問は再利用)
- チャンク縮小(不要文を削る)
- 再ランキング(ノイズ除去)
やること
- よくある質問、代表50問をスプレッドシートで管理
- 2週間でKPIを更新、「原因→対策→担当」を1行で記録
- 月末にやめる施策/伸ばす施策を決める
この章の参考(出典とURL)
Azure 参考実装:gpt-rag-mcp(GitHub)
https://github.com/Azure/gpt-rag-mcpーーーーーーーーーーーーーーーーーーーーーーーーーーー
What Is Retrieval-Augmented Generation?(NVIDIA Blog)
https://blogs.nvidia.com/blog/what-is-retrieval-augmented-generation/
RAG 101: Demystifying Retrieval-Augmented Generation Pipelines(NVIDIA Developer)
https://developer.nvidia.com/blog/rag-101-demystifying-retrieval-augmented-generation-pipelines/
Explainer: What Is RAG?(NVIDIA Developer)
https://developer.nvidia.com/blog/explainer-what-is-retrieval-augmented-generation/
Introducing the Model Context Protocol(Anthropic)
https://www.anthropic.com/news/model-context-protocol
MCP Architecture / Concepts(modelcontextprotocol.io)
https://modelcontextprotocol.io/docs/concepts/architecture
4. すぐ使える事例の紹介(写経できる“型”だけ)
4-1. 社内FAQ(RAG×MCPの最短テンプレ)

これを作ると何がいい?
- 経費・勤怠・IT窓口・社内規程の質問に根拠つきで即答できるようになる!
- ついでに関連フォームを自動で開くところまで一気通貫で実行できる!
用意するもの
- 社内資料の束(最新版のみ):経費規程・勤怠ルール・IT手順書 等
- チャンク済みデータ:見出し単位(1〜3段落)、表は行/セル単位
- メタデータ:更新日/版/機密/部門 を明記
- ベクトル検索:Top-k=3〜5+MMR(似すぎ回避)
- MCPツール:
- Drive:ファイル検索(閲覧のみ)
- Forms/ワークフロー:申請フォームを開く(URL発行のみ)
- (重要操作は人の確認を入れられる設計)
MMRって?
一言でいうと
MMRは「似すぎる候補を避けて、バラけた良い根拠を選ぶ並べ替えルール」です。
関連性(質問との近さ)だけで上位を並べると、ほぼ同じ内容がズラッと並びがち。
MMRは、関連性の高さとお互いの違いのバランスを取って、被らない根拠セットを作ります。
なぜ必要?
- ベクトル検索は「近いもの」を取るのが得意 → 結果が同じ話ばかりになりやすい
- 回答に使う根拠は、別角度の情報が混ざった方が信頼性が上がる
- ユーザーが読む量も少なく、分かりやすくなる
たとえ話
友だちに観光スポットを3つおすすめするとき、
「全部“海”」より「海・山・街」みたいにバラけた方が嬉しいですよね?
MMRはこの“バラけ”を自動でやってくれます。
会話の流れ(RAG→MCP)
- ユーザーの質問: 「通勤費の申請期限は?」
- RAGがやること:
- ベクトル検索で規程の該当見出しをTop-k取得
- 出典名/見出し/更新日/抜粋を添えて回答
- MCPがやること:
- 「申請する」を選ぶと、権限:閲覧のみのDriveから最新版フォーマットを確認
- 申請フォームを自動で開く(URL提示)
出力=AIの回答テンプレ(例)
- 結論:通勤費の申請期限は 毎月●日 です。
- 根拠:
人事_経費規程_v3(更新日:2025-04-01) > 第2章 交通費該当文:「申請は毎月●日までに行うこと」
場所:社内Drive / 規程フォルダ - 次の一歩:[申請フォームを開く](MCPツール実行)
まずやること(To-Do)
- FAQ 50問をスプレッドシート化 → 各問に正解URL・更新日を紐づけ
- MCPのメニューを2つだけ有効化:ファイル検索(閲覧)/申請フォームを開く
- 2週間で根拠つき正答率/一次回答率/削減時間を計測(最低この3つ)
この仕組みは問い合わせ対応にも応用できますね!

例えば、
「〇〇という取り組みを考えているんだけど、使えそうな補助金はある?」
という見込み客からの質問に対して、前もってRAGに各補助金の公募要領を読み込ませておけば
はい、あります。〇〇補助金と××補助金が候補としてあります。
あなたの会社の設立年や社員数、資本金額をお送りいただければ申請の対象になるか、ご判断してお返事します。
といった回答ができます。
MCP機能を利用して、無料面談などの予約を受け付ければ、ユーザー側も時間を無駄にしなくて済みますよね!
4-2. 営業/CS向けドキュメントQA(回答+起票・通知まで)
これを作ると何がいい?
- 製品仕様の質問に根拠つき回答を返し、必要ならチケット起票やSlack通知まで自動化できる。
用意するもの(最小)
- 資料:製品仕様書、リリースノート、トラブルシューティング、FAQ
- チャンク&タグ:モジュール名/バージョン/更新日
- ベクトル検索:ハイブリッド(キーワード合致性50%、意味の地近さ50%とかで設計)
- MCPツール:
- Wiki/ナレッジ:閲覧のみ
- チケット:作成/状態更新(限定)
- Slack:特定チャンネルへ通知
会話の流れ(RAG→MCP)
- ユーザー: 「v2.1 からTLS設定は必須になったの?」
- RAG:
- ハイブリッド検索で「v2.1」「TLS」など固有名詞も拾う
- 仕様書/リリースノートの該当箇所を根拠つきで要約
- MCP(必要なときだけ):
- 「問題として記録」を押す → Jira/Zendesk等にテンプレ起票
- 併せてSlack#cs-issuesに通知(要約+根拠URL)
出力テンプレ(例)
- 結論:v2.1 以降はTLSが必須です。
- 根拠:
製品仕様_v2.1(更新日:2025-02-14)> セキュリティ設定 > TLS該当文:「v2.1 からTLS有効化をデフォルトとする」
場所:Wiki / 製品仕様(閲覧のみ) - 次の一歩:[チケットを作成](影響範囲:A社、期限:本日+3日)/[Slackに共有](要約+根拠URL)
まとめ
今回は、少しむずかしかったかもしれないけれど
RAGとMCPの“仕組みと構造”を知ったうえで使うかどうかで、使いこなしの深さは本当に大きく変わります。
RAGは「どの資料を根拠に答えるか」を設計でき、
MCPは「どの道具に、どこまで安全につなぐか」を設計できる
仕組みがわかると、正確さ・スピード・安全性を自分で調整できるようになります。
この先も、AIを“仕組み理解ベース”で使いこなす人が仕事を前に進めます。
「なんとなく使う」から一歩抜け出して、今日から小さく試してみましょう。
そのほかのAIの豆知識(超短い図解やコツ)はInstagramで配信中です。
「埋め込みの選び方」「MMRのカンどころ」「プロンプトの守り方」など。
よければフォローしてください👇
▶︎ Instagram:[@yutech_ai](プロフィールリンクからどうぞ)



コメント