【初心者必見】AI時代の常識RAG×MCP完全攻略：取り残される前に学ぶ7ステップ - AIメモ

1. 導入：なぜ今「RAG×MCP」を学ぶべきか
1. 1-1.いま、働いていてこんな悩みはありませんか？
〈比較表〉まずは全体像をサクッと
1-2. なぜRAG×MCPは「社会の常識」になるの？
1-3. 本記事で手に入ること
1-4. 読み方ガイド（途中で挫折しないコツ）
私のRAG×MCPの体験談
1. 参考（この章で触れた情報）
2. 基礎の超要約：RAG / MCPを1分でつかむ
3. 本編：RAG×MCPを一気に理解する「7ステップ」
1. 3-1. ステップ1｜目的定義と対象範囲
3-2. ステップ2｜RAGの土台づくり（データ整備）
3-3. ステップ3｜ベクトルDBと埋め込みの最小構成
3-4. ステップ4｜プロンプト設計と根拠提示
3-5. ステップ5｜MCPの理解（最短）
3-6. ステップ6｜MCPで業務データと接続する
3-7. ステップ7｜評価・運用（落とし穴を回避）
1. この章の参考（出典とURL）
4. すぐ使える事例の紹介（写経できる“型”だけ）
4-2. 営業/CS向けドキュメントQA（回答＋起票・通知まで）
まとめ

1. 導入：なぜ今「RAG×MCP」を学ぶべきか

1-1.いま、働いていてこんな悩みはありませんか？

社内に情報はあるのに、探すor聞く→読むor教えてもらう→理解が面倒（ムダが多い）

情報が溜まっているツールやデータの形式がバラバラでつながらない（手作業が残る）

AIが流行っているが、誤情報やセキュリティが不安で一歩目が出ない

ここを助けるのが

RAG（ラグ）＝AIが資料を探して、根拠つきで答えるしくみ。
MCP（エムシーピー）＝AIが会社のツールと安全につながるしくみ。

です。

〈比較表〉まずは全体像をサクッと

項目	RAG（検索拡張生成）	MCP（モデル・コンテキスト・プロトコル）	一緒に使うと
役目	AIが資料を探して要点を答える	AIが社内ツールと安全につなぐ	探す→答える→手続きまで一気通貫
強み	根拠を出せる／最新の情報もOK	最小の権限で安全＋記録が残る	回答と同時に申請等まで進める
例	マニュアルを引用して答える	DriveやCRMへ接続	申請フォーム自動表示

たとえると：
RAGは「図書室でぴったりの本を取ってきて、そのページを見せながら説明する先輩」
MCPは「USBケーブルのように、AIから各ツールへ安全に道具をつなぐ差し口」

1-2. なぜRAG×MCPは「社会の常識」になるの？

①情報収集が検索から“会話”へ移行してきているから。

今までは「ググって読む」。

これからはAIに聞くと、根拠つきで返ってくる。
この体験が社内においても当たり前になっていきます。

②バラバラのデータを“安全につなげられる”から

MCPがあると、AIがDriveや社内システムに必要なときだけ、必要最低限の権限で接続できます。

不用意に、漏れちゃいけない情報を、お客さんに回答してしまうことはありません。

③根拠がない答えはNGという要求にもこたえられるから

仕事では「どこに書いてある？」が超大事。

RAGは出典（どの資料にそれが書いてあるのか）を示しやすい。
信頼できる情報か、人間が判断できます。

やらない方がコスパが悪いから

RAGとMCPを組み合わせれば、問い合わせ対応や返答作業が大幅に短くなります。

システムを1,000万円で入れて、年収300万円の人を4人減らせるなら・・・

残念ですが、経営的にはやらない理由がないですよね。

これは、情報を探してきて回答するだけの人は淘汰されてしまう。とも言えますね。

大手が着々と採用を進めているから

主要なAI（Claude / GPT）やクラウドも、RAGやMCPの仕組みを整えています。

使いやすい土台がそろってきたので、どの会社もWEBサイトをもっているのと同じように、
どの会社にもその会社専用のデータベースが出来上がっていきます。

1-3. 本記事で手に入ること

RAGとMCPを1分　で理解（次の章でサクッと）
実装するための実務～7ステップ～（目標設定→運用→評価までの解説）
そのまま真似できる事例（FAQ、営業/CS）

ゆーてっく

今後、ますます導入が進んでいくRAG×MCPの仕組みと実務ステップを前もって知っておきましょう。

AIができる仕事の限界を知ることで、今後自分が身に着けるべきスキルや経験が浮かび上がってきます。

1-4. 読み方ガイド（途中で挫折しないコツ）

最短コース：2章（超要約）→3章（7ステップ）
じっくり：1章→2章→3章→4章（事例）→5章（チェック）
今すぐ動く：3章の各ステップ末尾にある「今やること」だけ先に実行

私のRAG×MCPの体験談

私の会社のシステム関連問い合わせはRAGのように検索すると、それに応じて回答をくれます。
社内問い合わせで使ったとき、AIが規程のページを見せながら答えるので、みんな安心して使えています。

さらに、MCPで申請フォームを自動で開くようにしたら、問い合わせと手入力が減り、「もう前には戻れない」と感じています。

参考（この章で触れた情報）

Model Context Protocol（公式解説／Anthropic）：https://www.anthropic.com/news/model-context-protocol
Model Context Protocol 公式サイト：https://modelcontextprotocol.io/
MCPのアーキテクチャ概要：https://modelcontextprotocol.io/docs/concepts/architecture
NVIDIA「What Is RAG?」：https://blogs.nvidia.com/blog/what-is-retrieval-augmented-generation/
NVIDIA「RAG 101（基礎解説）」：https://developer.nvidia.com/blog/rag-101-demystifying-retrieval-augmented-generation-pipelines/
Azure 参考実装「gpt-rag-mcp」：https://github.com/Azure/gpt-rag-mcp

根拠：RAGは「正確性と最新性の強化」手法、MCPは「AI↔外部システムの標準接続」。両者の補完で実務が繋がります。 Anthropic+3NVIDIA Blog+3NVIDIA Developer+3

2. 基礎の超要約：RAG / MCPを1分でつかむ

2-1. RAGとは（埋め込み→検索→生成）

RAG（ラグ）＝検索拡張生成。

かんたんに言うと、AIが先に社内の資料を探してから答えるしくみです。

RAGのポイントは3つだけ。

ポイント①
文章を数の並び（ベクトル）に変える
これを埋め込みと言って、意味が近い文章どうしが近づきます。

文章を数の並びに変換すると何がいいの？

これができる！その１：意味で探せる（キーワードに縛られない）
　同じ意味なら、言い回しが違ってもヒットします。
　例：「定期代の申請」⇔「通勤費の精算」⇔「交通費の手当」

これができる！その２：表記ゆらぎに強い（表記ゆれ・誤字・略語）
　「マニュアル」/「取説」/「トリセツ」/「manual」でも近くに並ぶので、
AIがマニュアルとトリセツって同じ意味なんだな。と理解してくれます。

これができる！その３：文脈でマッチする
　単語の一致ではなく、前後の意味まで加点。
　例：「リモート時の残業」は「在宅勤務の時間外」に近づく。

ポイント②
似ている資料をベクトルDBから探す
マニュアルや社内Wikiなどから関連が高い部分だけを取り出します。

ベクトルDB＝“意味で探せる図書館の本棚（例）
文章や画像をベクトル（意味の数列）に変えて保存し、
質問もベクトルにして“意味が近い順”に検索して一瞬でお目当ての情報を見つけます。

ポイント③ 見つけた資料を“根拠”として答える
引用や出典を付けやすいので、まちがい（幻覚）を減らせます。最新情報にも強いです。NVIDIA Blog

たとえば・・・RAGは図書室で該当ページを開いてから説明する先輩。
出典元となった社内資料が明確だから、信用してOK、ということですね。

2-2. MCPとは（AI用“接続の標準規格”＝外部ツール/データと安全接続）

MCP（エムシーピー）＝Model Context Protocol。

これはAI用のUSB端子みたいなもの。ほかのツールにも差せる差し口。

もしこれがないと、AIは毎回バラバラの線で道具につながることになり、
危ない・面倒・壊れやすい状態になります。

MCPは、下の4つの“よくある道具”にAIを安全につなぐためのツールです。

① Drive（ドライブ）＝みんなのファイル置き場

例：Google ドライブ、OneDrive など
イメージ：学校の共有フォルダ。プリント（PDF）や写真、表などを入れておく場所。
何が便利？：AIがここから必要な資料だけ読んで答えを作れる。
MCPだと：「見るだけ」など最小限の権限で接続。編集や削除は禁止にもできる。

② CRM（シーアールエム）＝お客さんノート

正式名：Customer Relationship Management（顧客管理）
イメージ：お店の顧客カード。名前、連絡先、過去のやり取り、見積の履歴がまとまった名簿。
何が便利？：AIが「この会社との最近のやり取りは？」に要点で答えられる。
MCPだと：検索だけOKにするなど、できることを限定して安全に使える。

③ Wiki（ウィキ）＝社内の百科事典／共同ノート

例：Confluence、Notion、社内Wiki など
イメージ：学校のきまりノート。ルール、手順、マニュアル、よくある質問をみんなで書き足す場所。
何が便利？：AIが最新版のやり方を見つけて、根拠付きで説明できる。
MCPだと：最新版だけ読む、機密ページは入れないなど細かく制御できる。

④ チケット（課題管理）＝依頼票・修理伝票

例：Jira、Zendesk、ServiceNow、GitHub Issues など
イメージ：「やることカード」。何を・誰が・いつまでに、を記録して進捗を追うもの。
何が便利？：AIが質問に答えたついでに依頼票を作成したり、担当者へ自動で通知できる。
MCPだと：「作成だけ」「状態を更新だけ」といったボタン化ができ、承認ステップも挟める。

RAG×MCPの仕組みの主役は3つ（誰が何をする？）

たとえ：ホスト＝教室、クライアント＝連絡係、サーバー＝各教室の先生。

役割：許可された道具（ツール）だけを実行し、結果を返す。

ホスト（Host）＝AIアプリ本体

例：あなたが使うチャット画面。
役割：質問を受け取り、AIの答えを表示する「居場所」。

クライアント（Client）＝通訳兼配線係

役割：ホストの中で、AIの「この道具を使ってくれ」という依頼が通じるように翻訳・配線する。
イメージ：連絡係が、正しい先生（サーバー）に正しい依頼を回す。

サーバー（Server）＝道具の受付窓口

役割：許可された道具（ツール）だけを実行し、結果を返す。

RAG（正しい情報を根拠付で教えてくれる先輩）だけがいて、

MCP（AI用の接続口）がないとどうなるの？

例｜経費の質問を社内のAIにした場合・・・

MCPなし：回答はできても、正しい申請フォームを安全に開けない

MCPあり：RAGで規程を根拠提示→MCPで閲覧専用のフォルダから既定の最新版を参照→申請フォームをユーザーに自動表示できる！

例｜不具合対応（顧客対応）をAIを使って行った場合・・・

MCPなし：回答後、別画面で人がやることカードを作成。→抜け漏れが起きるし、お客さんの待ち時間も長くなる。

MCPあり：RAGで回答を送信→MCPでやることカードを自動で起票＆社内チャットへの通知まで自動でやってくれる。しかも誰が何をしたかログも残るので、抜け漏れの確認もOK！

2-3. RAG×MCPの関係（RAG＝事実参照、MCP＝行動・連携／一緒に使うと業務に直結）

かんたんに言うと：

・RAGは「AIに資料を持ってこさせる」仕組み
・MCPは「AIに安全なコンセント（接続口）を与える」仕組み

3. 本編：RAG×MCPを一気に理解する「7ステップ」

ここからは実務上の順番です。

簡単に理解していただくことを念頭に書いていきます。

具体的にRAGをどう作るの？社内の資料はどうやって読み込ませるの？

等の超具体的な内容は別の記事で詳しく説明します。

開発する予定がない方も

ふーん、こんな流れで問い合わせの自動化とかってするんだなー

くらいに理解しておいてください！

3-1. ステップ1｜目的定義と対象範囲

まず“AIに何をさせたいか”をひとつに絞る。
対象が広いと品質が散ります。最初は次のどれか：

(A) 社内FAQ：経費／勤怠／PC／規程など
(B) ドキュメントQA：製品仕様／マニュアル／手順書
(C) 営業・CS支援：見積条件／不具合の一次対応／導入要件

KPI（効果を測るものさし）も先に決める：

根拠つき正答率（引用と合っているか）
一次回答率（人の手なしで解決した割合）
削減時間（検索→読解→要約→転記の短縮）

やること

A/B/Cから1つだけ選ぶ

KPIを3つ決め、目標値を置く（例：正答率80%／一次60%／月100時間削減）

3-2. ステップ2｜RAGの土台づくり（データ整備）

RAGの質は材料＝読み込ませる社内文書の質と量で決まります。
順番は「整える → 分ける → 目印を付ける」。

最新版だけ集める（旧版は「除外フォルダ」へ退避）
チャンク設計（= 文章を羅列ではなく小分けにしておく作業）：
- 文章：見出し単位（1〜3段落）
- 表：行/セル単位で取れる形に
メタデータ（タグ）を付ける：
- 部門／版数／更新日／機密区分等（例：人事_経費規程_v3_2025-08-01_社外秘）

やること

対象の資料10〜50本を選ぶ

見出しで分割＋更新日/版/機密のタグ付け

3-3. ステップ3｜ベクトルDBと埋め込みの最小構成

埋め込み＝文章を意味ベクトルに変換。
ベクトルDB＝「意味の近さ」で上位を高速検索する倉庫。

埋め込みモデル：日本語強め／多言語対応のどちらかを選定
ベクトルDB：まずはFAISSやChromaなど軽量でOK
検索設定の初期値：
- Top-k = 3〜5（該当した文章の上位何件を回答の参考にするか

やること

10本だけ埋め込み→Top-k=3で検索

代表10問で「取れたチャンク」が質問意図に合うか目視

合わなければ、チャンク長／タグ／モデルの順で見直し

3-4. ステップ4｜プロンプト設計と根拠提示

プロンプト＝AIへの指示書。
ここで問い合わせしてきたユーザーへの“答え方”を型にします。

出力の型（鉄板）：
1. 結論（先にズバッと）
2. 根拠（出典名／見出し／該当文／更新日／リンク）
3. 次の一歩（フォームや担当、関連Q&A）
ガードレール：
- 根拠がないときははっきりと「不明」と回答させる
- 推測禁止、曖昧質問には聞き返しテンプレで確認
口調：社内向けはていねい＋短文、専門語は（カッコで説明）　等

やること

「結論→根拠→次の一歩」テンプレを1つ作成

テスト3問で同じ形に出るか確認

根拠の必須項目（出典/見出し/更新日/場所）をルール化して必ず出力するようにする

3-5. ステップ5｜MCPの理解（最短）

MCP＝AIとツールの“接続口”。
登場人物は3つだけ覚えれば十分：

ホスト：AIアプリ本体（チャット画面）

クライアント：通訳・配線係（AIの指示を正しい入口へ）

サーバー：道具の玄関（Drive／お客さんノート＝CRM／社内百科＝Wiki／依頼票＝チケット等）

やり取りはJSON-RPCという標準の文法で行い、
「見るだけ／検索だけ／作成だけ」の最小権限とログ（誰が・何を・いつ）で安全運用ができます。

やること

自社のホスト／クライアント／サーバーを1枚図にする

サーバーごとに許可する道具（ツール）をメニュー表にする

例：Drive＝ファイル検索のみ、Wiki＝閲覧のみ、チケット＝作成のみ

3-6. ステップ6｜MCPで業務データと接続する

接続は“小さく・安全に”始めます。
（極端ですが、すべての社内資料へのアクセス＋編集権限を与えてエラーですべて消える。とか最悪）

推奨の順番（書き込みはテストして最後に実装）：

共有Drive（閲覧のみ）
Wiki/Confluence（最新版を読むだけ）
チケット／CRM（限定的に書き込みを解放）

守りの4点セットも最初から：

最小権限（必要機能だけ）
鍵（APIキー）は分離・命名・期限・定期交換
ホワイトリスト（許可した入口だけAIに開放する）
ログ保存＋重要操作は人の目で確認をする

やること

読み取り専用の1系統だけ接続してみる

「Drive → RAG → 根拠つき回答」まで処理通す

台帳（発行者／用途／期限）を作る

3-7. ステップ7｜評価・運用（落とし穴を回避）

“作って終わり”が一番の罠。
2週間サイクルで測る → 直すを回します。

KPI（最低これだけ）

根拠つき正答率
一次回答率
平均応答時間
削減時間（1件◯分×件数×人数）

直し方の順番

データ（不足／古い／チャンク大きすぎ・小さすぎ）
検索（Top-k・MMR・メタデータ絞り）
プロンプト（結論→根拠→次の一歩、推測禁止）

コスト・遅延の三種の神器

キャッシュ（同質問は再利用）
チャンク縮小（不要文を削る）
再ランキング（ノイズ除去）

やること

よくある質問、代表50問をスプレッドシートで管理

2週間でKPIを更新、「原因→対策→担当」を1行で記録

月末にやめる施策／伸ばす施策を決める

この章の参考（出典とURL）

Azure 参考実装：gpt-rag-mcp（GitHub）
https://github.com/Azure/gpt-rag-mcpーーーーーーーーーーーーーーーーーーーーーーーーーーー

What Is Retrieval-Augmented Generation?（NVIDIA Blog）
https://blogs.nvidia.com/blog/what-is-retrieval-augmented-generation/

RAG 101: Demystifying Retrieval-Augmented Generation Pipelines（NVIDIA Developer）
https://developer.nvidia.com/blog/rag-101-demystifying-retrieval-augmented-generation-pipelines/

Explainer: What Is RAG?（NVIDIA Developer）
https://developer.nvidia.com/blog/explainer-what-is-retrieval-augmented-generation/

Introducing the Model Context Protocol（Anthropic）
https://www.anthropic.com/news/model-context-protocol

MCP Architecture / Concepts（modelcontextprotocol.io）
https://modelcontextprotocol.io/docs/concepts/architecture

4. すぐ使える事例の紹介（写経できる“型”だけ）

4-1. 社内FAQ（RAG×MCPの最短テンプレ）

これを作ると何がいい？

経費・勤怠・IT窓口・社内規程の質問に根拠つきで即答できるようになる！
ついでに関連フォームを自動で開くところまで一気通貫で実行できる！

用意するもの

社内資料の束（最新版のみ）：経費規程・勤怠ルール・IT手順書　等
チャンク済みデータ：見出し単位（1〜3段落）、表は行/セル単位
メタデータ：更新日／版／機密／部門　を明記
ベクトル検索：Top-k=3〜5＋MMR（似すぎ回避）
MCPツール：
- Drive：ファイル検索（閲覧のみ）
- Forms/ワークフロー：申請フォームを開く（URL発行のみ）
- （重要操作は人の確認を入れられる設計）

MMRって？

一言でいうと

MMRは「似すぎる候補を避けて、バラけた良い根拠を選ぶ並べ替えルール」です。
関連性（質問との近さ）だけで上位を並べると、ほぼ同じ内容がズラッと並びがち。
MMRは、関連性の高さとお互いの違いのバランスを取って、被らない根拠セットを作ります。

なぜ必要？

ベクトル検索は「近いもの」を取るのが得意 → 結果が同じ話ばかりになりやすい
回答に使う根拠は、別角度の情報が混ざった方が信頼性が上がる
ユーザーが読む量も少なく、分かりやすくなる

たとえ話

友だちに観光スポットを3つおすすめするとき、
「全部“海”」より「海・山・街」みたいにバラけた方が嬉しいですよね？
MMRはこの“バラけ”を自動でやってくれます。

会話の流れ（RAG→MCP）

ユーザーの質問：「通勤費の申請期限は？」
RAGがやること：
- ベクトル検索で規程の該当見出しをTop-k取得
- 出典名／見出し／更新日／抜粋を添えて回答
MCPがやること：
- 「申請する」を選ぶと、権限：閲覧のみのDriveから最新版フォーマットを確認
- 申請フォームを自動で開く（URL提示）

出力＝AIの回答テンプレ（例）

結論：通勤費の申請期限は 毎月●日 です。
根拠：人事_経費規程_v3（更新日：2025-04-01） > 第2章交通費 該当文：「申請は毎月●日までに行うこと」
場所：社内Drive / 規程フォルダ
次の一歩：[申請フォームを開く]（MCPツール実行）

まずやること（To-Do）

FAQ 50問をスプレッドシート化 → 各問に正解URL・更新日を紐づけ
MCPのメニューを2つだけ有効化：ファイル検索（閲覧）／申請フォームを開く
2週間で根拠つき正答率／一次回答率／削減時間を計測（最低この3つ）

この仕組みは問い合わせ対応にも応用できますね！

例えば、

「〇〇という取り組みを考えているんだけど、使えそうな補助金はある？」

という見込み客からの質問に対して、前もってRAGに各補助金の公募要領を読み込ませておけば

はい、あります。〇〇補助金と××補助金が候補としてあります。
あなたの会社の設立年や社員数、資本金額をお送りいただければ申請の対象になるか、ご判断してお返事します。

といった回答ができます。

MCP機能を利用して、無料面談などの予約を受け付ければ、ユーザー側も時間を無駄にしなくて済みますよね！

4-2. 営業/CS向けドキュメントQA（回答＋起票・通知まで）

これを作ると何がいい？

製品仕様の質問に根拠つき回答を返し、必要ならチケット起票やSlack通知まで自動化できる。

用意するもの（最小）

資料：製品仕様書、リリースノート、トラブルシューティング、FAQ
チャンク＆タグ：モジュール名／バージョン／更新日
ベクトル検索：ハイブリッド（キーワード合致性50％、意味の地近さ50％とかで設計）
MCPツール：
- Wiki/ナレッジ：閲覧のみ
- チケット：作成／状態更新（限定）
- Slack：特定チャンネルへ通知

会話の流れ（RAG→MCP）

ユーザー：「v2.1 からTLS設定は必須になったの？」
RAG：
- ハイブリッド検索で「v2.1」「TLS」など固有名詞も拾う
- 仕様書/リリースノートの該当箇所を根拠つきで要約
MCP（必要なときだけ）：
- 「問題として記録」を押す → Jira/Zendesk等にテンプレ起票
- 併せてSlack#cs-issuesに通知（要約＋根拠URL）

出力テンプレ（例）

結論：v2.1 以降はTLSが必須です。
根拠：製品仕様_v2.1（更新日：2025-02-14）> セキュリティ設定 > TLS 該当文：「v2.1 からTLS有効化をデフォルトとする」
場所：Wiki / 製品仕様（閲覧のみ）
次の一歩：[チケットを作成]（影響範囲：A社、期限：本日+3日）／[Slackに共有]（要約+根拠URL）