生成AIの活用が一般的になっている昨今、「AIの回答の信頼性」に疑問を抱く声も少なくありません。
そこで信頼できるAIの回答を出力できるRAG(検索拡張生成)に注目されています。
今回は、RAGの概要や仕組み、検索方式の種類、導入事例などを解説します。
RAGのメリットとデメリットが分かるので、RAG導入の検討にお役立てください。
RAGの仕組みは?【検索・生成の2段階で構成】
RAG(検索拡張生成)とは、LLM(大規模言語モデル)が外部にある情報を検索することで、より高精度な回答を生成する技術です。外部情報を「検索フェーズ」で取得し、収集したデータを参考に「生成フェーズ」で回答を生成します。
AI技術を詳しく知りたい方は、
「AI技術とは?人工知能にできることや活用事例・導入方法を解説」
「RAGとは?生成AIとの関係や導入メリット・ポイントを解説」
をご覧ください。
検索フェーズ:情報を外部データから検索
検索フェーズでは、外部情報(最新ニュースや自社の内部情報、各種レポートなど)を検索エンジンから取得します。
RAG搭載の生成AIシステムに質問すると、入力内容が数値ベクトル(入力した文字を数値の配列に変換する作業)に変換されます。次に数値ベクトルを基に外部情報から類似度検索を行い、最も関連性の高いデータを収集します。
検索結果で得られた情報は、生成フェーズでのプロンプト(AIへの指示文章)に組み込まれ、最適な回答の作成に活用されます。
生成フェーズ:検索結果をLLMに反映
生成フェーズでは、検索フェーズで収集した外部情報を基に、ユーザーの質問に対する回答を生成します。
検索フェーズで取得した関連情報をユーザーの質問と統合し、それをLLM(例:ChatGPTなど)へ入力します。LLMへの入力に外部データ(コンテキスト)を含めることで、ハルシネーション(事実と異なる情報を生成する現象)を抑え、最新基準の正しい回答を生成できます。
RAGの検索方式の種類
RAGの検索に使用される代表的な3つの検索方式があるので、解説します。
ベクトル検索:単語の関連情報を抽出する方式
ベクトル検索は、入力データ(文章や画像など)を数値ベクトルに変換して単語の関連情報を抽出する方式です。
ベクトル検索は、ベクトル間の距離を計測することで類似性を判断できる仕組みになっています。これにより、素早く関連情報を抽出できるので、迅速な回答が可能です。
RAGのベクトル検索は、社内文書を効率的に検索する方式として活用されるケースが多いです。

キーワード検索:単語の類似度を基に抽出する方式
キーワード検索は、入力したキーワードの類似度(文字列の一致やパターンマッチングなど)から検索する方式です。
類似文書の検索では、TF-IDF(単語の重要度を測る指標)を基に文書間の類似性を評価しています。従来の検索エンジンと同様に幅広い情報源から該当データを抽出することが可能です。

ハイブリット検索:それぞれの欠点を補った方式
ハイブリッド検索は、ベクトル検索とキーワード検索など、異なる検索手法を組み合わせた方式です。
ハイブリット検索は、各検索方法の欠点を相互に補うことで、より高い精度で情報抽出が可能です。ハイブリッド検索を採用すると、RAGの回答精度の向上が期待できます。
RAGの導入事例を紹介
RAGは、さまざまな企業や団体などで活用されています。ここからは、実際にRAGを活用した導入事例を3つのケースに分けてご紹介します。
社内情報検索の効率化
LINEヤフー株式会社は、RAGを活用した独自ツール「SeekAI」を全従業員向けに開発しました。このツールは、エンジニアが技術情報を検索する際やカスタマーサポート業務などに活用されています。
RAGを採用したことで、約98%という高精度な回答を得られました。この事例は、RAGとAIモデルの連携により、検索効率が大幅に向上した代表例といえます。
建設企業の労働災害防止
東洋建設株式会社では、「K-SAFE東洋 RAG適用Version」という労働災害事例検索システムを導入しました。このシステムは、社内基準にもとづいた情報を素早く抽出し、労働災害防止に向けた対策を講じる上で大きな役割を果たしています。
RAGを活用することで、質問の根拠となる資料を同時に提示できるため、より説得力のある安全指導を行うことが可能です。また、画像を併用することにより、情報共有がしやすくなりました。
メーカーの研究開発における技術継承
ライオン株式会社では、研究開発部門にRAGを導入して、研究レポートや特許、論文などを検索できるシステムを開発しました。
これにより、重複する実験の削減や過去の失敗事例の活用などが進み、技術継承と研究開発の効率向上などに役立てています。
まとめ
RAGは、LLMが外部情報を活用して高精度な回答を生成する技術です。検索フェーズでユーザー入力を数値ベクトル化し、外部データから関連する情報を抽出します。続く生成フェーズでその情報をプロンプトに組み込み、LLMが最適な回答を生成します。
最新の外部情報を活用するRAGは、リアルタイムな情報更新が求められるシーンに最適な手法であり、AIモデルの進化とともに今後ますます重要性を増していくと考えられます。