CAIWA Service ViiiのRAG機能について詳しく紹介!ハルシネーションを回避する仕組みとは?

コラム

生成AIの急速な進化と優秀さが広く注目を集める一方で、誤った情報を生成してしまうハルシネーションの問題がしばしば議論の対象となっています。これらは学習データの品質やAIのアーキテクチャ、学習プロセスなどが要因となって発生してしまうものです。そこで、回答の品質を担保する手段の1つがRAGです。RAGは、LLMが生成する回答に対して、事前に外部の信頼性の高い情報を補完することで、誤情報の生成を抑える技術です。

通常、RAGシステムの構築には多くのリソースと時間が必要ですが、株式会社イクシーズラボが提供するCAIWA Service Viiiを導入することで、構築のプロセスを大幅に簡略化し、高度な技術を活用したRAGを簡単に運用できます。この記事では、CAIWA Service ViiiのRAG機能について詳しく紹介し、どのような強みがあるかについても解説します。

RAGとは

RAG(ラグ)はRetrieval-Augmented Generationを略したもので、日本語では検索拡張生成と訳されます。これだけでは意味がわかりにくいと思いますが、LLM(大規模言語モデル)による回答生成時に独自の外部情報を組み合わせることで、生成AIの回答精度を向上させる技術だと考えればよいでしょう。

(図1)

まず、ユーザーがアプリケーション(この図ではチャットUI)に質問を入力すると、検索システムが社内の資料を検索し、検索結果をアプリケーションに返します。次に、アプリケーションはユーザーの質問と検索結果を組み合わせ、それをプロンプトとしてLLMに渡します。そして、LLMが回答を生成し、その回答をアプリケーションがユーザーに提示します。これがRAGを利用した回答までの流れの概要です。つまり、生成AIが誤った情報に基づいてハルシネーション(誤回答)を行うリスクを軽減するために、事前に正しい情報をシステムに提供することで、回答の品質を向上させています。

RAGの導入効果は、誤回答の防止にとどまりません。通常の生成AI(例えばChatGPT)では対応できない企業固有の情報も、社内規定やマニュアル等の社内ドキュメントに基づき回答できるようになります。これにより、社内ヘルプデスク、カスタマーサポートとして使用でき、業務効率化およびナレッジ共有の強化につながります。

CAIWA Service ViiiのRAG機能「CAIWA Service Viii Powered by ChatGPT API」

株式会社イクシーズラボが提供するAIチャットボット「CAIWA Service Viii」には、「CAIWA Service Viii Powered by ChatGPT API」というRAG機能が搭載されています。この機能を活用することで、社内規程や業務手順といった企業独自の情報をAIチャットボットの回答に反映させることが可能です。CAIWA Service ViiiのRAG機能は、LLMにChatGPTのAPIを使用し、社内データを基に正確な回答を生成するほか、Q&Aデータの生成も行います。

CAIWA Service Viiiに実装されているRAG機能の特徴

(図2)

ChatGPT応答機能とQ&A自動生成機能の2種類を提供

図2では、右下にある「RAG」がCAIWA Service ViiiのRAG機能の中心的な部分を示しています。APIで接続されたLLM(ChatGPT)が、社内データ(ドキュメント)を基に回答を生成します。

さらに、ViiiのRAG機能にはQ&Aの生成機能があり、生成したQ&Aを独自開発AIのCAIWAに学習させることが可能です。

つまり、ドキュメントに基づいたチャットボットの応答機能(ChatGPT応答機能)と、Q&Aリストを自動生成する機能(Q&A自動生成機能)の2つの機能が提供されていることになります。

回答の生成には、社内文書、業務手順書、製品カタログ、マニュアル、メールの問い合わせ履歴などの非構造化データが利用可能で、これらのデータを後述する方法でアップロードするだけで、簡単にRAGの機能を活用できます。SharePointと連携させることも可能で、この場合SharePoint内のデータが更新されるとRAGに反映されるため、ほぼ手間をかけずに運用できるようになります。

モデルについては標準としてGPT-4o miniが使用されますが、予算や目的に応じてGPT-4oを選択することも可能です。

高度な技術を活用

CAIWA Service ViiiのRAGには、精度を上げるための高度な技術が活用されています。検索精度を高めるためのベクトル検索機能や高精度なチャンク抽出機能、テストを重ねて最適化されたプロンプトなどです。RAGによるチャットボットの回答精度を上げ、業務効率を高めるためには、単に生成AIを組み込むだけでは不十分です。回答を生成する前段階である、事前処理と検索の精度を高めることが重要です。

ChatGPT応答機能

「ChatGPT応答機能」ポイント
・独自AIとRAGの回答の両方をシームレスに取得
・一つのドキュメントに絞り込んで回答生成
・生成元表示によるファクトチェック
・事前設定はワンクリックでファイルアップロードするのみ

CAIWA(独自開発AI)とChatGPT(生成AI)の回答を比較可能

前章の図2をご覧いただくと、アプリケーションへの回答には2つのルートがあることがわかります。1つめは独自開発AIのCAIWAから抽出される回答(知識データから最適な回答を抽出)、2つめはRAGから生成される回答(ドキュメントから回答を生成)の2つのルートです。

(図3)

図3はCAIWA Service ViiiのAIチャットボットのUI(画面)を示していますが、画面下部右側にある2つのボタンで回答ルートを選択できます。下部の質問欄に質問を入力し、CAIWA(独自開発AI)からの回答が欲しい場合は青色の送信ボタンを、ChatGPT(生成AI)からの回答が欲しい場合は右側の緑色のボタンをクリックします。

ハルシネーションのリスクがなく、精査されたQ&Aデータに基づく正確な回答が必要な場合はCAIWAの回答(青色ボタン)を選択し、より広範囲な回答や回答の元になっているドキュメント名が必要な場合はChatGPTの回答(緑色ボタン)を選びます。状況に応じて両方の回答を取得し、同じ質問に対し異なる2つの回答を比較することで、誤回答に気づくことも可能です。

(図4)

独自開発AIであるCAIWAはハルシネーションのリスクがない代わりに、学習したQ&Aデータの範囲内での対応に限られます。そのため、範囲外の質問に対しては回答が得られない場合があります。そこで、図4の「生成AIにも同じ質問をしてみる」ボタンを押すことで、ChatGPTからも回答を得ることができます。別々のAIから回答を得られる本機能によって、問題解決の確率をさらに高めることができるでしょう。

回答生成に利用するドキュメントを一つに絞り高い回答精度を実現

複数のドキュメントにまたがったチャンクを利用して回答を生成すると、誤情報が含まれるリスクが高まります。イクシーズラボのRAGは、生成に利用するチャンクが属するドキュメントを一つに限定することで、回答の精度を大幅に向上させています。

さらに、図3に示されている「別の回答を見る」ボタンをクリックすると、次にマッチ度の高いドキュメントに基づいて生成された回答が表示されます。これにより、最初のドキュメントで解決できなかった場合でも、2つ目、3つ目と順に異なるドキュメントからの回答を確認できるため、問題解決のチャンスが広がります。

実際に導入した複数の企業が、この仕組みによる自己解決率の大幅な向上を実感しています。

今後は、ドキュメントをカテゴライズし、そのカテゴリ内に限定して回答を生成するなど、さらに精度を高めるための制御機能が追加される予定です。これにより、より高精度な回答が期待できます。

生成元ファイルを確認しファクトチェック可能

(図5)

CAIWA Service ViiiのAIチャットボットでChatGPTを使った場合には、回答の元となったドキュメント(生成元ファイル)が表示されます。たとえば図4の場合は、ユーザーからの質問に対して「03_育児・介護休業に関する規程.pdf」の内容を元にChatGPTが回答を生成していますが、回答に疑問がある場合やさらに詳細に知りたい場合などには、簡単に生成元ファイルを参照しファクトチェックができます

さらに、P.5 P.6 P.15と表示されていますがこれはページ番号で、質問内容に関連性の高いページを提示しています。クリックするとそのページを閲覧できます。複数ページにわたるドキュメント内から関連性の高いページのみ閲覧することで迅速に内容確認できます。(※一部のファイルフォーマットを除く)

事前設定はファイルアップロードするだけ!即利用可能

RAG機能を利用するための事前設定はファイルをアップロードするのみです。アップロードしたファイルは短時間でインデックス化されます。対応するファイルはPDFやPowerPoint、Word、Excel、テキスト、CSV形式のファイルです。社内規程や業務手順などが記載されたファイルには、ほぼ完全に対応しているといってもよいでしょう。新たな資料や更新したファイルについても、アップロードすることですぐに反映されるので導入後の運用もラクに行えます。

また、SharePointと連携することでSharePoint内のファイルが更新されると、自動で変更部分がすぐに反映されます。CAIWA Service ViiiのRAG機能には、導入(構築)と更新作業に手間のかからない機能が多く実装されています。

Q&A自動生成機能

Q&A自動生成機能のポイント
・ドキュメントからQ&Aを生成できる
・生成されたQ&A(エクセルで出力)は独自開発AIの知識データとして利用できる
・知識データへの格納はワンクリックでアップロードするのみ
・アップロードしたQ&Aは独自開発AI「CAIWA」の回答に利用
・生成されたQ&Aは編集可能なためハルシネーションリスクなし

クリック1回でQ&Aを自動生成

CAIWA Service ViiiのRAG機能には、クリック1回でQ&Aを自動生成する機能があります。図2のRAGにアップロードされた生成元ファイル(図2では社内データと表記)からQ&Aを自動生成し、CAIWAの知識データとして活用します。またRAGから生成されたQ&Aはエクセルの書式で出力されるので、自由に編集することも可能です。

(図6)

図5はCAIWA ROBOT MANAGER(管理ツール)にアップロードされた社内データです。この中からQ&Aを作成したい社内データを選択し「Q&A自動生成」のボタン(赤色)をクリックするだけで、自動的にQ&Aが生成されます。

生成したQ&Aは独自開発AIの知識データとして活用可能

(図7)

生成されたQ&AはExcelのファイル形式で出力でき、このファイルを独自開発AIであるCAIWAの知識データに格納すれば、すぐにCAIWAで活用できます。

知識データへの格納方法は簡単で、出力されたExcelファイルをアップロードするのみです。CAIWAはアップロードされたExcelファイル内のQ&Aを知識データとして学習し回答に利用します。

CAIWAは言葉の曖昧さに対応しながら、登録されたQ&Aの範囲内でユーザーに回答を提示します。そのため登録されていない質問には答えられませんが、回答内容の精査・編集・削除が可能であるため、誤情報が含まれるリスクがありません。

(図8)

また、このQ&AはCAIWA ROBOT MANAGERから編集することもできるので、万が一間違った内容や適切でない質問が生成されていた場合、この画面で質問や回答を修正・削除し再出力できます。また先述のようにRAGから出力するQ&Aはエクセルのファイル形式で生成されるので、CAIWA ROBOT MANAGERにログインできない別部署の方に回答内容をチェック・編集してもらうことも可能です。ChatGPTからの回答は編集できませんが、CAIWAでのQ&Aであればメンテナンスも簡単に行えます。

言語認識精度の高い独自開発AIを搭載したAIチャットボット CAIWA Service Viii

ここまで紹介してきたRAG機能を搭載したAIチャットボットが、株式会社イクシーズラボが提供するCAIWA Service Viii(カイワサービスヴィー)です。CAIWAはCommunication Agent with Intelligent Word Analyzerの略で、言語認識精度の高い自然言語処理エンジンです。

言語認識精度の高い自然言語処理エンジン CAIWA

人間の話す言葉や文章には表記の「ゆれ」が存在し、同じ意味でも違う表現をもっている場合があります。また日本語は主語が省略される場合があるなど、世界中の言語の中でも正確な理解が難しい言葉の1つです。CAIWAは高度な概念辞書と自然言語処理アルゴリズムにより、少ないデータ登録で高い言語認識を実現する自然言語処理エンジンです。CAIWAは豊富な利用実績による高い信頼性と安定性をもち、英語対応も可能で海外での利用実績もあります。

CAIWA Service Viiiの正答率の高さは、高い言語認識精度によってユーザーの質問を正しく理解しているからこそ実現できているといえるのです。またCAIWA Service Viiiには、社内文書の全文検索やMicrosoft Teamsとの連携機能など、業務効率を向上させる機能も満載されています。

クラウド、オンプレミスのどちらでも提供可能

CAIWA Service Viiiはクラウドとオンプレミス、どちらの形態でも提供可能です。たとえば社内データとして機密文書や研究開発資料など、機密性の高い資料を扱うのであればセキュリティ性の高いオンプレミス版をお選びいただけます。またサーバーの運用コストなどを省き、シンプルにAIチャットボットを使いたいのであれば、クラウド版のご利用がおすすめです。どちらの形態であっても、CAIWA Service Viiiには直感的に扱える構築・運用ツールの「CAIWA ROBOT MANAGER」がパッケージングされ、AIチャットボットのUIや知識データを簡単作成できます。またオプションのChatGPT API連携機能を活用すれば、AIチャットボットの構築・運用の手間をさらに解消できます。

※ChatGPT APIは外部システムのため、オンプレミスで利用する場合ChatGPT APIとの通信を許可していただく必要があります。

構築・運用の手間がかからないAIチャットボット

最後に、構築・運用の手間がかからないAIチャットボット、CAIWA Service Viiiの特徴をもう一度確認しておきましょう。

CAIWAエンジンとCAIWA ROBOT MANAGERで簡単構築とラクラク運用を実現

高い正答率

独自開発のCAIWAエンジンが、類義語・トレーニングフレーズなしでも高い正答率を提供

簡単構築・ラクラク運用

直感的に使えるCAIWA ROBOT MANAGERが、構築・運用の手間を解消

高い汎用性

ChatGPT APIやMicrosoft Teams、LINEとの連携、翻訳システムとの連携による多言語対応など、高い汎用性を実現

他システムとの連携

外部システムやアプリケーションと連携することで、幅広い顧客ニーズに対応可能

まとめ

AIチャットボットの構築・運用の手間を省き、社内ナレッジを効率的に活用できるRAG機能は、今や生成AIの利用には必須の機能となりつつあります。ただしその構築や運用のハードルは高く、せっかく導入したものの機能を十分に発揮できない可能性もあります。株式会社イクシーズラボが提供するCAIWA Service Viiiであれば、構築と運用に重点を置いた機能が豊富なので効率的なAIチャットボットの運用が可能になります。