MENU
AI DEMO – RAG
【AIデモ閲覧を申し込む】RAG(検索拡張生成)
このAIデモの概要
RAG(検索拡張生成)のデモ。「物流業界において、膨大なマニュアルをもとに生成AIが回答する」というユースケースを想定して設計しております。

・Multi-Query(マルチクエリ展開)
・分散一致
・HyDE(仮想回答生成)
といった弊社が研究している内容も含めて最新の設計となっております。

デモ版となりますので比較的単純な設計・インフラの制約上精度にもあえて限界を設けておりますが、
開発を行う際は貴社のデータに合わせて最適な設計・最高の精度を追求いたします。
企業について
株式会社ニューラルオプト

AIの研究開発を目的に設立され、機械学習・人工知能の開発にバックグラウンドを持つエンジニアを中心に編成。韓国企業であるEBIT Co. Ltd. との提携のもと「Scale AI」を通じたAI開発(言語・数学・音声・ソフトウェアなど幅広い分野におけるデータラベリング・RLHF)に携わっています。

設計・機能について

システム概要

本RAG(Retrieval-Augmented Generation)システムは、企業マニュアルや業務文書から正確な情報を検索・回答するために、複数の高度な技術を組み合わせたデモンストレーションです。従来の単純なキーワード検索では実現できなかった高精度な情報検索を、11の機能を統合することで実現しています。

主要機能の詳細

1. 意図抽出(Intent Extraction)

まず、LLM(大規模言語モデル)がユーザーの質問を分析し、「どの会社について聞いているか」「何を検索すべきか」をJSON形式で抽出します。たとえば「A社の報告書を紛失したときの対応を教えて」という質問から、会社名「A社」と核となるキーワード「報告書 紛失 対応」を自動的に取り出すのです。

これにより、曖昧な言い回しで質問されても検索対象が定まり、複数企業のマニュアルが混在する環境でも他社の情報が混ざり込むことを防げます。

2. 単語クエリ化

次に、抽出されたキーワードと会社名をスペース区切りの単語列に変換します。文章形式のままだと余分な助詞や接続詞がノイズになりますが、単語だけに整理することで検索エンジンとの相性が良くなり、一致率が向上します。

「報告書 紛失」といった実務でよく使われる簡潔な検索方法に近づくため、直感的で高速な検索が可能になります。

3. Multi-Query(マルチクエリ展開)

1つのクエリをそのまま検索するのではなく、複数の言い換え表現に自動変換してそれぞれで検索を行います。たとえば「受入」というキーワードなら「受け取り」「受領」「納品確認」といった類義語でも検索するのです。

これにより表記ゆれに強くなり、1回の検索では拾えなかった関連文書もヒットするようになります。マニュアルの書き方が統一されていない場合でも、必要な情報を見逃しません。

4. メタデータフィルタ

検索の段階で、意図抽出で特定された会社名に一致する文書だけを対象とします。文書には会社名が小分類などのメタデータとして付与されているため、この情報で事前に絞り込むことで、他社のルールや無関係な文書が結果に紛れ込むのを完全に防ぎます。

検索対象が絞られることで精度が上がるだけでなく、処理速度も改善されます。

5. スコアリング(項目・内容への加点)

検索でヒットした文書に対して、会社名の一致や「項目」「内容」といったフィールドへのキーワード一致を基準に点数を付けていきます。特に見出しや重要項目にキーワードが含まれている文書には高い点数が与えられるため、より関連性の高い文書が上位に並びます。

LLMだけに任せず、こうしたルールベースのスコアリングも併用することで、検索結果の再現性と信頼性が高まります。

6. 重複統合

Multi-Queryで複数の言い換え検索を実行すると、同じ文書が異なるクエリで何度もヒットすることがあります。その際、同一文書のスコアを合算して1つにまとめることで、複数のクエリで共通してヒットする文書を上位に押し上げます。

表記ゆれに対応しながらも、ノイズとなる無関係な文書が増えにくいバランスの取れた検索結果が得られます。

7. Reranker(リランカー:LLM再評価)

初期検索で得られた上位候補を、改めてLLMで評価し直します。単語の一致だけでは判断できない文脈や意味の近さを考慮して、ランキングを並べ替えるのです。

たとえば「手順」と「方法」のように字面は違っても意味が近い表現や、文全体の主旨が質問と合致しているかを判断できます。この結果、最も重要な「一番上に表示される回答の精度」が大幅に向上し、ユーザーは最初に見た情報で求めていた答えを得られる確率が高まります。

8. Deepdive(ディープダイブ:自動再検索)

検索結果を見て、質問に対して不適切だとシステムが判断した場合、クエリを自動的に書き換えて再検索を実行します。

つまり、一度目の検索が失敗してもシステムが別のアプローチを試すため、ユーザーが質問を言い換えたり何度も入力し直したりする必要がありません。一度の質問で、より確実に答えにたどり着けるようになっています。

9. 列またぎ一致(分散一致ボーナス)

「ラベルをプリンターで印刷する手順」のように、複数の要素が組み合わさった質問に対応するための機能です。マニュアルでは「ラベル」が小分類に、「プリンター」が項目に、「印刷手順」が内容にと、情報が複数の列に分散して記載されていることがあります。

このような場合に限り追加スコアを付与することで、分割記載された情報も正確に抽出できます。通常の単一概念検索には影響を与えず、複雑な質問でのみ効果を発揮する設計になっています。

10. HyDE(ハイド:仮想回答生成)

質問に対して「おそらくこう書いてあるだろう」という想定回答文をLLMで事前に生成し、その文章から検索語彙を抽出して補強します。たとえば「納品後の検品はどうするか」という質問なら、「納品物を受け取ったら、まず数量を確認し、次に外観をチェックします」といった回答例を作り、そこから「数量確認」「外観チェック」といった語彙を拾うのです。

これによりマニュアルに実際に使われている表現に近い言葉で検索でき、抽象的な質問や専門用語を知らない状態での質問でも適切な文書を見つけやすくなります。

11. 進捗・デバッグ情報出力

各処理工程でどれだけ時間がかかったか、どのような意図が抽出されたか、どんなクエリが生成されたかといった内部情報を返します。システムの動作が可視化されることで、どこで時間がかかっているか、どのような判断で検索が行われたかを把握できます。

運用中の速度や精度のボトルネックを特定しやすくなり、継続的な改善やカスタマイズの判断材料として活用できます。

AI活用オンライン無料相談とは?
AIの活用におけるお悩み・壁打ちを、
企業のデジタル活用・製品やサービスへのAI埋め込みによる付加価値向上を見据えて
1on1形式(30分程度)でディスカッションいただける無料相談企画です。

具体的なイメージが全く決まっていなくとも、どのような形で貴社の競争力強化に繋げられるか、
一緒に向き合わせていただきます。
人員について
代表取締役
鈴木佑理
東京外国語大学卒業後、大規模言語モデルBERTなどの機械学習を活用したマーケティングツールの研究開発を目的にニューラルオプトを創業。
エンジニア
本田直輝
京都大学薬学部を卒業後、AIチャットボット構築や業務システム開発、DX支援などを中心に、全国の中小企業・スタートアップの改善パートナーとして活動中。
エンジニア
古谷優輝
東京農工大学大学院工学府修士課程を修了後、外資系自動車会社にてエンジニアとして自動運転のAI開発などに従事。クライアントのAI開発やSEOツールの開発、RAGなどベクトル検索を活用した検索エンジン開発なども行っています。
運営会社
株式会社ニューラルオプト

AIの研究開発を目的に設立され、機械学習・人工知能の開発にバックグラウンドを持つエンジニアを中心に編成。韓国企業であるEBIT Co. Ltd. との提携のもと「Scale AI」を通じたAI開発(言語・数学・音声・ソフトウェアなど幅広い分野におけるデータラベリング・RLHF)に携わっています。

目次