論文の概要: Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes
- arxiv url: http://arxiv.org/abs/2603.14229v1
- Date: Sun, 15 Mar 2026 05:34:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.687614
- Title: Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes
- Title(参考訳): ハイブリッドデータレイクにおけるマルチモーダル・マルチホップ質問応答のためのエージェントDAG-Orchestrated Plannerフレームワーク
- Authors: Kirushikesh D B, Manish Kesarwani, Nishtha Madaan, Sameep Mehta, Aldrin Dennis, Siddarth Ajay, Rakesh B R, Renu Rajagopal, Sudheesh Kairali,
- Abstract要約: Agentic DAG-Orchestrated Transformer (A.DOT) Plannerはマルチモーダル・マルチホップ質問応答のためのフレームワークである。
A.DOTは、ユーザNLクエリを構造化および非構造化の両方にまたがる有向非巡回グラフ(DAG)実行計画にコンパイルする。
System Decomposes query into parallelizable sub-queries, includess schema-aware reasoning, and applied both structure and semantic validation。
- 参考スコア(独自算出の注目度): 5.276278723196607
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Enterprises increasingly need natural language (NL) question answering over hybrid data lakes that combine structured tables and unstructured documents. Current deployed solutions, including RAG-based systems, typically rely on brute-force retrieval from each store and post-hoc merging. Such approaches are inefficient and leaky, and more critically, they lack explicit support for multi-hop reasoning, where a query is decomposed into successive steps (hops) that may traverse back and forth between structured and unstructured sources. We present Agentic DAG-Orchestrated Transformer (A.DOT) Planner, a framework for multi-modal, multi-hop question answering, that compiles user NL queries into directed acyclic graph (DAG) execution plans spanning both structured and unstructured stores. The system decomposes queries into parallelizable sub-queries, incorporates schema-aware reasoning, and applies both structural and semantic validation before execution. The execution engine adheres to the generated DAG plan to coordinate concurrent retrieval across heterogeneous sources, route intermediate outputs to dependent sub-queries, and merge final results in strict accordance with the plan's logical dependencies. Advanced caching mechanisms, incorporating paraphrase-aware template matching, enable the system to detect equivalent queries and reuse prior DAG execution plans for rapid re-execution, while the DataOps System addresses validation feedback or execution errors. The proposed framework not only improves accuracy and latency, but also produces explicit evidence trails, enabling verification of retrieved content, tracing of data lineage, and fostering user trust in the system's outputs. On benchmark dataset, A.DOT achieves 14.8% absolute gain in correctness and 10.7% in completeness over baselines.
- Abstract(参考訳): 企業は、構造化テーブルと非構造化ドキュメントを組み合わせたハイブリッドデータレイクに対して、自然言語(NL)の回答をますます必要としています。
RAGベースのシステムを含む現在のデプロイソリューションは、通常、各ストアからのブルートフォース検索とポストホックマージに依存している。
このようなアプローチは非効率で漏れやすく、さらに重要なのは、クエリを連続的なステップ(ホップ)に分解して、構造化されたソースと非構造化されたソースを行き来する、というマルチホップ推論に対する明確なサポートがないことだ。
本稿では,マルチモーダル・マルチホップ質問応答のためのフレームワークであるエージェントDAG-Orchestrated Transformer (A.DOT) Plannerについて述べる。
このシステムはクエリを並列化可能なサブクエリに分解し、スキーマ対応推論を導入し、実行前に構造的およびセマンティックなバリデーションを適用する。
実行エンジンは生成したDAG計画に準拠し、異種ソース間で同時検索を協調し、中間出力を依存サブクエリにルーティングし、最終的な結果を計画の論理的依存関係に従って厳格にマージする。
パラフレーズ対応のテンプレートマッチングを取り入れた高度なキャッシュメカニズムにより、システムは同等のクエリを検出し、DAG実行計画の再利用を迅速に再実行し、DataOps Systemはバリデーションフィードバックや実行エラーに対処する。
提案するフレームワークは,精度とレイテンシの向上だけでなく,検索したコンテンツの検証,データのトレース,システムのアウトプットに対するユーザの信頼向上など,明確なエビデンストレイルも生成する。
ベンチマークデータセットでは、A.DOTは14.8%の正確性、そして10.7%の完全性を達成した。
関連論文リスト
- MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries [2.756584457554517]
Map-Disambiguate-Enrich-Reduce (MDER)はコンテキスト由来の3重記述を生成し、エンティティレベルの要約と統合する。
Decompose-Resolve (DR)は、ユーザクエリを解決可能なトリプルに分解し、知識グラフに格納する。
MDERとDRはLLM駆動のQAパイプラインを形成し、スパース、不完全、複雑なリレーショナルデータに対して堅牢である。
論文 参考訳(メタデータ) (2026-03-11T18:38:44Z) - SAGE: Structure Aware Graph Expansion for Retrieval of Heterogeneous Data [47.930782177987446]
不均一なコーパスに答える検索拡張された質問は、テキスト、テーブル、グラフノード間で接続されたエビデンスを必要とする。
標準レトリバーリーダーパイプラインは、独立にチャンクされたテキスト上の平坦な類似性検索を使用し、モダリティ間のマルチホップエビデンスチェーンを欠いている。
SAGE(Structure Aware Graph Expansion)フレームワークを提案する。これは、パーセンタイルベースのプルーニングとメタデータ駆動の類似性を利用して、チャンクレベルのグラフをオフラインで構築する。
暗黙的クロスモーダルコーパスと明示的スキーマグラフのエージェント検索であるSPARK(Structure Aware Planning Agent for Retrieval over Knowledge Graphs)のハイブリッド高密度スパース検索を用いて初期検索をインスタンス化する。
論文 参考訳(メタデータ) (2026-02-18T23:57:19Z) - SQuARE: Structured Query & Adaptive Retrieval Engine For Tabular Formats [0.0]
SQuAREはシートレベルの複雑なルーティングを備えたハイブリッド検索フレームワークである。
ヘッダの深さとマージ密度に基づいて連続的なスコアを計算する。
SQuAREは、検索精度とエンドツーエンドの回答精度の両方において、シングルストラテジーベースラインとChatGPT-4oを一貫して上回る。
論文 参考訳(メタデータ) (2025-12-03T22:11:45Z) - Learning to Route: A Rule-Driven Agent Framework for Hybrid-Source Retrieval-Augmented Generation [55.47971671635531]
大言語モデル(LLM)は、一般質問回答(QA)において顕著な性能を示した。
Retrieval-Augmented Generation (RAG)は、LLMを外部知識で強化することで、この制限に対処する。
既存のシステムは、主に構造化されていないドキュメントに依存しているが、主にリレーショナルデータベースを見下ろしている。
論文 参考訳(メタデータ) (2025-09-30T22:19:44Z) - The benefits of query-based KGQA systems for complex and temporal questions in LLM era [55.20230501807337]
大規模言語モデルは質問回答(QA)に優れていますが、マルチホップ推論や時間的質問には苦戦しています。
クエリベースの知識グラフ QA (KGQA) は、直接回答の代わりに実行可能なクエリを生成するモジュール形式の代替手段を提供する。
WikiData QAのためのマルチステージクエリベースのフレームワークについて検討し、課題のあるマルチホップと時間ベンチマークのパフォーマンスを向上させるマルチステージアプローチを提案する。
論文 参考訳(メタデータ) (2025-07-16T06:41:03Z) - eSapiens: A Real-World NLP Framework for Multimodal Document Understanding and Enterprise Knowledge Processing [6.450269621190948]
企業環境での質問応答システムeSapiensを紹介する。
eSapiensは、二重モジュールアーキテクチャを介して構造化データベースと非構造化コーパスをブリッジする。
我々は、RAGTruthベンチマークでeSapiensを評価し、完全性、幻覚、文脈利用といった重要な側面における性能を分析した。
論文 参考訳(メタデータ) (2025-06-20T06:07:20Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - Effective Instruction Parsing Plugin for Complex Logical Query Answering on Knowledge Graphs [51.33342412699939]
知識グラフクエリ埋め込み(KGQE)は、不完全なKGに対する複雑な推論のために、低次元KG空間に一階論理(FOL)クエリを埋め込むことを目的としている。
近年の研究では、FOLクエリの論理的セマンティクスをよりよく捉えるために、さまざまな外部情報(エンティティタイプや関係コンテキストなど)を統合している。
コードのようなクエリ命令から遅延クエリパターンをキャプチャする効果的なクエリ命令解析(QIPP)を提案する。
論文 参考訳(メタデータ) (2024-10-27T03:18:52Z) - REAPER: Reasoning based Retrieval Planning for Complex RAG Systems [3.160580413086215]
複雑なクエリは複数ステップの検索も必要です。
ほとんどのRAGエージェントは、推論と検索のステップをインターリーブすることで、このようなChain-of-Thoughtタスクを処理する。
エージェントベースのシステムよりもレイテンシが大幅に向上し、新規で目に見えないユースケースに容易にスケールできるようになりました。
論文 参考訳(メタデータ) (2024-07-26T07:05:54Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Scaling Up Knowledge Graph Creation to Large and Heterogeneous Data
Sources [2.732936573198251]
RDFナレッジグラフ(英: RDF knowledge graph, KG)は、異種データソースから生成された事実を表す強力なデータ構造である。
本稿では, 宣言的に特定されたKG生成プロセスの自動生成の問題に取り組む。
RDFマッピング言語(RML)で定義されたアサーションに従って、異種データをRDFトリプルに計画・変換する手法を提案する。
論文 参考訳(メタデータ) (2022-01-24T14:01:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。