Fugu-MT 論文翻訳(概要): Structure-Aware RAG: Structured Retrieval Augmented Generation from Noisy Data for Conversational Agents

論文の概要: Structure-Aware RAG: Structured Retrieval Augmented Generation from Noisy Data for Conversational Agents

arxiv url: http://arxiv.org/abs/2605.24366v1
Date: Sat, 23 May 2026 03:07:33 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-26 19:50:17.956746
Title: Structure-Aware RAG: Structured Retrieval Augmented Generation from Noisy Data for Conversational Agents
Title（参考訳）: 構造対応RAG:会話エージェントのための雑音データからの構造化検索生成
Authors: Kaiqiao Han, LuAn Tang, Renliang Sun, Peng Yuan, Wei Cheng, Haoyu Wang, Wei Wang, Yizhou Sun, Haifeng Chen,
Abstract要約: SA-RAG(Structure-aware Retrieval Augmented Generation)は、テーブルを中間構造表現として使用して、コンパクトで制御可能なインターフェースを提供する。メタデータの正規化と有効性をモデル化する品質対応のテーブルメタデータ生成フレームワークを提案する。 2つのノイズの多い実世界のデータセットの実験は、SA-RAGが既存のRAGベースラインを大幅に上回っていることを示している。
参考スコア（独自算出の注目度）: 68.52563127206808
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Large Language Models (LLMs) have been widely adopted in conversational applications. However, their reliance on parametric knowledge limits reliability in real-world scenarios that require dynamic or domain-specific information. Retrieval-Augmented Generation (RAG) addresses this limitation by incorporating external knowledge during generation, but existing text-based and graph-based RAG methods often struggle with noisy or irrelevant contexts. In this work, we propose Structure-aware Retrieval Augmented Generation (SA-RAG), which uses tables as an intermediate structured representation to provide a compact and controllable interface that reduces noise while preserving essential information. We introduce a quality-aware table metadata generation framework that models metadata normalization and effectiveness, improving metadata quality and downstream performance. Furthermore, we explore both training-free and training-based table generation methods. Generation validation and direct preference optimization further improve table quality while maintaining semantic and structural consistency. Experiments on two noisy real-world datasets show that SA-RAG significantly outperforms existing RAG baselines. Our code is publicly available at a public repository.
Abstract（参考訳）: 大規模言語モデル(LLM)は会話型アプリケーションで広く採用されている。しかし、パラメトリック知識への依存は、動的またはドメイン固有の情報を必要とする現実のシナリオにおける信頼性を制限する。 Retrieval-Augmented Generation (RAG) は、生成中に外部知識を取り入れることで、この制限に対処するが、既存のテキストベースおよびグラフベースのRAGメソッドは、しばしばノイズや無関係なコンテキストに悩まされる。本研究では, テーブルを中間構造表現として使用し, 基本情報を保持しつつ, ノイズを低減し, 制御可能なインタフェースを提供する構造対応検索拡張生成(SA-RAG)を提案する。本稿では、メタデータの正規化と有効性をモデル化し、メタデータの品質と下流のパフォーマンスを向上させる品質対応のテーブルメタデータ生成フレームワークを提案する。さらに、トレーニングフリーとトレーニングベースの両方のテーブル生成手法について検討する。生成バリデーションと直接選好最適化により、セマンティックと構造的整合性を維持しながら、テーブルの品質が向上する。 2つのノイズの多い実世界のデータセットの実験は、SA-RAGが既存のRAGベースラインを大幅に上回っていることを示している。私たちのコードはパブリックリポジトリで公開されています。

関連論文リスト

FT-RAG: A Fine-grained Retrieval-Augmented Generation Framework for Complex Table Reasoning [1.5612868551214847]
FT-RAGは,表を意味単位に分解することで,知識関連性を生かした,きめ細かいフレームワークである。 FT-RAGは、すべての指標で最高パフォーマンスのベースラインを上回っている。本手法は,複合モダリティ文書に対する複雑な推論のための新しい最先端性能を確立する。
論文参考訳（メタデータ） (2026-05-02T15:32:26Z)
DCD: Domain-Oriented Design for Controlled Retrieval-Augmented Generation [0.0]
DCD(Domain-Collection-Document)は,RAGシステムにおいて,基礎となる言語モデルを変更することなくクエリ処理を構造化・制御するためのドメイン指向設計である。提案手法は,構造化モデル出力に基づく情報空間の階層的分解と多段階ルーティングに依存する。本稿では、DCDアーキテクチャとワークフローを説明し、合成評価データセットにおける結果について議論し、適用されたRAGシナリオにおけるロバスト性、事実精度、回答関連性への影響を強調した。
論文参考訳（メタデータ） (2026-04-08T20:47:51Z)
Adaptive Guidance for Retrieval-Augmented Masked Diffusion Models [60.25003813232697]
本稿では,Masked Diffusion Models (MDMs) のトレーニング自由適応ガイダンスフレームワークとして,適応検索型Masked Diffusion (ARAM) を提案する。 ARAMは、検索した文脈によって誘導される分布シフトのSNR(Signal-to-Noise Ratio)に従って、雑音発生時の誘導スケールを校正する。複数の知識集約型QAベンチマークの実験は、ARAMが競争力のあるRAGベースラインよりも全体的なQA性能を改善することを示している。
論文参考訳（メタデータ） (2026-03-18T12:54:50Z)
Disco-RAG: Discourse-Aware Retrieval-Augmented Generation [81.53888908988756]
生成プロセスに談話信号を注入する談話認識フレームワークであるディスコRAGを提案する。提案手法は,チャンク内談話木を構築し,局所階層を捕捉し,クロスパスコヒーレンスをモデル化するためのチャンク間修辞グラフを構築する。質問応答と長期文書要約ベンチマークの実験から,提案手法の有効性が示された。
論文参考訳（メタデータ） (2026-01-07T20:32:50Z)
Structure-R1: Dynamically Leveraging Structural Knowledge in LLM Reasoning through Reinforcement Learning [29.722512436773638]
本稿では,検索したコンテンツを推論に最適化した構造化表現に変換するフレームワークであるtextscStructure-R1を提案する。 textscStructure-R1は、7Bスケールのバックボーンモデルとの競合性能を一貫して達成していることを示す。我々の理論的分析は,情報密度と文脈的明瞭度を向上させることによって,構造化表現が推論をいかに促進するかを示す。
論文参考訳（メタデータ） (2025-10-16T23:19:28Z)
RAG-IGBench: Innovative Evaluation for RAG-based Interleaved Generation in Open-domain Question Answering [50.42577862494645]
本稿では,RAG-IG(Retrieval-Augmented Generation)に基づくインターリーブドジェネレーション(Interleaved Generation)の課題を評価するためのベンチマークであるRAG-IGBenchを提案する。 RAG-IGは、MLLM(Multimodal large language model)と検索機構を統合し、モデルがコヒーレントなマルチモーダルコンテンツを生成するための外部画像テキスト情報にアクセスできるようにする。
論文参考訳（メタデータ） (2025-10-11T03:06:39Z)
Dynamic Context Tuning for Retrieval-Augmented Generation: Enhancing Multi-Turn Planning and Tool Adaptation [0.0]
マルチターン対話とツール環境の進化をサポートするためにRAGを拡張する軽量フレームワークであるDynamic Context Tuning (DCT)を提案する。 DCTは計画の精度を14%改善し、幻覚を37%削減し、GPT-4の性能と大幅に低いコストで一致させる。
論文参考訳（メタデータ） (2025-06-05T19:47:22Z)
KARE-RAG: Knowledge-Aware Refinement and Enhancement for RAG [63.82127103851471]
Retrieval-Augmented Generation (RAG)は、大規模言語モデルがより広範な知識ソースにアクセスすることを可能にする。ノイズの多いコンテンツを処理するために生成モデルの能力を向上させることは、ロバストなパフォーマンスに等しく重要であることを実証する。本稿では,3つの重要なイノベーションを通じて知識利用を改善するKARE-RAGを提案する。
論文参考訳（メタデータ） (2025-06-03T06:31:17Z)
Failing Forward: Improving Generative Error Correction for ASR with Synthetic Data and Retrieval Augmentation [73.9145653659403]
生成誤差補正モデルは、トレーニング中に発生する特定の種類のエラーを超えて一般化することが困難であることを示す。 DARAGは、ドメイン内(ID)およびOODシナリオにおけるASRのためのGCCを改善するために設計された新しいアプローチである。私たちのアプローチはシンプルでスケーラブルで、ドメインと言語に依存しません。
論文参考訳（メタデータ） (2024-10-17T04:00:29Z)
HIRO: Hierarchical Information Retrieval Optimization [0.0]
Retrieval-Augmented Generation (RAG)は、外部知識をLLM(Large Language Models)に動的に統合することで自然言語処理に革命をもたらした。 RAGの最近の実装は階層的なデータ構造を活用し、様々なレベルの要約と情報密度で文書を整理している。この複雑さにより、LSMは情報過負荷で"チョーク"し、より洗練されたクエリ機構を必要とする。
論文参考訳（メタデータ） (2024-06-14T12:41:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。