論文の概要: Structures Facilitate Retrieve, Rerank, and Generate
- arxiv url: http://arxiv.org/abs/2606.03247v1
- Date: Tue, 02 Jun 2026 07:09:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.825878
- Title: Structures Facilitate Retrieve, Rerank, and Generate
- Title(参考訳): 検索・参照・生成を行う構造
- Authors: Yeqin Zhang, Haomin Fu, Xujie Zhang, Cam-Tu Nguyen,
- Abstract要約: 文書地上対話システム(DGDS)は、外部文書からの知識を利用してドメイン固有のユーザー質問に答える。
本稿では,このような問題に体系的に対処するSF-Re2Gを提案する。
- 参考スコア(独自算出の注目度): 11.039868951381164
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Document-grounded dialogue systems (DGDS) utilize knowledge from external documents to answer domain-specific user questions. Existing solutions typically divide documents into independent passages for retrieval and response generation. This approach, however, neither makes good use of structural information within documents nor provides enough (document) context for knowledge selection and responses. This paper proposes SF-Re2G to address such issues systematically. Firstly, we seek to improve a passage representation by contrasting it with others of the same section, thus improving the retrieval performance. Secondly, a structure-enhanced reranker is built, leveraging the fact that multiple grounding passages of one dialog turn tend to be in the same neighborhood. Specifically, candidates from the retrieval are grouped into subgraphs according to the document structure. The reranker will rescore the candidate integrating its group information. Finally, the chosen passages are used for responses, taking into account the subgraph context for better generation. Experimental results on two DGDS datasets validate our method for both Chinese and English.
- Abstract(参考訳): 文書地上対話システム(DGDS)は、外部文書からの知識を利用してドメイン固有のユーザー質問に答える。
既存のソリューションは通常、ドキュメントを検索と応答生成のための独立したパスに分割する。
しかし、このアプローチは文書内の構造情報をうまく利用したり、知識の選択や応答に十分な(文書)コンテキストを提供したりするものではない。
本稿では,このような問題に体系的に対処するSF-Re2Gを提案する。
まず,同じセクションの他のセクションと対比することで,経路表現の改善を図り,検索性能の向上を図る。
第二に、1つのダイアログの複数の接地通路が同じ近傍にある傾向があるという事実を活用する構造強化リランカが構築される。
具体的には、検索の候補を文書構造に従ってサブグラフにグループ化する。
リランカは、そのグループ情報を統合した候補を再評価する。
最後に、選択されたパスはレスポンスに使用され、より良い生成のためにサブグラフコンテキストを考慮に入れます。
2つのDGDSデータセットの実験結果から、中国語と英語の両方の手法が検証された。
関連論文リスト
- ReFeed: Retrieval Feedback-Guided Dataset Construction for Style-Aware Query Rewriting [0.4077787659104315]
検索システムは、ユーザクエリがドメイン文書で使用される言語とスタイリスティックまたは意味的に異なるときに失敗することが多い。
この研究は、データ中心の情報検索における新たな方向性を強調し、フィードバックループとドキュメントスタイルのアライメントがRAGシステムの推論と適応性をいかに高めるかを強調した。
論文 参考訳(メタデータ) (2026-03-02T03:43:53Z) - MoDora: Tree-Based Semi-Structured Document Analysis System [62.01015188258797]
半構造化文書は、様々な不規則なレイアウトで配置された様々なインターリーブされたデータ要素を統合する。
MoDora は半構造化文書解析のための LLM を利用したシステムである。
実験では、MoDoraは5.97%-61.07%の精度でベースラインを上回っている。
論文 参考訳(メタデータ) (2026-02-26T14:48:49Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - Hierarchical Retrieval with Evidence Curation for Open-Domain Financial Question Answering on Standardized Documents [9.173952465423966]
標準化されたドキュメントは、反復的なボイラープレートテキストや同様のテーブル構造など、同様のフォーマットを共有している。
この類似性により、従来のRAGメソッドは、ほぼ重複したテキストを誤識別し、精度と完全性を損なう重複検索につながる。
本稿では,これらの問題に対処するためのEvidence Curationフレームワークを用いた階層検索手法を提案する。
論文 参考訳(メタデータ) (2025-05-26T11:08:23Z) - DAPR: A Benchmark on Document-Aware Passage Retrieval [57.45793782107218]
我々は,このタスクemphDocument-Aware Passage Retrieval (DAPR)を提案する。
State-of-The-Art(SoTA)パスレトリバーのエラーを分析しながら、大きなエラー(53.5%)は文書コンテキストの欠如に起因する。
提案するベンチマークにより,検索システムの開発・比較を今後行うことができる。
論文 参考訳(メタデータ) (2023-05-23T10:39:57Z) - Generate rather than Retrieve: Large Language Models are Strong Context
Generators [74.87021992611672]
本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。
我々は,提案手法をgenRead (genRead) と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。
論文 参考訳(メタデータ) (2022-09-21T01:30:59Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。