論文の概要: DaPT: A Dual-Path Framework for Multilingual Multi-hop Question Answering
- arxiv url: http://arxiv.org/abs/2603.19097v1
- Date: Thu, 19 Mar 2026 16:23:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.26267
- Title: DaPT: A Dual-Path Framework for Multilingual Multi-hop Question Answering
- Title(参考訳): DaPT:多言語マルチホップ質問応答のためのデュアルパスフレームワーク
- Authors: Yilin Wang, Yuchun Fan, Jiaoyang Li, Ziming Zhu, Yongyu Mu, Qiaozhi He, Tong Xiao, Jingbo Zhu,
- Abstract要約: 本稿では,多言語コーパスとクエリをまたいで検索する新しいフレームワークを提案する。
DaPTは、ソース言語クエリと英訳クエリの両方に並列にサブクエリグラフを生成する。
DaPTは、ベースラインよりも正確で簡潔な答えを得る。
- 参考スコア(独自算出の注目度): 41.923993964253405
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-augmented generation (RAG) systems have made significant progress in solving complex multi-hop question answering (QA) tasks in the English scenario. However, RAG systems inevitably face the application scenario of retrieving across multilingual corpora and queries, leaving several open challenges. The first one involves the absence of benchmarks that assess RAG systems' capabilities under the multilingual multi-hop (MM-hop) QA setting. The second centers on the overreliance on LLMs' strong semantic understanding in English, which diminishes effectiveness in multilingual scenarios. To address these challenges, we first construct multilingual multi-hop QA benchmarks by translating English-only benchmarks into five languages, and then we propose DaPT, a novel multilingual RAG framework. DaPT generates sub-question graphs in parallel for both the source-language query and its English translation counterpart, then merges them before employing a bilingual retrieval-and-answer strategy to sequentially solve sub-questions. Our experimental results demonstrate that advanced RAG systems suffer from a significant performance imbalance in multilingual scenarios. Furthermore, our proposed method consistently yields more accurate and concise answers compared to the baselines, significantly enhancing RAG performance on this task. For instance, on the most challenging MuSiQue benchmark, DaPT achieves a relative improvement of 18.3\% in average EM score over the strongest baseline.
- Abstract(参考訳): Retrieval-augmented Generation (RAG) システムは、複雑なマルチホップ質問応答(QA)タスクを英語シナリオで解く上で大きな進歩を遂げている。
しかしながら、RAGシステムは多言語コーパスとクエリをまたいで検索するアプリケーションのシナリオに必然的に直面し、いくつかのオープンな課題を残している。
1つ目は、マルチリンガルマルチホップ(MM-hop)QA設定下でRAGシステムの能力を評価するベンチマークがないことである。
2つ目は、LLMの英語における強い意味理解への過度な依存に焦点を当て、多言語シナリオの有効性を低下させる。
これらの課題に対処するため、まず英語のみのベンチマークを5言語に翻訳して多言語多言語QAベンチマークを構築し、さらに新しい多言語RAGフレームワークであるDAPTを提案する。
DaPTは、ソース言語クエリと英訳クエリの両方に並列にサブクエリグラフを生成し、そのサブクエリを逐次解決するためにバイリンガル検索と問合せ戦略を使用する前にそれらをマージする。
実験の結果,高度RAGシステムは多言語シナリオにおいて大きな性能不均衡に悩まされていることが明らかとなった。
さらに,提案手法は,ベースラインよりも精度が高く,精度も向上し,RAG性能を著しく向上させる。
例えば最も難しい MuSiQue ベンチマークでは、DAPT は最強のベースラインよりも平均 EM スコアが 18.3 % 向上した。
関連論文リスト
- Multilingual Retrieval-Augmented Generation for Knowledge-Intensive Task [89.45111250272559]
Retrieval-augmented Generation (RAG) は現代のNLPの基盤となっている。
本稿では,複数言語にまたがるRAGの有効性について,複数言語にまたがるオープンドメイン問合せに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2025-04-04T17:35:43Z) - Demystifying Multilingual Chain-of-Thought in Process Reward Modeling [86.98098988779809]
プロセス報酬モデル(PRM)を多言語設定に拡張するという課題に対処する。
我々は、7つの言語にまたがるデータセット上で多言語PRMを訓練し、それを英語から翻訳する。
本結果は,学習言語数と英語データ量の両方に対する多言語PRMの感度を強調した。
論文 参考訳(メタデータ) (2025-02-18T09:11:44Z) - Investigating Language Preference of Multilingual RAG Systems [4.438698005789677]
MRAGシステムは、クエリとドキュメント間の言語的バリエーションによって、関連する情報を取得するのに苦労する。
DKM-RAG(Dual Knowledge Multilingual RAG)は,翻訳された多言語パスを相補的なモデル知識で融合するフレームワークである。
実験結果から,DKM-RAGは言語嗜好を緩和し,多様な言語環境における性能向上を図っている。
論文 参考訳(メタデータ) (2025-02-16T15:54:05Z) - Multilingual Retrieval Augmented Generation for Culturally-Sensitive Tasks: A Benchmark for Cross-lingual Robustness [30.00463676754559]
検索したウィキペディア文書と組み合わせた領土紛争のデータセットであるBordIRLinesを49言語で紹介する。
我々は多言語検索のための複数のモードを定式化することにより、このRAG設定の言語間ロバスト性を評価する。
実験の結果,多様な言語からの視点を取り入れることで,ロバスト性の向上が期待できることがわかった。
論文 参考訳(メタデータ) (2024-10-02T01:59:07Z) - Delving Deeper into Cross-lingual Visual Question Answering [115.16614806717341]
標準学習装置に簡単な修正を加えることで、モノリンガル英語のパフォーマンスへの移行ギャップを大幅に減らすことができることを示す。
多言語マルチモーダル変換器の多言語間VQAを多言語間VQAで解析する。
論文 参考訳(メタデータ) (2022-02-15T18:22:18Z) - LAReQA: Language-agnostic answer retrieval from a multilingual pool [29.553907688813347]
LAReQAによる言語間アライメントの「強い」テスト。
機械翻訳による学習データの増強は効果的であることがわかった。
この発見は、言語に依存しない検索は、言語間評価の実質的な新しいタイプである、という我々の主張を裏付けるものである。
論文 参考訳(メタデータ) (2020-04-11T20:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。