Fugu-MT 論文翻訳(概要): DaPT: A Dual-Path Framework for Multilingual Multi-hop Question Answering

論文の概要: DaPT: A Dual-Path Framework for Multilingual Multi-hop Question Answering

arxiv url: http://arxiv.org/abs/2603.19097v1
Date: Thu, 19 Mar 2026 16:23:04 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-20 17:19:06.26267
Title: DaPT: A Dual-Path Framework for Multilingual Multi-hop Question Answering
Title（参考訳）: DaPT:多言語マルチホップ質問応答のためのデュアルパスフレームワーク
Authors: Yilin Wang, Yuchun Fan, Jiaoyang Li, Ziming Zhu, Yongyu Mu, Qiaozhi He, Tong Xiao, Jingbo Zhu,
Abstract要約: 本稿では,多言語コーパスとクエリをまたいで検索する新しいフレームワークを提案する。 DaPTは、ソース言語クエリと英訳クエリの両方に並列にサブクエリグラフを生成する。 DaPTは、ベースラインよりも正確で簡潔な答えを得る。
参考スコア（独自算出の注目度）: 41.923993964253405
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Retrieval-augmented generation (RAG) systems have made significant progress in solving complex multi-hop question answering (QA) tasks in the English scenario. However, RAG systems inevitably face the application scenario of retrieving across multilingual corpora and queries, leaving several open challenges. The first one involves the absence of benchmarks that assess RAG systems' capabilities under the multilingual multi-hop (MM-hop) QA setting. The second centers on the overreliance on LLMs' strong semantic understanding in English, which diminishes effectiveness in multilingual scenarios. To address these challenges, we first construct multilingual multi-hop QA benchmarks by translating English-only benchmarks into five languages, and then we propose DaPT, a novel multilingual RAG framework. DaPT generates sub-question graphs in parallel for both the source-language query and its English translation counterpart, then merges them before employing a bilingual retrieval-and-answer strategy to sequentially solve sub-questions. Our experimental results demonstrate that advanced RAG systems suffer from a significant performance imbalance in multilingual scenarios. Furthermore, our proposed method consistently yields more accurate and concise answers compared to the baselines, significantly enhancing RAG performance on this task. For instance, on the most challenging MuSiQue benchmark, DaPT achieves a relative improvement of 18.3\% in average EM score over the strongest baseline.
Abstract（参考訳）: Retrieval-augmented Generation (RAG) システムは、複雑なマルチホップ質問応答(QA)タスクを英語シナリオで解く上で大きな進歩を遂げている。しかしながら、RAGシステムは多言語コーパスとクエリをまたいで検索するアプリケーションのシナリオに必然的に直面し、いくつかのオープンな課題を残している。 1つ目は、マルチリンガルマルチホップ(MM-hop)QA設定下でRAGシステムの能力を評価するベンチマークがないことである。 2つ目は、LLMの英語における強い意味理解への過度な依存に焦点を当て、多言語シナリオの有効性を低下させる。これらの課題に対処するため、まず英語のみのベンチマークを5言語に翻訳して多言語多言語QAベンチマークを構築し、さらに新しい多言語RAGフレームワークであるDAPTを提案する。 DaPTは、ソース言語クエリと英訳クエリの両方に並列にサブクエリグラフを生成し、そのサブクエリを逐次解決するためにバイリンガル検索と問合せ戦略を使用する前にそれらをマージする。実験の結果,高度RAGシステムは多言語シナリオにおいて大きな性能不均衡に悩まされていることが明らかとなった。さらに,提案手法は,ベースラインよりも精度が高く,精度も向上し,RAG性能を著しく向上させる。例えば最も難しい MuSiQue ベンチマークでは、DAPT は最強のベースラインよりも平均 EM スコアが 18.3 % 向上した。

論文の概要: DaPT: A Dual-Path Framework for Multilingual Multi-hop Question Answering

関連論文リスト