論文の概要: CroSearch-R1: Better Leveraging Cross-lingual Knowledge for Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2604.25182v1
- Date: Tue, 28 Apr 2026 03:41:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.698866
- Title: CroSearch-R1: Better Leveraging Cross-lingual Knowledge for Retrieval-Augmented Generation
- Title(参考訳): CroSearch-R1:Retrieval-Augmented Generationのための言語間知識の活用
- Authors: Rui Qi, Fengran Mo, Sijin Lu, Yufeng Chen, Jian-Yun Nie, Kaiyu Huang,
- Abstract要約: 多言語コレクションは、原言語の事実を補い、修正するために、他の言語で有用な知識を含んでいるかもしれない。
グループ相対政策最適化プロセスに多言語知識を統合するための強化学習フレームワークであるCroSearch-R1を提案する。
- 参考スコア(独自算出の注目度): 34.11851611829769
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A multilingual collection may contain useful knowledge in other languages to supplement and correct the facts in the original language for Retrieval-Augmented Generation (RAG). However, the vanilla approach that simply concatenates multiple pieces of knowledge from different languages into the context may fail to improve effectiveness due to the potential disparities across languages. To better leverage multilingual knowledge, we propose CroSearch-R1, a search-augmented reinforcement learning framework to integrate multilingual knowledge into the Group Relative Policy Optimization (GRPO) process. In particular, the approach adopts a multi-turn retrieval strategy with cross-lingual knowledge integration to dynamically align the knowledge from other languages as supplementary evidence into a unified representation space. Furthermore, we introduce a multilingual rollout mechanism to optimize reasoning transferability across languages. Experimental results demonstrate that our framework effectively leverages cross-lingual complementarity and improves the effectiveness of RAG with multilingual collections.
- Abstract(参考訳): 多言語コレクションは、Retrieval-Augmented Generation (RAG) のオリジナルの言語における事実を補い、修正するために、他の言語で有用な知識を含んでいるかもしれない。
しかし、異なる言語から複数の知識をコンテキストに結合するバニラアプローチは、言語間の潜在的な相違により、効果を向上できない可能性がある。
多言語知識をよりよく活用するために,多言語知識をGRPO(Group Relative Policy Optimization)プロセスに統合する検索強化学習フレームワークであるCroSearch-R1を提案する。
特に,他言語からの知識を補足的証拠として動的に統一表現空間に整合させるために,多言語間知識統合を用いた多言語検索戦略を採用する。
さらに,言語間の推論の伝達性を最適化する多言語ロールアウト機構を導入する。
実験結果から,本フレームワークは言語間相補性を効果的に活用し,多言語コレクションを用いたRAGの有効性を向上することが示された。
関連論文リスト
- Language-Coupled Reinforcement Learning for Multilingual Retrieval-Augmented Generation [73.54930910609328]
多言語検索強化学習フレームワークLcRLを提案する。
LcRLは言語に結合したグループ相対ポリシー最適化をポリシーと報酬モデルに統合する。
我々は,言語結合型グループサンプリングをロールアウトモジュールに導入し,知識バイアスを低減し,報酬モデルにおける補助的反一貫性のペナルティを正規化し,知識衝突を軽減する。
論文 参考訳(メタデータ) (2026-01-21T11:32:32Z) - LangGPS: Language Separability Guided Data Pre-Selection for Joint Multilingual Instruction Tuning [49.22807995935406]
大規模言語モデル(LLM)の多言語命令追従能力と下流性能を改善するための多言語命令チューニングは広く採用されている手法である。
既存の選択法は、しばしばテキストの品質、多様性、タスク関連性といった特徴に基づいており、典型的には多言語データの固有の言語構造を見落としている。
言語分離性によって導かれる軽量な2段階事前選択フレームワークであるLangGPSを提案する。
論文 参考訳(メタデータ) (2025-11-13T12:02:32Z) - How and Where to Translate? The Impact of Translation Strategies in Cross-lingual LLM Prompting [15.388822834013599]
多言語検索強化世代(RAG)ベースのシステムでは、知識ベース(KB)は高リソース言語(例えば英語)から低リソース言語(英語版)にしばしば共有される。
2つの一般的なプラクティスは、単言語的なプロンプトを生成するための事前翻訳と、直接推論のための言語間プロンプトである。
最適化されたプロンプト戦略は、言語間の知識共有を大幅に改善し、下流分類タスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2025-07-21T19:37:15Z) - Multilingual Retrieval-Augmented Generation for Knowledge-Intensive Task [89.45111250272559]
Retrieval-augmented Generation (RAG) は現代のNLPの基盤となっている。
本稿では,複数言語にまたがるRAGの有効性について,複数言語にまたがるオープンドメイン問合せに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2025-04-04T17:35:43Z) - 1+1>2: Can Large Language Models Serve as Cross-Lingual Knowledge Aggregators? [46.43162333819418]
大規模言語モデル(LLM)は、様々な言語にまたがって情報を処理できることから、大きな注目を集めている。
それらの能力にもかかわらず、異なる言語で同じクエリを扱うことに矛盾を示し、さらなる進歩のための課題を提示している。
本稿では,多言語からの知識を集約することで,LLMの多言語的性能を向上させる手法を提案する。
論文 参考訳(メタデータ) (2024-06-20T20:32:53Z) - Prix-LM: Pretraining for Multilingual Knowledge Base Construction [59.02868906044296]
複数言語による知識構築と完成のための統合フレームワークである Prix-LM を提案する。
既存の多言語KBから抽出したモノリンガルトリプルとクロスリンガルリンクの2種類の知識を利用する。
複数の言語におけるリンク予測、言語間リンク、バイリンガル語彙誘導など、標準的なエンティティ関連タスクの実験は、その効果を実証している。
論文 参考訳(メタデータ) (2021-10-16T02:08:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。