Fugu-MT 論文翻訳(概要): Breaking the Language Barrier: Can Direct Inference Outperform Pre-Translation in Multilingual LLM Applications?

論文の概要: Breaking the Language Barrier: Can Direct Inference Outperform Pre-Translation in Multilingual LLM Applications?

arxiv url: http://arxiv.org/abs/2403.04792v1
Date: Mon, 4 Mar 2024 14:01:11 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-11 22:17:00.624450
Title: Breaking the Language Barrier: Can Direct Inference Outperform Pre-Translation in Multilingual LLM Applications?
Title（参考訳）: 言語バリアを破る:多言語LLMアプリケーションにおいて直接推論は事前翻訳より優れているか?
Authors: Yotam Intrator, Matan Halfon, Roman Goldenberg, Reut Tsarfaty, Matan Eyal, Ehud Rivlin, Yossi Matias, Natalia Aizenberg
Abstract要約: 本研究では,PaLM2モデルの文脈における事前翻訳の必要性を再評価する。 PaLM2-Lは108言語中94言語で翻訳前の性能を一貫して上回っている。
参考スコア（独自算出の注目度）: 17.828943682809882
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Large language models hold significant promise in multilingual applications. However, inherent biases stemming from predominantly English-centric pre-training have led to the widespread practice of pre-translation, i.e., translating non-English inputs to English before inference, leading to complexity and information loss. This study re-evaluates the need for pre-translation in the context of PaLM2 models (Anil et al., 2023), which have been established as highly performant in multilingual tasks. We offer a comprehensive investigation across 108 languages and 6 diverse benchmarks, including open-end generative tasks, which were excluded from previous similar studies. Our findings challenge the pre-translation paradigm established in prior research, highlighting the advantages of direct inference in PaLM2. Specifically, PaLM2-L consistently outperforms pre-translation in 94 out of 108 languages. These findings pave the way for more efficient and effective multilingual applications, alleviating the limitations associated with pre-translation and unlocking linguistic authenticity.
Abstract（参考訳）: 大規模言語モデルは多言語アプリケーションにおいて大きな可能性を秘めている。しかし、主に英語中心の事前学習から生じる固有のバイアスは、推論前に英語以外の入力を英語に翻訳するなど、翻訳前の広範囲にわたる実践につながった。本研究は,多言語タスクにおいて高い性能が確立されている PaLM2 モデル (Anil et al., 2023) の文脈における事前翻訳の必要性を再評価する。これまでの類似研究から除外されたオープンソース生成タスクを含む,108言語と6つの多様なベンチマークに関する包括的な調査を提供する。本研究は,paLM2における直接推論の利点を浮き彫りにして,事前翻訳のパラダイムに挑戦するものである。具体的には、PaLM2-Lは108言語中94言語において、翻訳前よりも一貫して優れている。これらの発見は、より効率的で効果的な多言語応用への道を開き、翻訳前の制限を緩和し、言語の真正性を解き放つ。

関連論文リスト

The Translation Barrier Hypothesis: Multilingual Generation with Large Language Models Suffers from Implicit Translation Failure [24.960044405878286]
生成のための暗黙的なタスク解決-->翻訳パイプラインの存在を実証する。 108言語対にわたる単語翻訳タスクに対して,この仮説を検証した。全体的な失敗のかなりの部分は、翻訳失敗に起因していることが分かりました。
論文参考訳（メタデータ） (2025-06-28T02:09:21Z)
Multilingual vs Crosslingual Retrieval of Fact-Checked Claims: A Tale of Two Approaches [5.850200023135349]
マルチリンガルおよびクロスリンガルのパフォーマンスを改善するための戦略を検討する。 47言語におけるポストとクレームを含むデータセットに対するアプローチを評価する。最も重要なことは、多言語性は多言語性よりも独自の特徴を持つセットアップであることが示される。
論文参考訳（メタデータ） (2025-05-28T08:47:10Z)
Cross-Lingual Pitfalls: Automatic Probing Cross-Lingual Weakness of Multilingual Large Language Models [55.14276067678253]
本稿では,Large Language Models (LLMs) における言語間関係の弱点を効率的に同定するための新しい手法を提案する。この手法を用いて16言語で6,000以上のバイリンガルペアからなる新しいデータセットを構築し、最先端のモデルにおいても弱点を明らかにする効果を実証した。さらに,言語的類似性と言語間の弱点との関係について検討し,言語的関連言語が類似した演奏パターンを共有することを明らかにした。
論文参考訳（メタデータ） (2025-05-24T12:31:27Z)
Large Language Models for Multilingual Previously Fact-Checked Claim Detection [3.694429692322632]
本稿では,複数言語による事実チェックによるクレーム検出のための大規模言語モデル (LLM) の総合評価について述べる。 20言語にまたがる7つのLLMをモノリンガル・クロスリンガル・セッティングで評価する。この結果から,LLMは高リソース言語ではよく機能するが,低リソース言語では苦戦していることがわかった。
論文参考訳（メタデータ） (2025-03-04T15:56:43Z)
Beyond English: The Impact of Prompt Translation Strategies across Languages and Tasks in Multilingual LLMs [13.458891794688551]
我々は,低リソース言語と高リソース言語の両方をカバーする35言語を対象とした事前翻訳戦略を評価する。本実験は,英語との類似性,翻訳品質,事前学習データのサイズなどの要因が,事前翻訳によるモデル性能に与える影響を示す。
論文参考訳（メタデータ） (2025-02-13T13:49:30Z)
X-ALMA: Plug & Play Modules and Adaptive Rejection for Quality Translation at Scale [25.257770733168012]
大規模言語モデル(LLM)は、様々なNLPタスクで顕著な成功を収めてきたが、主に英語に焦点を当てている。本稿では,多言語機械翻訳タスクに着目し,言語数よりも品質を優先する。 X-ALMAは、リソースレベルに関係なく、50の異なる言語で最高のパフォーマンスを保証することを約束するモデルである。
論文参考訳（メタデータ） (2024-10-04T03:17:27Z)
PreAlign: Boosting Cross-Lingual Transfer by Early Establishment of Multilingual Alignment [68.20851615263953]
大規模な言語モデルは、英語中心の事前訓練にもかかわらず、合理的な多言語能力を示す。これらのモデルにおける自発的な多言語アライメントは弱く、不満足な言語間移動と知識共有をもたらす。言語モデル事前学習に先立って多言語アライメントを確立するフレームワークであるPreAlignを提案する。
論文参考訳（メタデータ） (2024-07-23T06:59:53Z)
Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models [62.91524967852552]
大規模言語モデル(LLM)は、多言語コーパスの事前訓練のため、一般的に多言語である。しかし、これらのモデルは言語間で対応する概念を関連付けることができ、効果的にクロスランガルなのでしょうか? 本研究は,言語横断的課題に関する6つの技術 LLM の評価を行った。
論文参考訳（メタデータ） (2024-06-23T15:15:17Z)
The Power of Question Translation Training in Multilingual Reasoning: Broadened Scope and Deepened Insights [108.40766216456413]
大規模言語モデルの英語と非英語のパフォーマンスのギャップを埋めるための質問アライメントフレームワークを提案する。実験結果から、さまざまな推論シナリオ、モデルファミリー、サイズにわたって、多言語のパフォーマンスを向上できることが示された。我々は、表現空間、生成された応答とデータスケールを分析し、質問翻訳訓練がLLM内の言語アライメントをどのように強化するかを明らかにする。
論文参考訳（メタデータ） (2024-05-02T14:49:50Z)
Is Translation All You Need? A Study on Solving Multilingual Tasks with Large Language Models [79.46179534911019]
大規模言語モデル (LLM) は多言語機能を示しているが、ほとんどは不均衡なトレーニングコーパスのため英語中心である。実世界のユーザクエリと非英語中心のLLMに評価を拡張し、多言語性能のより広範な評価を提供する。
論文参考訳（メタデータ） (2024-03-15T12:47:39Z)
Decomposed Prompting: Unveiling Multilingual Linguistic Structure Knowledge in English-Centric Large Language Models [12.700783525558721]
GPT-3やLLaMAのような英語中心のLarge Language Models (LLM)は、多言語タスクを実行する素晴らしい能力を示している。本稿では,シーケンスラベリングタスクにおいて,これらのLLMの言語構造理解を探索するための分解的プロンプト手法を提案する。
論文参考訳（メタデータ） (2024-02-28T15:15:39Z)
Don't Trust ChatGPT when Your Question is not in English: A Study of Multilingual Abilities and Types of LLMs [16.770697902481107]
大規模言語モデル(LLM)は、例外的な自然言語理解能力を示している。本論文では,多言語環境下でのLLMの性能格差を体系的に評価する方法を提案する。その結果,GPTは多言語設定において高い翻訳的振る舞いを示すことがわかった。
論文参考訳（メタデータ） (2023-05-24T02:05:03Z)
Efficiently Aligned Cross-Lingual Transfer Learning for Conversational Tasks using Prompt-Tuning [98.60739735409243]
英語のような高リソース言語で訓練された言語モデルの言語間移動は、多くのNLPタスクのために広く研究されている。並列および大規模多言語会話データセットである言語間アライメント事前学習のためのXSGDを導入する。協調的な言語間表現を容易にするために,アライメントプロンプトを学習するための効率的なプロンプトチューニング手法を開発した。
論文参考訳（メタデータ） (2023-04-03T18:46:01Z)
Analyzing the Mono- and Cross-Lingual Pretraining Dynamics of Multilingual Language Models [73.11488464916668]
本研究では,多言語事前学習プロセスのダイナミクスについて検討する。我々は,XLM-Rプレトレーニング全体から抽出したチェックポイントを,一連の言語的タスクを用いて探索する。分析の結果,より複雑なものよりも低レベルな言語スキルが得られ,早期に高い言語性能が得られることがわかった。
論文参考訳（メタデータ） (2022-05-24T03:35:00Z)
Bridging Cross-Lingual Gaps During Leveraging the Multilingual Sequence-to-Sequence Pretraining for Text Generation [80.16548523140025]
プレトレインとファインチューンの間のギャップを埋めるために、コードスイッチングの復元タスクを追加して、バニラプレトレイン-ファインチューンパイプラインを拡張します。提案手法は,言語間文表現距離を狭くし,簡単な計算コストで低周波語翻訳を改善する。
論文参考訳（メタデータ） (2022-04-16T16:08:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。