Fugu-MT 論文翻訳(概要): Analyzing Context Utilization of LLMs in Document-Level Translation

論文の概要: Analyzing Context Utilization of LLMs in Document-Level Translation

arxiv url: http://arxiv.org/abs/2410.14391v1
Date: Fri, 18 Oct 2024 11:52:10 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:37.448059
Title: Analyzing Context Utilization of LLMs in Document-Level Translation
Title（参考訳）: 文書レベル翻訳におけるLLMの文脈利用の分析
Authors: Wafaa Mohammed, Vlad Niculae,
Abstract要約: 大規模言語モデル(LLM)は機械翻訳においてますます強力な競争相手となっている。文章の外部からの文脈なしには、いくつかの単語を翻訳できない文書レベルの翻訳について研究する。 LLMの改良された文書翻訳性能は代名詞翻訳性能に必ずしも反映されないことがわかった。
参考スコア（独自算出の注目度）: 10.174848090916669
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large language models (LLM) are increasingly strong contenders in machine translation. We study document-level translation, where some words cannot be translated without context from outside the sentence. We investigate the ability of prominent LLMs to utilize context by analyzing models' robustness to perturbed and randomized document context. We find that LLMs' improved document-translation performance is not always reflected in pronoun translation performance. We highlight the need for context-aware finetuning of LLMs with a focus on relevant parts of the context to improve their reliability for document-level translation.
Abstract（参考訳）: 大規模言語モデル(LLM)は機械翻訳においてますます強力な競争相手となっている。文章の外部からの文脈なしには、いくつかの単語を翻訳できない文書レベルの翻訳について研究する。乱れおよびランダム化された文書コンテキストに対するモデルの頑健さを解析することにより、著名なLCMがコンテキストを利用する能力について検討する。 LLMの改良された文書翻訳性能は代名詞翻訳性能に必ずしも反映されないことがわかった。我々は、文書レベルの翻訳における信頼性を向上させるために、文脈の関連部分に焦点をあてて、LLMの文脈対応微調整の必要性を強調した。

関連論文リスト

From Utterance to Vividity: Training Expressive Subtitle Translation LLM via Adaptive Local Preference Optimization [12.547838537411215]
ドメインのカスタマイズのニーズを満たす翻訳 LLM の構築方法に焦点をあてる。我々は、視覚メディアの字幕翻訳をテーマとして、表現力と鮮明な翻訳 LLM の訓練方法を探求する。
論文参考訳（メタデータ） (2026-02-01T07:24:06Z)
Unlocking Latent Discourse Translation in LLMs Through Quality-Aware Decoding [14.194775031266497]
大規模言語モデル (LLM) は機械翻訳において強力な競争相手として出現している。しかし、彼らは代名詞の分解や語彙の凝集といった言論現象を文書レベルで適切に扱うのに苦慮している。この知識を効果的に抽出するために品質認識復号法(QAD)を提案する。
論文参考訳（メタデータ） (2025-10-08T10:37:17Z)
Beyond the Sentence: A Survey on Context-Aware Machine Translation with Large Language Models [19.76204414964156]
本研究は,大規模言語モデル(LLM)を用いた文脈認識翻訳の文献レビューである。既存の作業はプロンプトと微調整のアプローチを利用しており、文脈対応機械翻訳のための自動後編集と翻訳エージェントの作成にはほとんど焦点を当てていない。
論文参考訳（メタデータ） (2025-06-09T09:27:00Z)
Multilingual Contextualization of Large Language Models for Document-Level Machine Translation [30.005159724115824]
大規模言語モデル (LLM) は文レベルの機械翻訳において高い性能を示している。高品質な文書レベルのデータを対象とした微調整により,LLMに基づく長期文書翻訳を改善する手法を提案する。提案手法は,文書から文書への直接翻訳やチャンクレベルの翻訳など,複数の翻訳パラダイムをサポートする。
論文参考訳（メタデータ） (2025-04-16T14:52:22Z)
Lost in Literalism: How Supervised Training Shapes Translationese in LLMs [51.04435855143767]
大規模言語モデル(LLM)は機械翻訳において顕著な成功を収めた。しかし、過度にリテラルと不自然な翻訳を特徴とする翻訳は、依然として永続的な課題である。我々は、黄金の基準を磨き、不自然なトレーニングインスタンスをフィルタリングするなど、これらのバイアスを軽減する方法を導入する。
論文参考訳（メタデータ） (2025-03-06T12:14:45Z)
Speech Translation Refinement using Large Language Models [8.602429274223693]
本稿では,大規模言語モデル(LLM)が,共同改良プロセスを導入することにより,音声翻訳の性能を向上する方法について検討する。 LLMによる音声翻訳(ST)と自動音声認識(ASR)の併用により,STモデルの性能は大幅に向上した。 7つの翻訳タスクを含む MuST-C と CoVoST 2 データセットの実験結果から,提案手法の有効性が示された。
論文参考訳（メタデータ） (2025-01-25T05:32:42Z)
Refining Translations with LLMs: A Constraint-Aware Iterative Prompting Approach [7.5069214839655345]
大言語モデル(LLM)は機械翻訳(MT)において顕著な熟練性を示している本稿では,意味的正確性に不可欠なキーワードを優先することで,翻訳忠実度を高める多段階のプロンプトチェーンを提案する。 FLORES-200およびWMTデータセットのベースモデルとしてLlamaとQwenを使用した実験は、ベースラインよりも大幅に改善されている。
論文参考訳（メタデータ） (2024-11-13T05:40:24Z)
Instruction-Tuned LLMs Succeed in Document-Level MT Without Fine-Tuning -- But BLEU Turns a Blind Eye [15.987448306012167]
大規模言語モデル(LLM)は機械翻訳(MT)を含む様々なNLPタスクに優れている。本研究は,文書レベル翻訳(docMT)における命令調整型LLMの本質的能力について検討する。
論文参考訳（メタデータ） (2024-10-28T11:49:58Z)
Analyzing Context Contributions in LLM-based Machine Translation [21.95318929582271]
大規模言語モデル(LLM)は機械翻訳(MT)において最先端の性能を達成した本研究は,LLM が翻訳文を生成する際に,少数ショット例やソーステキストなど,様々な文脈をどう利用するかを検討する。我々の研究は、標準エンコーダ・デコーダMTモデルで知られているものを超えるLCMベースのMTの内部動作に光を当てた。
論文参考訳（メタデータ） (2024-10-21T17:51:41Z)
Efficiently Exploring Large Language Models for Document-Level Machine Translation with In-context Learning [38.89119606657543]
文レベルの翻訳とは対照的に、文脈内学習に基づく大規模言語モデル(LLM)による文書レベルの翻訳(DOCMT)は2つの大きな課題に直面している。本研究では,文脈認識型プロンプト法(CAP)を提案する。様々なDOCMTタスクに対して広範な実験を行い,本手法の有効性を実証した。
論文参考訳（メタデータ） (2024-06-11T09:11:17Z)
Building Accurate Translation-Tailored LLMs with Language Aware Instruction Tuning [57.323716555996114]
オフターゲット翻訳は、特に低リソース言語では未解決の問題である。最近の研究は、翻訳命令の機能を強調するために高度なプロンプト戦略を設計するか、LLMの文脈内学習能力を活用している。本研究では,LLMの命令追従能力(特に翻訳方向)を向上させるために,2段階の微調整アルゴリズムを設計する。
論文参考訳（メタデータ） (2024-03-21T13:47:40Z)
Enhancing Document-level Translation of Large Language Model via Translation Mixed-instructions [24.025242477280983]
機械翻訳のための既存の大きな言語モデル(LLM)は、典型的には文レベルの翻訳命令に基づいて微調整される。この課題は、文レベルのカバレッジの問題から生じ、文書のその後の文は転写されないままである。様々な長さの文レベルと文書レベルの翻訳命令を微調整LLMに結合する手法を提案する。
論文参考訳（メタデータ） (2024-01-16T03:28:26Z)
Lost in the Source Language: How Large Language Models Evaluate the Quality of Machine Translation [64.5862977630713]
本研究では,機械翻訳評価タスクにおいて,Large Language Models (LLM) がソースデータと参照データをどのように活用するかを検討する。参照情報が評価精度を大幅に向上させるのに対して,意外なことに,ソース情報は時として非生産的である。
論文参考訳（メタデータ） (2024-01-12T13:23:21Z)
Adapting Large Language Models for Document-Level Machine Translation [46.370862171452444]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクを大幅に進歩させた。近年の研究では、中程度のLLMはタスク固有の微調整後、より大きなLLMよりも優れていることが示されている。本研究では,特定の言語対に対する文書レベルの機械翻訳(DocMT)にLLMを適用することに焦点を当てた。
論文参考訳（メタデータ） (2024-01-12T09:29:13Z)
Speech Translation with Large Language Models: An Industrial Practice [64.5419534101104]
LLM-STは,事前学習型大言語モデル(LLM)に基づいて構築された,新規で効果的な音声翻訳モデルである。大規模言語モデル(LLM)を音声エンコーダと統合し、マルチタスクの命令チューニングを利用することで、LLM-STは正確なタイムスタンプと翻訳を生成することができる。英語と中国語のデータセットの厳密な実験を通じて,LLM-STの異常な性能を示す。
論文参考訳（メタデータ） (2023-12-21T05:32:49Z)
Contextual Refinement of Translations: Large Language Models for Sentence and Document-Level Post-Editing [12.843274390224853]
大規模言語モデル(LLM)は、様々な自然言語処理タスクでかなりの成功を収めている。ニューラルネットワーク翻訳における最先端性能は,まだ達成できていない。直接翻訳者ではなく,自動編集者 (APE) としてLLMを適用することを提案する。
論文参考訳（メタデータ） (2023-10-23T12:22:15Z)
Towards Effective Disambiguation for Machine Translation with Large Language Models [65.80775710657672]
我々は「あいまいな文」を翻訳する大規模言語モデルの能力について研究する。実験の結果,提案手法はDeepLやNLLBといった最先端システムと5つの言語方向のうち4つで一致し,性能を向上できることがわかった。
論文参考訳（メタデータ） (2023-09-20T22:22:52Z)
Multilingual Machine Translation with Large Language Models: Empirical Results and Analysis [103.89753784762445]
大規模言語モデル(LLM)は多言語機械翻訳(MMT)の処理において顕著な可能性を示した。本稿では, MMT における LLM の利点と課題を体系的に検討する。また,ChatGPTとGPT-4を含む8つのLLMを徹底的に評価した。
論文参考訳（メタデータ） (2023-04-10T15:51:30Z)
Dictionary-based Phrase-level Prompting of Large Language Models for Machine Translation [91.57514888410205]
大規模言語モデル(LLM)は、プロンプトによる機械翻訳(MT)能力を示す。 LLMは、低リソースやドメイン転送のシナリオで一般的なまれな単語で入力を翻訳するのに苦労する。 LLMプロンプトは、バイリンガル辞書からの事前知識を用いてプロンプトの制御ヒントを提供することにより、稀な単語に対する効果的な解決策を提供することができることを示す。
論文参考訳（メタデータ） (2023-02-15T18:46:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。