論文の概要: Cross-Preference Learning for Sentence-Level and Context-Aware Machine Translation
- arxiv url: http://arxiv.org/abs/2603.25183v1
- Date: Thu, 26 Mar 2026 08:52:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.193643
- Title: Cross-Preference Learning for Sentence-Level and Context-Aware Machine Translation
- Title(参考訳): 文レベルとコンテキストアウェア機械翻訳のための相互参照学習
- Authors: Ying Li, Xinglin Lyu, Junhui Li, Jinlong Yang, Hengchao Shang, Min Zhang, Shimin Tao, Daimeng Wei,
- Abstract要約: 文レベルと文脈対応MTの相補的な利点を明示的に捉えた嗜好に基づく学習フレームワークを提案する。
提案手法は,Qwen3-4B,Qwen3-8B,Llama-3-8Bを含む複数のモデルを用いて,複数の公的な文脈対応MTタスクに対して検証する。
- 参考スコア(独自算出の注目度): 33.915728960928774
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Context-aware machine translation (MT) leverages document-level information, yet it does not consistently outperform sentence-level MT, as contextual signals are unevenly beneficial across sentences. Existing training objectives do not explicitly model this variability, limiting a model's ability to adaptively exploit context. In this paper, we propose Cross-Preference Learning (CPL), a preference-based training framework that explicitly captures the complementary benefits of sentence-level and context-aware MT. CPL achieves this by integrating both intra- and cross-condition preferences into the preference optimization objective. The introduction of intra- and cross-condition preferences provides explicit supervision on when and how contextual information improves translation quality. We validate the proposed approach on several public context-aware MT tasks using multiple models, including Qwen3-4B, Qwen3-8B, and Llama-3-8B. Experimental results demonstrate consistent improvements in translation quality and robustness across both input conditions, achieved without any architectural modifications.
- Abstract(参考訳): 文脈対応機械翻訳(MT)は文書レベルの情報を活用するが、文脈信号が文間で不均一に有用であるため、文レベルのMTを一貫して上回っているわけではない。
既存のトレーニング対象はこの変数を明示的にモデル化せず、モデルがコンテキストを適応的に活用する能力を制限する。
本稿では、文レベルと文脈対応MTの相補的な利点を明示的に捉えた嗜好に基づく学習フレームワークであるクロスパラメータ学習(CPL)を提案する。
インターコンディションとクロスコンディションの嗜好の導入は、文脈情報がどのように翻訳品質を改善するかを明確に監督する。
提案手法は,Qwen3-4B,Qwen3-8B,Llama-3-8Bを含む複数のモデルを用いて,複数の公的な文脈対応MTタスクに対して検証する。
実験結果は、アーキテクチャの変更なしに両入力条件の翻訳品質とロバスト性に一貫した改善が達成されたことを示す。
関連論文リスト
- Toward domain-specific machine translation and quality estimation systems [0.0]
機械翻訳(MT)と品質推定(QE)は、一般的なドメインではよく機能するが、ドメインミスマッチでは劣化する。
この論文は、データ中心のコントリビューションセットを通じて、MTおよびQEシステムを特殊なドメインに適応する方法を研究する。
論文 参考訳(メタデータ) (2026-03-26T02:47:40Z) - Beyond Many-Shot Translation: Scaling In-Context Demonstrations For Low-Resource Machine Translation [49.82863380286994]
In-context Learningは、低リソース機械翻訳にLarge Language Modelsを適用する新しい方法を提供するかもしれない。
本研究では,Long-context モデルを用いた数千例のサンプルに対して,数ショット設定以上の低リソース機械翻訳ICLのスケーリングについて検討する。
JavaneseとSundaneseに関する我々の実験は、追加のコンテキストからのゲインがすばやく飽和し、最大コンテキストウィンドウの近くで分解可能であることを示している。
論文 参考訳(メタデータ) (2026-02-04T17:02:22Z) - Test-Time Alignment for Large Language Models via Textual Model Predictive Control [63.508812485566374]
Textual Model Predictive Control (TMPC) は、推論時に大規模言語モデルを調整するために適応された新しい予測計画フレームワークである。
TMPCは、談話レベル翻訳、長文応答生成、プログラム合成の3つの異なるセグメンテーション特性を持つタスクで評価される。
その結果、TMPCはパフォーマンスを継続的に改善し、一般性を強調している。
論文 参考訳(メタデータ) (2025-02-28T07:24:33Z) - SMDT: Selective Memory-Augmented Neural Document Translation [53.4627288890316]
本稿では,文脈の広い仮説空間を含む文書を扱うために,選択的メモリ拡張型ニューラル文書翻訳モデルを提案する。
トレーニングコーパスから類似のバイリンガル文ペアを抽出し,グローバルな文脈を拡大する。
ローカルなコンテキストと多様なグローバルなコンテキストをキャプチャする選択的なメカニズムで、2ストリームのアテンションモデルを拡張する。
論文 参考訳(メタデータ) (2022-01-05T14:23:30Z) - When Does Translation Require Context? A Data-driven, Multilingual
Exploration [71.43817945875433]
談話の適切な処理は機械翻訳(MT)の品質に大きく貢献する
文脈認識型MTにおける最近の研究は、評価中に少量の談話現象を標的にしようとしている。
談話現象のモデル性能を識別・評価するタグの集合である,多言語談話認識ベンチマークを開発した。
論文 参考訳(メタデータ) (2021-09-15T17:29:30Z) - Contrastive Learning for Context-aware Neural Machine TranslationUsing
Coreference Information [14.671424999873812]
ソース文と文脈文のコア参照に基づく新しいデータ拡張とコントラスト学習方式であるCorefCLを提案する。
コンテキスト文で検出されたコア参照の言及を自動的に破損させることで、CorefCLはコア参照の不整合に敏感なモデルをトレーニングすることができる。
実験では,英語・ドイツ語・韓国語タスクの比較モデルのBLEUを一貫して改善した。
論文 参考訳(メタデータ) (2021-09-13T05:18:47Z) - Revisiting Context Choices for Context-aware Machine Translation [0.7741539072749042]
マルチソーストランスモデルでは,標準的なトランスモデルよりも機械翻訳が優れていることを示す。
また、ドメイン内コンテキストをランダムにシャッフルすることで、ベースラインを上回りながら、正しいコンテキストは翻訳品質をさらに向上させることができることを示す。
論文 参考訳(メタデータ) (2021-09-07T11:03:34Z) - Context-Adaptive Document-Level Neural Machine Translation [1.52292571922932]
モデルが必要かつ有用なコンテキストを適用できるようにするデータ適応メソッドを紹介します。
実験によれば、提案手法は1.99 bleu ポイントのゲインで従来の手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-04-16T17:43:58Z) - Learning Contextualized Sentence Representations for Document-Level
Neural Machine Translation [59.191079800436114]
文書レベルの機械翻訳は、文間の依存関係をソース文の翻訳に組み込む。
本稿では,ニューラルマシン翻訳(NMT)を訓練し,文のターゲット翻訳と周辺文の双方を予測することによって,文間の依存関係をモデル化するフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-30T03:38:01Z) - Towards Making the Most of Context in Neural Machine Translation [112.9845226123306]
我々は、これまでの研究がグローバルな文脈をはっきりと利用しなかったと論じている。
本研究では,各文の局所的文脈を意図的にモデル化する文書レベルNMTフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T03:30:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。