Fugu-MT 論文翻訳(概要): Multi-perspective Alignment for Increasing Naturalness in Neural Machine Translation

論文の概要: Multi-perspective Alignment for Increasing Naturalness in Neural Machine Translation

arxiv url: http://arxiv.org/abs/2412.08473v1
Date: Wed, 11 Dec 2024 15:42:22 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-12 23:20:26.723959
Title: Multi-perspective Alignment for Increasing Naturalness in Neural Machine Translation
Title（参考訳）: ニューラルネットワーク翻訳における自然性向上のための多視点アライメント
Authors: Huiyuan Lai, Esther Ploeger, Rik van Noord, Antonio Toral,
Abstract要約: ニューラルマシン翻訳(NMT)システムは、トレーニングデータに存在する語彙バイアスを増幅し、出力翻訳において人工的に不十分な言語を生み出す。自然とコンテンツ保存の両方に報いる新しい方法を提案する。本手法は英蘭文翻訳において評価され,翻訳精度を損なうことなく,語彙的に豊かで,人文言語の性質が向上する翻訳モデルが得られた。
参考スコア（独自算出の注目度）: 11.875491080062233
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Neural machine translation (NMT) systems amplify lexical biases present in their training data, leading to artificially impoverished language in output translations. These language-level characteristics render automatic translations different from text originally written in a language and human translations, which hinders their usefulness in for example creating evaluation datasets. Attempts to increase naturalness in NMT can fall short in terms of content preservation, where increased lexical diversity comes at the cost of translation accuracy. Inspired by the reinforcement learning from human feedback framework, we introduce a novel method that rewards both naturalness and content preservation. We experiment with multiple perspectives to produce more natural translations, aiming at reducing machine and human translationese. We evaluate our method on English-to-Dutch literary translation, and find that our best model produces translations that are lexically richer and exhibit more properties of human-written language, without loss in translation accuracy.
Abstract（参考訳）: ニューラルマシン翻訳(NMT)システムは、トレーニングデータに存在する語彙バイアスを増幅し、出力翻訳において人工的に不十分な言語を生み出す。これらの言語レベルの特徴は、もともと言語で書かれたテキストと人間の翻訳とは異なる自動翻訳をレンダリングする。 NMTの自然性を高める試みは、翻訳精度を犠牲にして語彙の多様性を増大させるコンテンツ保存の観点からは不足する可能性がある。人間のフィードバックフレームワークからの強化学習に触発され,自然さとコンテンツ保存の両面に報いる新しい手法を導入する。我々は、機械翻訳と人間翻訳の削減を目的として、より自然な翻訳を生成するために、複数の視点で実験を行った。本手法は英蘭文翻訳において評価され,翻訳精度を損なうことなく,語彙的に豊かで,人文言語の性質が向上する翻訳モデルが得られた。

関連論文リスト

Lost in Literalism: How Supervised Training Shapes Translationese in LLMs [51.04435855143767]
大規模言語モデル(LLM)は機械翻訳において顕著な成功を収めた。しかし、過度にリテラルと不自然な翻訳を特徴とする翻訳は、依然として永続的な課題である。我々は、黄金の基準を磨き、不自然なトレーニングインスタンスをフィルタリングするなど、これらのバイアスを軽減する方法を導入する。
論文参考訳（メタデータ） (2025-03-06T12:14:45Z)
Advancing Translation Preference Modeling with RLHF: A Step Towards Cost-Effective Solution [57.42593422091653]
人間のフィードバックによる強化学習の活用による翻訳品質の向上について検討する。強力な言語能力を持つ報酬モデルは、翻訳品質の微妙な違いをより敏感に学習することができる。
論文参考訳（メタデータ） (2024-02-18T09:51:49Z)
Crossing the Threshold: Idiomatic Machine Translation through Retrieval Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文参考訳（メタデータ） (2023-10-10T23:47:25Z)
The Best of Both Worlds: Combining Human and Machine Translations for Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文参考訳（メタデータ） (2023-05-22T05:57:47Z)
Towards Debiasing Translation Artifacts [15.991970288297443]
確立されたバイアス除去手法を拡張して,翻訳文の削減のための新しい手法を提案する。我々は、反復的ヌル空間投影(INLP)アルゴリズムを用いて、デバイアス前後の分類精度を計測することにより、文レベルと単語レベルの両方で翻訳文が削減されることを示す。我々の知る限りでは、これは潜伏埋め込み空間で表現される翻訳語をデビアスする最初の研究である。
論文参考訳（メタデータ） (2022-05-16T21:46:51Z)
DEEP: DEnoising Entity Pre-training for Neural Machine Translation [123.6686940355937]
機械翻訳モデルは通常、トレーニングコーパスで稀な名前付きエンティティの翻訳を貧弱に生成することが示されている。文中の名前付きエンティティ翻訳精度を向上させるために,大量のモノリンガルデータと知識ベースを利用するDenoising Entity Pre-training法であるDEEPを提案する。
論文参考訳（メタデータ） (2021-11-14T17:28:09Z)
Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文参考訳（メタデータ） (2020-04-09T17:54:30Z)
Incorporating Bilingual Dictionaries for Low Resource Semi-Supervised Neural Machine Translation [5.958653653305609]
我々は、単語・バイ・ワードの翻訳によって合成文を生成する、広く利用可能なバイリンガル辞書を組み込んだ。これにより、高品質なコンテンツを維持しながら、モデルの語彙を自動的に拡張する。
論文参考訳（メタデータ） (2020-04-05T02:14:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。