論文の概要: End-to-End Lexically Constrained Machine Translation for Morphologically
Rich Languages
- arxiv url: http://arxiv.org/abs/2106.12398v2
- Date: Thu, 24 Jun 2021 14:21:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-25 11:58:00.093408
- Title: End-to-End Lexically Constrained Machine Translation for Morphologically
Rich Languages
- Title(参考訳): 形態的にリッチな言語に対する語彙制約付き機械翻訳
- Authors: Josef Jon and Jo\~ao Paulo Aires and Du\v{s}an Vari\v{s} and
Ond\v{r}ej Bojar
- Abstract要約: 本研究は, 機械翻訳による単語の正しいインフレクションを許容する機構について検討する。
英語とチェコ語のペアを用いた実験により, 自動評価と手動評価の両方において, 制約付き単語の翻訳が改良されることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Lexically constrained machine translation allows the user to manipulate the
output sentence by enforcing the presence or absence of certain words and
phrases. Although current approaches can enforce terms to appear in the
translation, they often struggle to make the constraint word form agree with
the rest of the generated output. Our manual analysis shows that 46% of the
errors in the output of a baseline constrained model for English to Czech
translation are related to agreement. We investigate mechanisms to allow neural
machine translation to infer the correct word inflection given lemmatized
constraints. In particular, we focus on methods based on training the model
with constraints provided as part of the input sequence. Our experiments on the
English-Czech language pair show that this approach improves the translation of
constrained terms in both automatic and manual evaluation by reducing errors in
agreement. Our approach thus eliminates inflection errors, without introducing
new errors or decreasing the overall quality of the translation.
- Abstract(参考訳): 語彙的に制約された機械翻訳では、特定の単語やフレーズの存在や欠如を強制して出力文を操作できる。
現在のアプローチでは、翻訳に現れる用語を強制することはできるが、制約語形式を生成された出力の他の部分と一致させるのに苦労することが多い。
手動分析の結果、英語からチェコ語への翻訳における基準制約モデルの出力エラーの46%が合意に関連していることがわかった。
本研究は, 機械翻訳による単語の正しいインフレクションを許容する機構について検討する。
特に,入力シーケンスの一部として制約を付与したモデルトレーニングに基づく手法に着目した。
本手法は, 自動評価と手動評価の両方における制約項の翻訳を, 一致の誤りを減らすことにより改善することを示す。
提案手法は,新しい誤りや翻訳の全体的な品質を低下させることなく,屈折誤差を除去する。
関連論文リスト
- Translate-and-Revise: Boosting Large Language Models for Constrained Translation [42.37981028583618]
制約付き翻訳には,大規模言語モデル(LLM)の機能を利用する。
LLMは、翻訳命令や制約をプロンプトとして取り込むことで、このタスクに容易に適応できる。
標準LLMよりも制約に基づく翻訳精度が15%向上したことを示す。
論文 参考訳(メタデータ) (2024-07-18T05:08:09Z) - An Analysis of BPE Vocabulary Trimming in Neural Machine Translation [56.383793805299234]
語彙トリミング(vocabulary trimming)は、まれなサブワードをコンポーネントサブワードに置き換える後処理のステップである。
ボキャブラリトリミングは性能向上に失敗し,さらに大きな劣化を招きやすいことを示す。
論文 参考訳(メタデータ) (2024-03-30T15:29:49Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - Negative Lexical Constraints in Neural Machine Translation [1.3124513975412255]
負の語彙制約は、神経翻訳モデルによって生成された翻訳における特定の単語や表現を禁止するために用いられる。
復号処理やトレーニングデータの変更に基づいて,様々な手法を比較した。
この手法が制約を改善することを実証するが、多くの場合、問題は持続する。
論文 参考訳(メタデータ) (2023-08-07T14:04:15Z) - Towards Fine-Grained Information: Identifying the Type and Location of
Translation Errors [80.22825549235556]
既存のアプローチでは、エラーの位置と型を同期的に考慮することはできない。
我々はtextbf の追加と textbfomission エラーを予測するために FG-TED モデルを構築した。
実験により,本モデルではエラータイプと位置の同時同定が可能であり,最先端の結果が得られた。
論文 参考訳(メタデータ) (2023-02-17T16:20:33Z) - ngram-OAXE: Phrase-Based Order-Agnostic Cross Entropy for
Non-Autoregressive Machine Translation [51.06378042344563]
オートレグレッシブ翻訳(NAT)におけるマルチモーダリティの効果を改善できる新しい訓練用Oaxe損失が証明された
我々は、ngram 句間の並べ替えのみを許し、句内の単語順序の厳密な一致をいまだ必要とすることで oaxe を拡張する。
さらに分析したところ、ngram-oaxeは実際にngram句の翻訳を改善し、文構造をより良くモデル化してより流動的な翻訳を生成することがわかった。
論文 参考訳(メタデータ) (2022-10-08T11:39:15Z) - DEEP: DEnoising Entity Pre-training for Neural Machine Translation [123.6686940355937]
機械翻訳モデルは通常、トレーニングコーパスで稀な名前付きエンティティの翻訳を貧弱に生成することが示されている。
文中の名前付きエンティティ翻訳精度を向上させるために,大量のモノリンガルデータと知識ベースを利用するDenoising Entity Pre-training法であるDEEPを提案する。
論文 参考訳(メタデータ) (2021-11-14T17:28:09Z) - Improving Translation Robustness with Visual Cues and Error Correction [58.97421756225425]
ノイズの多いテキストに対する翻訳の堅牢性を改善するビジュアルコンテキストのアイデアを紹介します。
また,誤り訂正を補助タスクとして扱うことで,新しい誤り訂正訓練手法を提案する。
論文 参考訳(メタデータ) (2021-03-12T15:31:34Z) - Lexically Cohesive Neural Machine Translation with Copy Mechanism [21.43163704217968]
我々は、従来の出力からの単語のコピーを可能にするために、文脈認識型ニューラルネットワーク翻訳モデルにコピー機構を用いる。
談話翻訳のための評価データセットを用いて、日本語から英語への翻訳実験を行う。
論文 参考訳(メタデータ) (2020-10-11T08:39:02Z) - Computer Assisted Translation with Neural Quality Estimation and
Automatic Post-Editing [18.192546537421673]
本稿では,機械翻訳出力の品質推定と自動編集のためのエンドツーエンドのディープラーニングフレームワークを提案する。
我々のゴールは、誤り訂正の提案を提供することであり、解釈可能なモデルにより、人間の翻訳者の負担を軽減することである。
論文 参考訳(メタデータ) (2020-09-19T00:29:00Z) - Machine Translation with Unsupervised Length-Constraints [12.376309678270275]
翻訳が与えられたフォーマットで表示される必要がある場合、私たちは長さの制約に焦点を合わせます。
テキスト圧縮をまず翻訳し、次に文章圧縮を実行する従来の方法と比較して、テキスト圧縮は完全に教師なしである。
制約の下で翻訳品質を大幅に改善することができます。
論文 参考訳(メタデータ) (2020-04-07T07:55:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。