論文の概要: Improving Simultaneous Translation by Incorporating Pseudo-References
with Fewer Reorderings
- arxiv url: http://arxiv.org/abs/2010.11247v2
- Date: Thu, 23 Sep 2021 17:33:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 00:10:07.244373
- Title: Improving Simultaneous Translation by Incorporating Pseudo-References
with Fewer Reorderings
- Title(参考訳): 順序変更の少ない擬似参照を組み込んだ同時翻訳の改善
- Authors: Junkun Chen, Renjie Zheng, Atsuhito Kita, Mingbo Ma, Liang Huang
- Abstract要約: 本稿では,既存の全文コーパスのターゲット側を同時翻訳に書き換える手法を提案する。
Zh->En と Ja->En の同時翻訳実験は、これらの擬似参照の追加により大幅に改善された。
- 参考スコア(独自算出の注目度): 24.997435410680378
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Simultaneous translation is vastly different from full-sentence translation,
in the sense that it starts translation before the source sentence ends, with
only a few words delay. However, due to the lack of large-scale, high-quality
simultaneous translation datasets, most such systems are still trained on
conventional full-sentence bitexts. This is far from ideal for the simultaneous
scenario due to the abundance of unnecessary long-distance reorderings in those
bitexts. We propose a novel method that rewrites the target side of existing
full-sentence corpora into simultaneous-style translation. Experiments on
Zh->En and Ja->En simultaneous translation show substantial improvements (up to
+2.7 BLEU) with the addition of these generated pseudo-references.
- Abstract(参考訳): 同時翻訳は、原文が終わる前に翻訳を開始するという意味では、フルセンテンス翻訳とは大きく異なる。
しかし、大規模で高品質な同時翻訳データセットが不足しているため、ほとんどのシステムは従来の完全文ビットックスで訓練されている。
これは、これらのバイテキストに不要な長距離再注文が豊富にあるため、同時シナリオには理想的ではない。
本稿では,既存の全文コーパスのターゲット側を同時翻訳に書き換える手法を提案する。
Zh->En と Ja->En 同時翻訳の実験では、生成した擬似参照を追加することにより、大幅な改善(+2.7 BLEU)が見られた。
関連論文リスト
- High-Fidelity Simultaneous Speech-To-Speech Translation [75.69884829562591]
本稿では,同時音声翻訳のためのデコーダのみのモデルであるHibikiを紹介する。
Hibikiは、マルチストリーム言語モデルを利用して、ソースとターゲットの音声を同期的に処理し、テキストとオーディオトークンを共同で生成し、音声からテキストへの変換と音声から音声への変換を行う。
論文 参考訳(メタデータ) (2025-02-05T17:18:55Z) - Modeling Context With Linear Attention for Scalable Document-Level
Translation [72.41955536834702]
本稿では,近年の文書翻訳における線形アテンションモデルの有効性について検討し,直流帰納バイアスを促進するためにセンデンシャルゲートで拡張する。
感性ゲーティングはIWSLTの翻訳品質をさらに向上させることを示す。
論文 参考訳(メタデータ) (2022-10-16T03:41:50Z) - Data-Driven Adaptive Simultaneous Machine Translation [51.01779863078624]
適応型SimulMTのための新しい,効率的なトレーニング手法を提案する。
本手法は,翻訳の質やレイテンシという点で,全ての強靭なベースラインを上回ります。
論文 参考訳(メタデータ) (2022-04-27T02:40:21Z) - Anticipation-free Training for Simultaneous Translation [70.85761141178597]
同時翻訳(SimulMT)は、原文が完全に利用可能になる前に翻訳を開始することで翻訳プロセスを高速化する。
既存の手法は遅延を増大させるか、SimulMTモデルに適応的な読み書きポリシーを導入し、局所的なリオーダーを処理し、翻訳品質を改善する。
本稿では,翻訳過程をモノトニック翻訳ステップと並べ替えステップに分解する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-01-30T16:29:37Z) - BitextEdit: Automatic Bitext Editing for Improved Low-Resource Machine
Translation [53.55009917938002]
自動編集によりマイニングしたビットクストを改良することを提案する。
提案手法は,5つの低リソース言語ペアと10の翻訳方向に対して,最大8個のBLEUポイントでCCMatrixマイニングビットクストの品質を向上することを示す。
論文 参考訳(メタデータ) (2021-11-12T16:00:39Z) - Monotonic Simultaneous Translation with Chunk-wise Reordering and
Refinement [38.89496608319392]
本稿では,全文翻訳コーパスの目的側を並べ替え,洗練するアルゴリズムを提案する。
ソースとターゲットの文間の単語/フレーズは、単語アライメントと非自己回帰型ニューラルマシン翻訳を用いて、主に単調に配列される。
提案手法はBLEUのスコアを改良し,結果の翻訳により文の単調性が向上する。
論文 参考訳(メタデータ) (2021-10-18T22:51:21Z) - Sentence Concatenation Approach to Data Augmentation for Neural Machine
Translation [22.316934668106526]
本研究では,長文処理のための簡易データ拡張手法を提案する。
与えられた並列コーパスのみをトレーニングデータとして使用し、2つの文を連結して長文を生成する。
提案手法により, 逆翻訳と組み合わせた翻訳品質がさらに向上した。
論文 参考訳(メタデータ) (2021-04-17T08:04:42Z) - SimulEval: An Evaluation Toolkit for Simultaneous Translation [59.02724214432792]
テキストと音声の同時翻訳は、リアルタイムと低レイテンシのシナリオに焦点を当てている。
SimulEvalは、テキストと音声の同時翻訳のための、使いやすくて汎用的な評価ツールキットである。
論文 参考訳(メタデータ) (2020-07-31T17:44:41Z) - Opportunistic Decoding with Timely Correction for Simultaneous
Translation [28.897290991945734]
本稿では,時間的補正能力を持つ機会論的復号手法を提案する。
実験の結果,中国語と英語と中国語の翻訳では8%以下で,レイテンシの大幅な低減とBLEUの+3.1増加を実現していることがわかった。
論文 参考訳(メタデータ) (2020-05-02T01:41:02Z) - Re-translation versus Streaming for Simultaneous Translation [14.800214853561823]
本研究では,厳密な付加語以上の仮説の修正が許される問題について検討する。
この設定では、カスタムストリーミングアプローチと再翻訳を比較します。
再翻訳は最先端のストリーミングシステムと同じくらい良いか良いかのどちらかだと考えています。
論文 参考訳(メタデータ) (2020-04-07T18:27:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。