論文の概要: Improved Data Augmentation for Translation Suggestion
- arxiv url: http://arxiv.org/abs/2210.06138v1
- Date: Wed, 12 Oct 2022 12:46:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 14:00:54.516592
- Title: Improved Data Augmentation for Translation Suggestion
- Title(参考訳): 翻訳提案のための改良されたデータ拡張
- Authors: Hongxiao Zhang, Siyu Lai, Songming Zhang, Hui Huang, Yufeng Chen,
Jinan Xu, Jian Liu
- Abstract要約: 本稿では,WMT'22翻訳提案共有タスクに使用するシステムについて紹介する。
我々は3つの戦略を用いて並列コーパスから合成データを構築し、教師付きデータの欠如を補う。
私たちはそれぞれ、英語とドイツ語と英語と中国語の双方向タスクで第2位と第3位にランク付けします。
- 参考スコア(独自算出の注目度): 28.672227843541656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Translation suggestion (TS) models are used to automatically provide
alternative suggestions for incorrect spans in sentences generated by machine
translation. This paper introduces the system used in our submission to the
WMT'22 Translation Suggestion shared task. Our system is based on the ensemble
of different translation architectures, including Transformer, SA-Transformer,
and DynamicConv. We use three strategies to construct synthetic data from
parallel corpora to compensate for the lack of supervised data. In addition, we
introduce a multi-phase pre-training strategy, adding an additional
pre-training phase with in-domain data. We rank second and third on the
English-German and English-Chinese bidirectional tasks, respectively.
- Abstract(参考訳): 翻訳提案(TS)モデルは、機械翻訳によって生成された文の誤りスパンを自動的に提案するために使用される。
本稿では,WMT'22翻訳提案共有タスクに使用するシステムを紹介する。
本システムは,Transformer,SA-Transformer,DynamicConvなど,さまざまな翻訳アーキテクチャのアンサンブルに基づいている。
我々は3つの戦略を用いて並列コーパスから合成データを構築し、教師付きデータの欠如を補う。
さらに,マルチフェーズ事前学習戦略を導入し,ドメイン内データによる事前学習を付加する。
私たちはそれぞれ、英語とドイツ語と英語と中国語の双方向タスクで2位と3位にランク付けします。
関連論文リスト
- Neural Machine Translation with Contrastive Translation Memories [71.86990102704311]
Retrieval-augmented Neural Machine Translationモデルは、多くの翻訳シナリオで成功している。
そこで本論文では,新たに検索拡張NMTを提案し,ソース文と相似なコントラスト検索された翻訳記憶をモデル化する。
訓練段階では、目標文に対する各TMの健全な特徴を学習するために、マルチTMコントラスト学習目標を導入する。
論文 参考訳(メタデータ) (2022-12-06T17:10:17Z) - Effective General-Domain Data Inclusion for the Machine Translation Task
by Vanilla Transformers [0.0]
本稿では,ドイツ語のソース文を英語のターゲット文に翻訳可能なトランスフォーマーベースシステムを提案する。
我々はWMT'13データセットから、ニュースコメンタリーなドイツ語-英語並列文の実験を行った。
We found that including the IWSLT'16 dataset in training help a gain of 2 BLEU score points on the test set of the WMT'13 dataset。
論文 参考訳(メタデータ) (2022-09-28T13:14:49Z) - The YiTrans End-to-End Speech Translation System for IWSLT 2022 Offline
Shared Task [92.5087402621697]
本稿では,IWSLT 2022オフラインタスクに対するエンドツーエンドYiTrans音声翻訳システムの提案について述べる。
YiTransシステムは、大規模な訓練済みエンコーダデコーダモデル上に構築されている。
最終提出は自動評価基準でまず英語・ドイツ語・英語・中国語のエンド・ツー・エンド・システムにランク付けする。
論文 参考訳(メタデータ) (2022-06-12T16:13:01Z) - Non-Parametric Domain Adaptation for End-to-End Speech Translation [72.37869362559212]
E2E-ST(End-to-End Speech Translation)は、エラー伝播の低減、レイテンシの低減、パラメータの削減などにより注目されている。
本稿では,E2E-STシステムのドメイン適応を実現するために,ドメイン固有のテキスト翻訳コーパスを活用する新しい非パラメトリック手法を提案する。
論文 参考訳(メタデータ) (2022-05-23T11:41:02Z) - Multilingual Machine Translation Systems from Microsoft for WMT21 Shared
Task [95.06453182273027]
本報告では、大規模多言語機械翻訳におけるWMT21共有タスクのためのMicrosoftの機械翻訳システムについて述べる。
共有タスクへのモデル提出はDeltaLMnotefooturlhttps://aka.ms/deltalmで行われました。
最終提出は自動評価基準で3トラックにランクインした。
論文 参考訳(メタデータ) (2021-11-03T09:16:17Z) - Improving Neural Machine Translation by Bidirectional Training [85.64797317290349]
我々は、ニューラルネットワーク翻訳のためのシンプルで効果的な事前学習戦略である双方向トレーニング(BiT)を提案する。
具体的には、初期モデルのパラメータを双方向に更新し、正常にモデルを調整する。
実験の結果,BiTは8つの言語対上の15の翻訳タスクに対して,SOTAニューラルマシン翻訳性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2021-09-16T07:58:33Z) - Tilde at WMT 2020: News Task Systems [0.38073142980733]
本稿では、Tilde氏がWMT 2020に投稿した英語とポーランド語の両方の方向のニュース翻訳タスクについて述べる。
我々は,形態的に動機づけたサブワード単位ベースのトランスフォーマーベースモデルとして,ベースラインシステムを構築している。
最終モデルはTransformerベースとTransformerビッグモデルのアンサンブルで、左右に並べ替えられる。
論文 参考訳(メタデータ) (2020-10-29T08:59:37Z) - Explicit Reordering for Neural Machine Translation [50.70683739103066]
Transformer-based neural machine translation (NMT)では、位置符号化機構は、自己アテンションネットワークが順序依存でソース表現を学習するのに役立つ。
本研究では,トランスフォーマーベースのNMTに対して,このリオーダ情報を明示的にモデル化する新しいリオーダ手法を提案する。
WMT14, WAT ASPEC日本語訳, WMT17中国語訳の実証結果から, 提案手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-04-08T05:28:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。