論文の概要: Modeling Dual Read/Write Paths for Simultaneous Machine Translation
- arxiv url: http://arxiv.org/abs/2203.09163v1
- Date: Thu, 17 Mar 2022 08:35:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-18 13:02:20.352851
- Title: Modeling Dual Read/Write Paths for Simultaneous Machine Translation
- Title(参考訳): 同時機械翻訳のためのデュアルリード/ライトパスのモデル化
- Authors: Shaolei Zhang, Yang Feng
- Abstract要約: 本稿では、読み書きパスを誘導する双対制約を導入するDual Path SiMTを提案する。
En-ViタスクとDe-En SiMTタスクの実験により、我々の手法は全てのレイテンシで強いベースラインを上回ります。
- 参考スコア(独自算出の注目度): 21.03142288187605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Simultaneous machine translation (SiMT) outputs the translation while reading
the source sentence and hence requires a policy to determine whether to wait
for the next source word (READ) or generate a target word (WRITE), the actions
of which form a read/write path. Although the read/write path is essential to
SiMT performance, there is no direct supervision given to the path in the
existing methods. In this paper, we propose a method of Dual Path SiMT which
introduces duality constraints to guide the read/write path. According to
duality constraints, the read/write paths in source-to-target and
target-to-source SiMT models can be mapped to each other. Therefore, the SiMT
models in two directions are jointly optimized by forcing their read/write
paths to satisfy the mapping relation. Experiments on En-Vi and De-En SiMT
tasks show that our method can outperform strong baselines under all latency.
- Abstract(参考訳): 同時機械翻訳(simt)は、ソース文を読みながら翻訳を出力するため、次のソースワード(読み取り)を待つか、ターゲットワード(書き込み)を生成するかを決定するポリシーが必要となる。
SiMTのパフォーマンスにはリード/ライトパスが不可欠だが、既存のメソッドのパスに対して直接監督されることはない。
本稿では,読み取り/書き込み経路を導出するために,双対性制約を導入する双対経路simt法を提案する。
双対性制約により、ソース間およびターゲット間simtモデルの読み取り/書き込みパスを相互にマッピングすることができる。
したがって、2方向のSiMTモデルは、マッピング関係を満たすように読み書きパスを強制することによって、共同最適化される。
En-ViタスクとDe-En SiMTタスクの実験により、我々の手法は全てのレイテンシで強いベースラインを上回ります。
関連論文リスト
- PsFuture: A Pseudo-Future-based Zero-Shot Adaptive Policy for Simultaneous Machine Translation [8.1299957975257]
同時機械翻訳(SiMT)では、ストリーミングソーストークンが使用されるため、ターゲットトークンをリアルタイムで生成する必要がある。
我々は、SiMTのための最初のゼロショット適応型リード/ライトポリシーであるPsFutureを提案する。
我々は、SiMTアプリケーションのためのオフライン翻訳モデルを調整するために、新しいトレーニング戦略であるPrefix-to-Full(P2F)を導入する。
論文 参考訳(メタデータ) (2024-10-05T08:06:33Z) - TasTe: Teaching Large Language Models to Translate through Self-Reflection [82.83958470745381]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示した。
本稿では,自己回帰を通した翻訳を行うTasTeフレームワークを提案する。
WMT22ベンチマークにおける4つの言語方向の評価結果から,既存の手法と比較して,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-06-12T17:21:21Z) - Self-Modifying State Modeling for Simultaneous Machine Translation [25.11963998838586]
同時機械翻訳(SiMT)は、ストリームソース入力を受信しながらターゲット出力を生成する。
既存のSiMT手法は、様々な意思決定経路を探索することでポリシーを学習し、固有の制約に直面している。
我々は、SiMTタスクのための新しいトレーニングパラダイムであるtextbfSelf-textbfModifying textbfState textbfModeling (SM$2$)を提案する。
論文 参考訳(メタデータ) (2024-06-04T11:57:58Z) - SiLLM: Large Language Models for Simultaneous Machine Translation [41.303764786790616]
同時機械翻訳(SiMT)は、原文を読みながら翻訳を生成する。
既存のSiMT手法では、ポリシーを同時に決定し、翻訳を生成するために単一のモデルを採用している。
我々は2つのサブタスクを別々のエージェントに委譲するSiLLMを提案する。
論文 参考訳(メタデータ) (2024-02-20T14:23:34Z) - Text2MDT: Extracting Medical Decision Trees from Medical Texts [33.58610255918941]
医療用テキストから医療用決定木(MDT)を自動的に抽出する新しいタスクであるText2MDTを提案する。
我々は、MDTの形式を標準化し、医学専門家の参加を得て、中国語で注釈付きテキスト・トゥ・MDTデータセットを作成する。
論文 参考訳(メタデータ) (2024-01-04T02:33:38Z) - Simultaneous Machine Translation with Tailored Reference [35.46823126036308]
同時機械翻訳(SiMT)は、ソース文全体を読みながら翻訳を生成する。
既存のSiMTモデルは、異なるレイテンシで利用可能な様々なソース情報を無視して、同じ参照を使用してトレーニングされるのが一般的である。
そこで本研究では,異なるレイテンシでトレーニングしたSiMTモデルに対して,基底構造をリフレッシュして参照を調整した新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-20T15:32:26Z) - Cross-Modal Multi-Tasking for Speech-to-Text Translation via Hard
Parameter Sharing [72.56219471145232]
ハードパラメータ共有を伴うST/MTマルチタスクフレームワークを提案する。
本手法は,事前処理による音声文のモダリティギャップを低減する。
我々は,注意エンコーダ・デコーダ,コネクショニスト時間分類(CTC),トランスデューサ,共同CTC/アテンションモデルを平均+0.5BLEUで改善することを示す。
論文 参考訳(メタデータ) (2023-09-27T17:48:14Z) - Beyond Triplet: Leveraging the Most Data for Multimodal Machine
Translation [53.342921374639346]
マルチモーダル機械翻訳は、視覚などの他のモーダルからの情報を取り入れることで、翻訳品質を向上させることを目的としている。
従来のMMTシステムは主に視覚情報へのアクセスと利用に重点を置いており、画像関連データセット上でそれらの手法を検証する傾向がある。
本稿では,MTのための新しい手法と新しいデータセットを確立する。
論文 参考訳(メタデータ) (2022-12-20T15:02:38Z) - Source and Target Bidirectional Knowledge Distillation for End-to-end
Speech Translation [88.78138830698173]
外部テキストベースNMTモデルからのシーケンスレベルの知識蒸留(SeqKD)に注目した。
E2E-STモデルを訓練し、パラフレーズ転写を1つのデコーダで補助タスクとして予測する。
論文 参考訳(メタデータ) (2021-04-13T19:00:51Z) - Unsupervised Bitext Mining and Translation via Self-trained Contextual
Embeddings [51.47607125262885]
不整合テキストから機械翻訳(MT)のための擬似並列コーパスを作成するための教師なし手法について述べる。
我々は多言語BERTを用いて、最寄りの検索のためのソースとターゲット文の埋め込みを作成し、自己学習によりモデルを適応する。
BUCC 2017 bitextマイニングタスクで並列文ペアを抽出し,F1スコアの最大24.5ポイント増加(絶対)を従来の教師なし手法と比較して観察することで,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2020-10-15T14:04:03Z) - Neural Machine Translation: Challenges, Progress and Future [62.75523637241876]
機械翻訳(英: Machine translation, MT)は、コンピュータを利用して人間の言語を自動翻訳する技術である。
ニューラルマシン翻訳(NMT)は、ディープニューラルネットワークを用いたソース言語とターゲット言語間の直接マッピングをモデル化する。
この記事では、NMTフレームワークをレビューし、NMTの課題について論じ、最近のエキサイティングな進歩を紹介します。
論文 参考訳(メタデータ) (2020-04-13T07:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。