論文の概要: From Simultaneous to Streaming Machine Translation by Leveraging
Streaming History
- arxiv url: http://arxiv.org/abs/2203.02459v1
- Date: Fri, 4 Mar 2022 17:41:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-07 14:52:24.307719
- Title: From Simultaneous to Streaming Machine Translation by Leveraging
Streaming History
- Title(参考訳): ストリーミング履歴を活用した同時翻訳からストリーミング機械翻訳へ
- Authors: Javier Iranzo-S\'anchez and Jorge Civera and Alfons Juan
- Abstract要約: 同時機械翻訳(英: Simultaneous Machine Translation)は、入力文が完全に利用可能になる前に漸進的に翻訳するタスクである。
ストリーム MT は連続的な入力テキストストリームの漸進的変換への同時 MT の拡張と解釈できる。
本研究では、ストリーミング履歴を活用することで、最先端の文レベルMTシステムをストリーミング設定に拡張する。
- 参考スコア(独自算出の注目度): 4.831134508326648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Simultaneous Machine Translation is the task of incrementally translating an
input sentence before it is fully available. Currently, simultaneous
translation is carried out by translating each sentence independently of the
previously translated text. More generally, Streaming MT can be understood as
an extension of Simultaneous MT to the incremental translation of a continuous
input text stream. In this work, a state-of-the-art simultaneous sentence-level
MT system is extended to the streaming setup by leveraging the streaming
history. Extensive empirical results are reported on IWSLT Translation Tasks,
showing that leveraging the streaming history leads to significant quality
gains. In particular, the proposed system proves to compare favorably to the
best performing systems.
- Abstract(参考訳): 同時機械翻訳は、完全に利用可能になる前に入力文を漸進的に翻訳するタスクである。
現在、それまでの翻訳テキストとは独立して各文を翻訳することで同時翻訳を行う。
より一般的には、ストリーム MT は連続的な入力テキストストリームの漸進的な変換への同時 MT の拡張と解釈できる。
本研究では、ストリーミング履歴を活用することで、最先端の文レベルMTシステムをストリーミング設定に拡張する。
iwslt翻訳タスクに関する広範な実験結果が報告されており、ストリーミング履歴を活用すると大幅な品質向上が期待できる。
特に,提案システムは,最高の性能を持つシステムと比較して好意的に比較できる。
関連論文リスト
- TasTe: Teaching Large Language Models to Translate through Self-Reflection [82.83958470745381]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示した。
本稿では,自己回帰を通した翻訳を行うTasTeフレームワークを提案する。
WMT22ベンチマークにおける4つの言語方向の評価結果から,既存の手法と比較して,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-06-12T17:21:21Z) - Speech Translation with Large Language Models: An Industrial Practice [64.5419534101104]
LLM-STは,事前学習型大言語モデル(LLM)に基づいて構築された,新規で効果的な音声翻訳モデルである。
大規模言語モデル(LLM)を音声エンコーダと統合し、マルチタスクの命令チューニングを利用することで、LLM-STは正確なタイムスタンプと翻訳を生成することができる。
英語と中国語のデータセットの厳密な実験を通じて,LLM-STの異常な性能を示す。
論文 参考訳(メタデータ) (2023-12-21T05:32:49Z) - Leveraging Timestamp Information for Serialized Joint Streaming
Recognition and Translation [51.399695200838586]
本稿では,マルチ・ツー・ワン・ワン・マン・ワン・ツー・マンの同時生成が可能なストリーミングトランスフォーマー・トランスデューサ(T-T)モデルを提案する。
実験では,1個のデコーダで1対1のジョイント出力を初めて生成し,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2023-10-23T11:00:27Z) - DiariST: Streaming Speech Translation with Speaker Diarization [53.595990270899414]
本稿では,最初のストリーミングSTとSDソリューションであるDiariSTを提案する。
ニューラルトランスデューサベースのストリーミングSTシステム上に構築され、トークンレベルのシリアライズされた出力トレーニングとtベクタを統合している。
重なり合う音声のストリーミング推論を行いながら,Whisperに基づくオフラインシステムと比較して強いSTとSD能力を実現する。
論文 参考訳(メタデータ) (2023-09-14T19:33:27Z) - STEMM: Self-learning with Speech-text Manifold Mixup for Speech
Translation [37.51435498386953]
本稿では,その差分を補正するSTEMM法を提案する。
MuST-C音声翻訳ベンチマークおよびさらなる解析実験により,本手法はモーダル表現の不一致を効果的に軽減することが示された。
論文 参考訳(メタデータ) (2022-03-20T01:49:53Z) - The USTC-NELSLIP Systems for Simultaneous Speech Translation Task at
IWSLT 2021 [36.95800637790494]
本稿では,USTC-NELSLIP による IWSLT 2021 同時音声翻訳タスクの提出について述べる。
我々は,従来のRNN-Tをシーケンス間タスクに拡張した新しい同時翻訳モデルであるCross Attention Augmented Transducer (CAAT)を提案する。
テキスト・トゥ・テキスト(S2T)とテキスト・トゥ・テキスト(T2T)の同時翻訳タスクの実験は、CAATがより良い品質とレイテンシのトレードオフを達成することを示す。
論文 参考訳(メタデータ) (2021-07-01T08:09:00Z) - Stream-level Latency Evaluation for Simultaneous Machine Translation [5.50178437495268]
同時翻訳は最近、大幅な品質改善とストリーミングアプリケーションの出現により、勢いを増している。
本研究は,出力変換に適用した再分割手法に基づいて,現在の遅延対策のストリームレベル適応を提案する。
論文 参考訳(メタデータ) (2021-04-18T11:16:17Z) - Streaming Simultaneous Speech Translation with Augmented Memory
Transformer [29.248366441276662]
トランスフォーマーに基づくモデルは、音声翻訳タスクにおける最先端のパフォーマンスを達成した。
本稿では,拡張メモリ変換器エンコーダを備えたエンドツーエンド変換器を用いたシーケンス・ツー・シーケンスモデルを提案する。
論文 参考訳(メタデータ) (2020-10-30T18:28:42Z) - SimulEval: An Evaluation Toolkit for Simultaneous Translation [59.02724214432792]
テキストと音声の同時翻訳は、リアルタイムと低レイテンシのシナリオに焦点を当てている。
SimulEvalは、テキストと音声の同時翻訳のための、使いやすくて汎用的な評価ツールキットである。
論文 参考訳(メタデータ) (2020-07-31T17:44:41Z) - Explicit Reordering for Neural Machine Translation [50.70683739103066]
Transformer-based neural machine translation (NMT)では、位置符号化機構は、自己アテンションネットワークが順序依存でソース表現を学習するのに役立つ。
本研究では,トランスフォーマーベースのNMTに対して,このリオーダ情報を明示的にモデル化する新しいリオーダ手法を提案する。
WMT14, WAT ASPEC日本語訳, WMT17中国語訳の実証結果から, 提案手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-04-08T05:28:46Z) - Re-translation versus Streaming for Simultaneous Translation [14.800214853561823]
本研究では,厳密な付加語以上の仮説の修正が許される問題について検討する。
この設定では、カスタムストリーミングアプローチと再翻訳を比較します。
再翻訳は最先端のストリーミングシステムと同じくらい良いか良いかのどちらかだと考えています。
論文 参考訳(メタデータ) (2020-04-07T18:27:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。