論文の概要: Presenting Simultaneous Translation in Limited Space
- arxiv url: http://arxiv.org/abs/2009.09016v1
- Date: Fri, 18 Sep 2020 18:37:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 02:59:35.124933
- Title: Presenting Simultaneous Translation in Limited Space
- Title(参考訳): 有限空間における同時翻訳の提示
- Authors: Dominik Mach\'a\v{c}ek, Ond\v{r}ej Bojar
- Abstract要約: 長文音声の自動同時翻訳のいくつかの方法は、出力のリビジョン、低レイテンシのためのトレーディング精度を許容する。
購読は素早く、漸進的に、読みに十分な時間で表示されなければならない。
テストセットの品質,レイテンシ,安定性を計測し,自動翻訳とサブティットリングの組み合わせの全体的なユーザビリティを推定する方法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Some methods of automatic simultaneous translation of a long-form speech
allow revisions of outputs, trading accuracy for low latency. Deploying these
systems for users faces the problem of presenting subtitles in a limited space,
such as two lines on a television screen. The subtitles must be shown promptly,
incrementally, and with adequate time for reading. We provide an algorithm for
subtitling. Furthermore, we propose a way how to estimate the overall usability
of the combination of automatic translation and subtitling by measuring the
quality, latency, and stability on a test set, and propose an improved measure
for translation latency.
- Abstract(参考訳): 長文音声の自動同時翻訳のいくつかの方法は、出力のリビジョン、低レイテンシのためのトレーディング精度を許容する。
これらのシステムをユーザにデプロイすることは、テレビ画面上の2行など、限られたスペースで字幕を提示する問題に直面している。
字幕は素早く、漸進的に、読みに十分な時間で表示されなければならない。
我々は置換のためのアルゴリズムを提供する。
さらに,テストセットの品質,レイテンシ,安定性を計測することにより,自動翻訳とサブタイトの組み合わせの全体的なユーザビリティを推定する方法を提案し,翻訳レイテンシの測定方法を提案する。
関連論文リスト
- Average Token Delay: A Duration-aware Latency Metric for Simultaneous
Translation [16.954965417930254]
我々は,emphAverage Token Delay (ATD) と呼ばれる同時翻訳のための新しい遅延評価指標を提案する。
Ear-Voice Span(EVS)に基づくユーザ側レイテンシのシミュレーションによる効果の実証を行った。
論文 参考訳(メタデータ) (2023-11-24T08:53:52Z) - Incremental Blockwise Beam Search for Simultaneous Speech Translation
with Controllable Quality-Latency Tradeoff [49.75167556773752]
ブロックワイズ・セルフアテンショナル・エンコーダ・モデル(英語版)は、同時音声翻訳において有望なエンドツーエンドのアプローチとして登場した。
本稿では、局所的な合意や品質レイテンシ制御のための$nのポリシーを組み込んだインクリメンタルなブロックワイドビームサーチを提案する。
論文 参考訳(メタデータ) (2023-09-20T14:59:06Z) - DiariST: Streaming Speech Translation with Speaker Diarization [53.595990270899414]
本稿では,最初のストリーミングSTとSDソリューションであるDiariSTを提案する。
ニューラルトランスデューサベースのストリーミングSTシステム上に構築され、トークンレベルのシリアライズされた出力トレーニングとtベクタを統合している。
重なり合う音声のストリーミング推論を行いながら,Whisperに基づくオフラインシステムと比較して強いSTとSD能力を実現する。
論文 参考訳(メタデータ) (2023-09-14T19:33:27Z) - Improving Isochronous Machine Translation with Target Factors and
Auxiliary Counters [71.02335065794384]
本稿では,目標言語音素列と連続した継続時間を予測するために,変圧器モデルに目標因子を導入する。
また,本モデルでは,従来よりも翻訳品質と等時性の向上が図られている。
論文 参考訳(メタデータ) (2023-05-22T16:36:04Z) - Average Token Delay: A Latency Metric for Simultaneous Translation [21.142539715996673]
Average Token Delay (ATD) と呼ばれる新しい遅延評価指標を提案する。
シミュレーション例を用いてATDの利点を考察するとともに,ATDと平均ラギングの違いと同時翻訳実験について検討する。
論文 参考訳(メタデータ) (2022-11-22T06:45:13Z) - Data-Driven Adaptive Simultaneous Machine Translation [51.01779863078624]
適応型SimulMTのための新しい,効率的なトレーニング手法を提案する。
本手法は,翻訳の質やレイテンシという点で,全ての強靭なベースラインを上回ります。
論文 参考訳(メタデータ) (2022-04-27T02:40:21Z) - Optimizing Latency for Online Video CaptioningUsing Audio-Visual
Transformers [54.705393237822044]
本稿では,レイテンシとキャプション品質のトレードオフに基づいて,各キャプションの出力タイミングを最適化する手法を提案する。
オーディオ映像トランスフォーマーは、すべてのビデオフレームのごく一部だけを使用して、接地木字幕を生成するように訓練される。
CNNベースのタイミング検出器もトレーニングされ、適切な出力タイミングを検出し、2つのトランスフォーマーによって生成されたキャプションが十分に近接する。
論文 参考訳(メタデータ) (2021-08-04T16:20:00Z) - Simultaneous Speech Translation for Live Subtitling: from Delay to
Display [13.35771688595446]
ライブサブタイピングにおける同時音声翻訳(SimulST)の実現可能性について検討する。
我々はSimulSTシステムに翻訳とともに字幕ブレークを予測する。
本稿では,スクロール行に字幕を表示することで,予測ブレーク構造を利用した表示モードを提案する。
論文 参考訳(メタデータ) (2021-07-19T12:35:49Z) - Stream-level Latency Evaluation for Simultaneous Machine Translation [5.50178437495268]
同時翻訳は最近、大幅な品質改善とストリーミングアプリケーションの出現により、勢いを増している。
本研究は,出力変換に適用した再分割手法に基づいて,現在の遅延対策のストリームレベル適応を提案する。
論文 参考訳(メタデータ) (2021-04-18T11:16:17Z) - SimulMT to SimulST: Adapting Simultaneous Text Translation to End-to-End
Simultaneous Speech Translation [23.685648804345984]
テキストの同時翻訳とエンドツーエンドの音声翻訳は、最近大きな進歩を遂げているが、これらのタスクを組み合わさった作業はほとんどない。
我々は,事前決定モジュールを導入することで,待ち時間や単調マルチヘッドといった同時テキスト翻訳手法をエンドツーエンドの同時音声翻訳に適応させる方法について検討する。
固定およびフレキシブルな事前決定と固定およびフレキシブルなポリシーを組み合わせることで、レイテンシ品質のトレードオフを詳細に分析する。
論文 参考訳(メタデータ) (2020-11-03T22:47:58Z) - SimulEval: An Evaluation Toolkit for Simultaneous Translation [59.02724214432792]
テキストと音声の同時翻訳は、リアルタイムと低レイテンシのシナリオに焦点を当てている。
SimulEvalは、テキストと音声の同時翻訳のための、使いやすくて汎用的な評価ツールキットである。
論文 参考訳(メタデータ) (2020-07-31T17:44:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。