論文の概要: CUNI-KIT System for Simultaneous Speech Translation Task at IWSLT 2022
- arxiv url: http://arxiv.org/abs/2204.06028v1
- Date: Tue, 12 Apr 2022 18:30:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-15 00:06:36.632986
- Title: CUNI-KIT System for Simultaneous Speech Translation Task at IWSLT 2022
- Title(参考訳): IWSLT2022における同時音声翻訳作業のためのCUNI-KITシステム
- Authors: Peter Pol\'ak, Ngoc-Quan Ngoc, Tuan-Nam Nguyen, Danni Liu, Carlos
Mullov, Jan Niehues, Ond\v{r}ej Bojar, Alexander Waibel
- Abstract要約: 我々は、オリジナルのモデルを変更することなく、オフラインモデルを同時設定で利用する戦略を適用した。
私たちのインライゼーションアルゴリズムは、オフライン設定とほぼ同等ですが、テストセットのレイテンシに関しては、オフラインよりも3倍高速です。
- 参考スコア(独自算出の注目度): 59.39104119817371
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we describe our submission to the Simultaneous Speech
Translation at IWSLT 2022. We explore strategies to utilize an offline model in
a simultaneous setting without the need to modify the original model. In our
experiments, we show that our onlinization algorithm is almost on par with the
offline setting while being 3x faster than offline in terms of latency on the
test set. We make our system publicly available.
- Abstract(参考訳): 本稿では,IWSLT 2022における同時音声翻訳への提案について述べる。
我々は、オリジナルのモデルを変更することなく、オフラインモデルを同時に利用するための戦略を探求する。
実験の結果,オンライゼーションアルゴリズムはオフライン設定とほぼ同等であり,テストセットのレイテンシではオフラインよりも3倍高速であることがわかった。
システムを公開しています。
関連論文リスト
- CMU's IWSLT 2024 Simultaneous Speech Translation System [80.15755988907506]
本稿では,CMU による IWSLT 2024 Simultaneous Speech Translation (SST) タスクへの提案について述べる。
本システムでは,WavLM音声エンコーダ,モダリティアダプタ,Llama2-7B-Baseモデルをデコーダとして統合する。
論文 参考訳(メタデータ) (2024-08-14T10:44:51Z) - Direct Models for Simultaneous Translation and Automatic Subtitling:
FBK@IWSLT2023 [26.001878009713597]
本稿では,FIWLT 2023評価キャンペーンにおけるFBKの同時翻訳・自動置換への参加について述べる。
私たちの提出は、両方のタスクを実行するための直接アーキテクチャの使用に焦点を当てました。
我々の英語-ドイツ語SimulSTシステムでは,タスクの2021年と2022年の上位システムに比べて,計算能力の低下が見られた。
論文 参考訳(メタデータ) (2023-09-27T10:24:42Z) - Incremental Blockwise Beam Search for Simultaneous Speech Translation
with Controllable Quality-Latency Tradeoff [49.75167556773752]
ブロックワイズ・セルフアテンショナル・エンコーダ・モデル(英語版)は、同時音声翻訳において有望なエンドツーエンドのアプローチとして登場した。
本稿では、局所的な合意や品質レイテンシ制御のための$nのポリシーを組み込んだインクリメンタルなブロックワイドビームサーチを提案する。
論文 参考訳(メタデータ) (2023-09-20T14:59:06Z) - Speech Translation with Foundation Models and Optimal Transport: UPC at
IWSLT23 [0.0]
本稿では,UPC 機械翻訳グループの IWSLT 2023 オフライン音声翻訳タスクへの提出について述べる。
我々の音声翻訳システムは、音声(wav2vec 2.0)とテキスト(mBART50)の基礎モデルを利用する。
そこで本研究では,CTC と Optimal Transport を用いた音声とテキストエンコーダのシームズ事前学習ステップを導入し,音声表現をテキストモデルの空間に適応させる。
論文 参考訳(メタデータ) (2023-06-02T07:48:37Z) - Learning When to Speak: Latency and Quality Trade-offs for Simultaneous
Speech-to-Speech Translation with Offline Models [18.34485337755259]
実世界のユースケースを対象とした同時S2STシステムを提案する。
出力のレイテンシを動的に調整するための調整可能なパラメータを用いて,57言語から英語への翻訳を支援する。
これらのポリシーは,Greedy(wait-$k$)ベースライン上でのレイテンシの増加を最小限に抑え,オフラインレベルの精度を実現する。
論文 参考訳(メタデータ) (2023-06-01T23:29:23Z) - Textless Speech-to-Speech Translation With Limited Parallel Data [51.3588490789084]
PFBはテキストレスのS2STモデルをトレーニングするためのフレームワークで、数十時間の並列音声データしか必要としない。
3つのドメインで英語、ドイツ語、マラティー語、英語の翻訳をトレーニングし、評価する。
論文 参考訳(メタデータ) (2023-05-24T17:59:05Z) - The YiTrans End-to-End Speech Translation System for IWSLT 2022 Offline
Shared Task [92.5087402621697]
本稿では,IWSLT 2022オフラインタスクに対するエンドツーエンドYiTrans音声翻訳システムの提案について述べる。
YiTransシステムは、大規模な訓練済みエンコーダデコーダモデル上に構築されている。
最終提出は自動評価基準でまず英語・ドイツ語・英語・中国語のエンド・ツー・エンド・システムにランク付けする。
論文 参考訳(メタデータ) (2022-06-12T16:13:01Z) - The Volctrans Neural Speech Translation System for IWSLT 2021 [26.058205594318405]
本稿では,Volctrans チームが IWSLT 2021 に提出したシステムについて述べる。
オフライン音声翻訳では,ベンチマークよりも8.1 BLEUの改善を実現している。
テキスト間同時翻訳では,wait-kモデルを最適化する最善の方法を検討する。
論文 参考訳(メタデータ) (2021-05-16T00:11:59Z) - SimulEval: An Evaluation Toolkit for Simultaneous Translation [59.02724214432792]
テキストと音声の同時翻訳は、リアルタイムと低レイテンシのシナリオに焦点を当てている。
SimulEvalは、テキストと音声の同時翻訳のための、使いやすくて汎用的な評価ツールキットである。
論文 参考訳(メタデータ) (2020-07-31T17:44:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。