論文の概要: The HW-TSC's Offline Speech Translation Systems for IWSLT 2021
Evaluation
- arxiv url: http://arxiv.org/abs/2108.03845v1
- Date: Mon, 9 Aug 2021 07:28:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-11 01:32:22.319406
- Title: The HW-TSC's Offline Speech Translation Systems for IWSLT 2021
Evaluation
- Title(参考訳): IWSLT 2021評価のためのHW-TSCのオフライン音声翻訳システム
- Authors: Minghan Wang, Yuxia Wang, Chang Su, Jiaxin Guo, Yingtao Zhang, Yujia
Liu, Min Zhang, Shimin Tao, Xingshan Zeng, Liangyou Li, Hao Yang, Ying Qin
- Abstract要約: 本稿では,IWSLT-2021オフライン音声翻訳タスクの取り組みについて述べる。
本システムは,話者ダイアリゼーションモジュール,音声認識モジュール(ASR)モジュール,機械翻訳モジュール(MT)モジュールなど,カスケード形式で構築された。
本手法は2021年のテストセットで24.6 BLEUのスコアを得る。
- 参考スコア(独自算出の注目度): 22.617563646374602
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper describes our work in participation of the IWSLT-2021 offline
speech translation task. Our system was built in a cascade form, including a
speaker diarization module, an Automatic Speech Recognition (ASR) module and a
Machine Translation (MT) module. We directly use the LIUM SpkDiarization tool
as the diarization module. The ASR module is trained with three ASR datasets
from different sources, by multi-source training, using a modified Transformer
encoder. The MT module is pretrained on the large-scale WMT news translation
dataset and fine-tuned on the TED corpus. Our method achieves 24.6 BLEU score
on the 2021 test set.
- Abstract(参考訳): 本稿では,IWSLT-2021オフライン音声翻訳タスクの取り組みについて述べる。
本システムは,話者ダイアリゼーションモジュール,自動音声認識(ASR)モジュール,機械翻訳(MT)モジュールを含むカスケード形式で構築された。
Lium SpkDiarizationツールを直接ダイアリゼーションモジュールとして使用します。
ASRモジュールは、修正されたTransformerエンコーダを使用して、異なるソースからの3つのASRデータセットで、マルチソーストレーニングによってトレーニングされる。
MTモジュールは大規模なWMTニュース翻訳データセットで事前訓練され、TEDコーパスで微調整される。
本手法は2021年のテストセットで24.6 BLEUスコアを達成する。
関連論文リスト
- CMU's IWSLT 2024 Simultaneous Speech Translation System [80.15755988907506]
本稿では,CMU による IWSLT 2024 Simultaneous Speech Translation (SST) タスクへの提案について述べる。
本システムでは,WavLM音声エンコーダ,モダリティアダプタ,Llama2-7B-Baseモデルをデコーダとして統合する。
論文 参考訳(メタデータ) (2024-08-14T10:44:51Z) - Blending LLMs into Cascaded Speech Translation: KIT's Offline Speech Translation System for IWSLT 2024 [61.189875635090225]
大規模言語モデル (LLM) は現在,自動音声認識 (ASR) や機械翻訳 (MT) ,さらにはエンドツーエンド音声翻訳 (ST) など,さまざまなタスクを探索中である。
論文 参考訳(メタデータ) (2024-06-24T16:38:17Z) - KIT's Multilingual Speech Translation System for IWSLT 2023 [58.5152569458259]
IWSLT 2023の多言語トラックに対する音声翻訳システムについて述べる。
このタスクは、様々な量のリソースを持つ10の言語に翻訳する必要がある。
我々のケースド音声システムは、科学的な話の翻訳において、エンドツーエンドの音声よりも大幅に優れています。
論文 参考訳(メタデータ) (2023-06-08T16:13:20Z) - Speech Translation with Foundation Models and Optimal Transport: UPC at
IWSLT23 [0.0]
本稿では,UPC 機械翻訳グループの IWSLT 2023 オフライン音声翻訳タスクへの提出について述べる。
我々の音声翻訳システムは、音声(wav2vec 2.0)とテキスト(mBART50)の基礎モデルを利用する。
そこで本研究では,CTC と Optimal Transport を用いた音声とテキストエンコーダのシームズ事前学習ステップを導入し,音声表現をテキストモデルの空間に適応させる。
論文 参考訳(メタデータ) (2023-06-02T07:48:37Z) - The YiTrans End-to-End Speech Translation System for IWSLT 2022 Offline
Shared Task [92.5087402621697]
本稿では,IWSLT 2022オフラインタスクに対するエンドツーエンドYiTrans音声翻訳システムの提案について述べる。
YiTransシステムは、大規模な訓練済みエンコーダデコーダモデル上に構築されている。
最終提出は自動評価基準でまず英語・ドイツ語・英語・中国語のエンド・ツー・エンド・システムにランク付けする。
論文 参考訳(メタデータ) (2022-06-12T16:13:01Z) - The USYD-JD Speech Translation System for IWSLT 2021 [85.64797317290349]
本稿では,シドニー大学とJDが共同でIWSLT 2021低リソース音声翻訳タスクを提出したことを述べる。
私たちは、公式に提供されたASRとMTデータセットでモデルをトレーニングしました。
翻訳性能の向上を目的として, バック翻訳, 知識蒸留, 多機能再構成, トランスダクティブファインタニングなど, 最新の効果的な手法について検討した。
論文 参考訳(メタデータ) (2021-07-24T09:53:34Z) - The IWSLT 2021 BUT Speech Translation Systems [2.4373900721120285]
BUTの英語からドイツ語へのオフライン音声翻訳システム(ST)は、IWSLT 2021向けに開発された。
これらは共同で訓練された音声認識・機械翻訳モデルに基づいている。
それらの性能はMustC-Commonテストセットで評価される。
論文 参考訳(メタデータ) (2021-07-13T15:11:18Z) - The NiuTrans End-to-End Speech Translation System for IWSLT 2021 Offline
Task [23.008938777422767]
本稿では,IWSLT 2021オフラインタスクに対して,NuTransのエンドツーエンド音声翻訳システムを提案する。
我々はTransformerベースのモデルアーキテクチャを使用し、Conformer、相対位置符号化、スタックされた音響およびテキスト符号化により拡張する。
我々は MuST-C En-De テストセット上で 33.84 BLEU 点を達成する。
論文 参考訳(メタデータ) (2021-07-06T07:45:23Z) - UPC's Speech Translation System for IWSLT 2021 [2.099922236065961]
本稿では,UPC 機械翻訳グループによる IWSLT 2021 オフライン音声翻訳タスクの提出について述べる。
タスクは、tedトークから抽出された英語の音声録音をドイツ語のテキストに翻訳できるシステムを構築することにある。
提案方式は,エンコーダとデコーダ間の結合モジュールと事前学習モデルを組み合わせた音声翻訳システムである。
論文 参考訳(メタデータ) (2021-05-10T17:04:11Z) - DiDi's Machine Translation System for WMT2020 [51.296629834996246]
我々は中国語>英語の翻訳指導に参画する。
この方向では、ベースラインモデルとしてTransformerを使用します。
その結果,日英のBLEUスコアは36.6ドルとなった。
論文 参考訳(メタデータ) (2020-10-16T06:25:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。