Fugu-MT 論文翻訳(概要): The YiTrans End-to-End Speech Translation System for IWSLT 2022 Offline Shared Task

論文の概要: The YiTrans End-to-End Speech Translation System for IWSLT 2022 Offline Shared Task

arxiv url: http://arxiv.org/abs/2206.05777v2
Date: Tue, 14 Jun 2022 02:25:56 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-15 11:42:16.862217
Title: The YiTrans End-to-End Speech Translation System for IWSLT 2022 Offline Shared Task
Title（参考訳）: IWSLT 2022オフライン共有タスクのためのYiTransエンドツーエンド音声翻訳システム
Authors: Ziqiang Zhang, Junyi Ao, Long Zhou, Shujie Liu, Furu Wei, Jinyu Li
Abstract要約: 本稿では,IWSLT 2022オフラインタスクに対するエンドツーエンドYiTrans音声翻訳システムの提案について述べる。 YiTransシステムは、大規模な訓練済みエンコーダデコーダモデル上に構築されている。最終提出は自動評価基準でまず英語・ドイツ語・英語・中国語のエンド・ツー・エンド・システムにランク付けする。
参考スコア（独自算出の注目度）: 92.5087402621697
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper describes the submission of our end-to-end YiTrans speech translation system for the IWSLT 2022 offline task, which translates from English audio to German, Chinese, and Japanese. The YiTrans system is built on large-scale pre-trained encoder-decoder models. More specifically, we first design a multi-stage pre-training strategy to build a multi-modality model with a large amount of labeled and unlabeled data. We then fine-tune the corresponding components of the model for the downstream speech translation tasks. Moreover, we make various efforts to improve performance, such as data filtering, data augmentation, speech segmentation, model ensemble, and so on. Experimental results show that our YiTrans system obtains a significant improvement than the strong baseline on three translation directions, and it achieves +5.2 BLEU improvements over last year's optimal end-to-end system on tst2021 English-German. Our final submissions rank first on English-German and English-Chinese end-to-end systems in terms of the automatic evaluation metric. We make our code and models publicly available.
Abstract（参考訳）: 本稿では、英語音声からドイツ語、中国語、日本語への翻訳を行うIWSLT 2022オフラインタスクに対して、エンドツーエンドのYiTrans音声翻訳システムの提出について述べる。 YiTransシステムは、大規模な訓練済みエンコーダデコーダモデルに基づいている。より具体的には、ラベル付きおよびラベルなしの大量のデータを持つマルチモダリティモデルを構築するために、まず、マルチステージ事前学習戦略を設計する。次に、下流音声翻訳タスクに対応するモデルのコンポーネントを微調整する。さらに,データフィルタリングやデータ拡張,音声セグメンテーション,モデルアンサンブルなど,パフォーマンス向上のための様々な取り組みを行う。実験の結果,YiTransシステムは3つの翻訳方向の強いベースラインよりも大幅に改善され,tst2021英語-ドイツ語における昨年の最適エンドツーエンドシステムに比べて,+5.2BLEUの改善が達成された。最終提出は自動評価基準でまず英語・ドイツ語・英語・中国語のエンドツーエンドシステムにランク付けする。コードとモデルを公開しています。

関連論文リスト

KIT's Offline Speech Translation and Instruction Following Submission for IWSLT 2025 [56.61209412965054]
本稿では、カールスルーエ工科大学のオフラインSTとインストラクションフォロー(IF)トラックへの提出について紹介する。文書レベルの文脈を持つLLMを用いて出力を融合した複数の自動音声認識システムを用いたパイプラインを提案する。 IFトラックでは,音声エンコーダとLLMを統合し,幅広い命令追従タスクを実行するエンド・ツー・エンド・モデルを開発した。
論文参考訳（メタデータ） (2025-05-19T12:21:29Z)
Setting up the Data Printer with Improved English to Ukrainian Machine Translation [0.0]
ウクライナ語と英語の文の3M対のノイズの多い並列データセットを用いた翻訳システムを構築するためのレシピを提案する。我々のデコーダのみのモデルであるDragomanは、FLORESデベロップメントセットのアーティファクトエンコーダ-デコーダモデルの性能を上回りました。
論文参考訳（メタデータ） (2024-04-23T16:34:34Z)
BJTU-WeChat's Systems for the WMT22 Chat Translation Task [66.81525961469494]
本稿では,WMT'22チャット翻訳タスクに対して,北京地東大学とWeChat AIを共同で提案する。 Transformerに基づいて、いくつかの有効な変種を適用します。本システムでは,0.810と0.946のCOMETスコアを達成している。
論文参考訳（メタデータ） (2022-11-28T02:35:04Z)
Tencent AI Lab - Shanghai Jiao Tong University Low-Resource Translation System for the WMT22 Translation Task [49.916963624249355]
本稿では, Tencent AI Lab - Shanghai Jiao Tong University (TAL-SJTU) Low-Resource Translation system for the WMT22 shared taskについて述べる。我々は、英語$Leftrightarrow$Livonianの一般的な翻訳作業に参加する。本システムは,M2M100を対象言語に適応させる新しい手法を用いて構築した。
論文参考訳（メタデータ） (2022-10-17T04:34:09Z)
Multilingual Machine Translation Systems from Microsoft for WMT21 Shared Task [95.06453182273027]
本報告では、大規模多言語機械翻訳におけるWMT21共有タスクのためのMicrosoftの機械翻訳システムについて述べる。共有タスクへのモデル提出はDeltaLMnotefooturlhttps://aka.ms/deltalmで行われました。最終提出は自動評価基準で3トラックにランクインした。
論文参考訳（メタデータ） (2021-11-03T09:16:17Z)
The USYD-JD Speech Translation System for IWSLT 2021 [85.64797317290349]
本稿では,シドニー大学とJDが共同でIWSLT 2021低リソース音声翻訳タスクを提出したことを述べる。私たちは、公式に提供されたASRとMTデータセットでモデルをトレーニングしました。翻訳性能の向上を目的として, バック翻訳, 知識蒸留, 多機能再構成, トランスダクティブファインタニングなど, 最新の効果的な手法について検討した。
論文参考訳（メタデータ） (2021-07-24T09:53:34Z)
FST: the FAIR Speech Translation System for the IWSLT21 Multilingual Shared Task [36.51221186190272]
IWSLT 2021評価キャンペーンに提出したエンドツーエンドの多言語音声翻訳システムについて述べる。本システムは,モダリティ,タスク,言語間の伝達学習を活用して構築する。
論文参考訳（メタデータ） (2021-07-14T19:43:44Z)
The NiuTrans End-to-End Speech Translation System for IWSLT 2021 Offline Task [23.008938777422767]
本稿では,IWSLT 2021オフラインタスクに対して,NuTransのエンドツーエンド音声翻訳システムを提案する。我々はTransformerベースのモデルアーキテクチャを使用し、Conformer、相対位置符号化、スタックされた音響およびテキスト符号化により拡張する。我々は MuST-C En-De テストセット上で 33.84 BLEU 点を達成する。
論文参考訳（メタデータ） (2021-07-06T07:45:23Z)
ESPnet-ST IWSLT 2021 Offline Speech Translation System [56.83606198051871]
本稿では,ESPnet-STグループによる音声翻訳トラックにおけるIWSLT 2021の提出について述べる。今年は、データ、アーキテクチャ、オーディオセグメンテーションのトレーニングにさまざまな取り組みを行いました。私たちの最高のE2Eシステムは、すべてのテクニックをモデルアンサンブルと組み合わせ、31.4BLEUを達成しました。
論文参考訳（メタデータ） (2021-07-01T17:49:43Z)
The Volctrans Neural Speech Translation System for IWSLT 2021 [26.058205594318405]
本稿では,Volctrans チームが IWSLT 2021 に提出したシステムについて述べる。オフライン音声翻訳では,ベンチマークよりも8.1 BLEUの改善を実現している。テキスト間同時翻訳では,wait-kモデルを最適化する最善の方法を検討する。
論文参考訳（メタデータ） (2021-05-16T00:11:59Z)
UPC's Speech Translation System for IWSLT 2021 [2.099922236065961]
本稿では,UPC 機械翻訳グループによる IWSLT 2021 オフライン音声翻訳タスクの提出について述べる。タスクは、tedトークから抽出された英語の音声録音をドイツ語のテキストに翻訳できるシステムを構築することにある。提案方式は,エンコーダとデコーダ間の結合モジュールと事前学習モデルを組み合わせた音声翻訳システムである。
論文参考訳（メタデータ） (2021-05-10T17:04:11Z)
DiDi's Machine Translation System for WMT2020 [51.296629834996246]
我々は中国語>英語の翻訳指導に参画する。この方向では、ベースラインモデルとしてTransformerを使用します。その結果,日英のBLEUスコアは36.6ドルとなった。
論文参考訳（メタデータ） (2020-10-16T06:25:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。