論文の概要: Dialectal Speech Recognition and Translation of Swiss German Speech to
Standard German Text: Microsoft's Submission to SwissText 2021
- arxiv url: http://arxiv.org/abs/2106.08126v1
- Date: Tue, 15 Jun 2021 13:34:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 20:31:33.541681
- Title: Dialectal Speech Recognition and Translation of Swiss German Speech to
Standard German Text: Microsoft's Submission to SwissText 2021
- Title(参考訳): ドイツ語の方言音声認識と標準ドイツ語テキストへの翻訳:MicrosoftのSwissText 2021への提出
- Authors: Yuriy Arabskyy, Aashish Agarwal, Subhadeep Dey, Oscar Koller
- Abstract要約: スイスドイツ語(Swiss German)は、スイスのドイツ語圏で話されるアレマン語の方言。
本稿では,翻訳を組み込んだ辞書を用いたハイブリッド音声認識システムを提案する。
我々の応募は盲目の会話テストセットで46.04% BLEUに達し、第2位の競争相手を12%の差で上回っている。
- 参考スコア(独自算出の注目度): 17.675379299410054
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper describes the winning approach in the public SwissText 2021
competition on dialect recognition and translation of Swiss German speech to
standard German text. Swiss German refers to the multitude of Alemannic
dialects spoken in the German-speaking parts of Switzerland. Swiss German
differs significantly from standard German in pronunciation, word inventory and
grammar. It is mostly incomprehensible to native German speakers. Moreover, it
lacks a standardized written script. To solve the challenging task, we propose
a hybrid automatic speech recognition system with a lexicon that incorporates
translations, a 1st pass language model that deals with Swiss German
particularities, a transfer-learned acoustic model and a strong neural language
model for 2nd pass rescoring. Our submission reaches 46.04% BLEU on a blind
conversational test set and outperforms the second best competitor by a 12%
relative margin.
- Abstract(参考訳): 本稿では,スイスドイツ語の標準ドイツ語文への方言認識と翻訳に関する公用語SwissText 2021コンペティションにおける勝利のアプローチについて述べる。
スイスドイツ語(Swiss German)は、スイスのドイツ語圏で話されるアレマン語の方言。
スイスドイツ語は、発音、単語の在庫、文法において標準ドイツ語と大きく異なる。
主にドイツ語話者には理解できない。
さらに、標準化されたスクリプトが欠けている。
この課題を解決するために,スイスドイツ語の特殊性を扱う第1パス言語モデル,トランスファー学習音響モデル,第2パス再構成のための強力なニューラル言語モデルを含む辞書を用いたハイブリッド音声認識システムを提案する。
我々の応募は盲目の会話テストセットで46.04% BLEUに達し、第2位の競争相手を12%の差で上回っている。
関連論文リスト
- Modular Adaptation of Multilingual Encoders to Written Swiss German
Dialect [52.1701152610258]
モジュラーエンコーダにスイスドイツ語のアダプタを加えると、完全なモノリシックな適応性能の97.5%が達成される。
標準ドイツ語の問合せを与えられたスイスドイツ語の文を検索する作業において、文字レベルのモデルを適用することは、他の適応戦略よりも効果的である。
論文 参考訳(メタデータ) (2024-01-25T18:59:32Z) - Dialect Transfer for Swiss German Speech Translation [9.373232685350844]
本稿では,スイスドイツ語音声翻訳システムの構築における課題について考察する。
方言の多様性の影響とスイスドイツ語と標準ドイツ語の違いに焦点を当てている。
論文 参考訳(メタデータ) (2023-10-13T13:16:57Z) - SeamlessM4T: Massively Multilingual & Multimodal Machine Translation [90.71078166159295]
音声から音声への翻訳,音声からテキストへの翻訳,テキストからテキストへの翻訳,最大100言語の自動音声認識をサポートする単一モデルSeamlessM4Tを紹介する。
我々は、音声とテキストの両方に英語を翻訳できる最初の多言語システムを開発した。
FLEURSでは、SeamlessM4Tが複数のターゲット言語への翻訳の新しい標準を設定し、音声からテキストへの直接翻訳において、以前のSOTAよりも20%BLEUの改善を実現している。
論文 参考訳(メタデータ) (2023-08-22T17:44:18Z) - STT4SG-350: A Speech Corpus for All Swiss German Dialect Regions [5.6787416472329495]
本稿では,STT4SG-350(Speech-to-Text for Swiss German)について述べる。
データは、話者が標準ドイツ語の文を表示するWebアプリを使って収集され、スイスドイツ語に翻訳され、記録される。
全ての方言地域から343時間のスピーチがあり、現在までスイスドイツ人にとって最大の公的なスピーチコーパスである。
論文 参考訳(メタデータ) (2023-05-30T08:49:38Z) - ComSL: A Composite Speech-Language Model for End-to-End Speech-to-Text
Translation [79.66359274050885]
公的な事前訓練された音声のみのモデルと言語のみのモデルからなる複合アーキテクチャ上に構築された音声言語モデルであるComSLを提案する。
提案手法は,エンドツーエンドの音声-テキスト翻訳タスクにおいて有効であることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:42:15Z) - Scaling Speech Technology to 1,000+ Languages [66.31120979098483]
MMS(Massively Multilingual Speech)プロジェクトは、タスクに応じてサポート言語を10~40倍増やす。
主な材料は、一般に公開されている宗教文書の読解に基づく新しいデータセットである。
我々は,1,406言語,1,107言語用1つの多言語自動音声認識モデル,同一言語用音声合成モデル,4,017言語用言語識別モデルについて,事前学習したwav2vec 2.0モデルを構築した。
論文 参考訳(メタデータ) (2023-05-22T22:09:41Z) - SwissBERT: The Multilingual Language Model for Switzerland [52.1701152610258]
SwissBERTは、スイス関連のテキストを処理するために特別に作られたマスク付き言語モデルである。
SwissBERTはトレーニング済みのモデルで、スイスの国語で書かれたニュース記事に適用しました。
スイスバーティ語は言語アダプターを使用しているため、将来の研究でスイスドイツ語の方言に拡張される可能性がある。
論文 参考訳(メタデータ) (2023-03-23T14:44:47Z) - 2nd Swiss German Speech to Standard German Text Shared Task at SwissText
2022 [3.910747992453137]
目的は、GrisonsスピーチのテストセットでBLEUスコアを最大化することであった。
3チームが参加し、最高成績のBLEUスコアは70.1となった。
論文 参考訳(メタデータ) (2023-01-17T10:31:11Z) - SDS-200: A Swiss German Speech to Standard German Text Corpus [5.370317759946287]
SDS-200は、標準ドイツ語翻訳によるスイスドイツ語方言のコーパスである。
データはウェブ記録ツールを使って収集され、一般に公開されている。
このデータは、約4000人の異なる話者による200時間のスピーチで構成され、スイス・ドイツ方言の風景の大部分をカバーしている。
論文 参考訳(メタデータ) (2022-05-19T12:16:29Z) - A Swiss German Dictionary: Variation in Speech and Writing [45.82374977939355]
スイスドイツ語の諸方言における共通語の形態を含む辞書をハイドイツ語に正規化する。
この多様性に関連する不確実性を軽減するため、スイスドイツ語の高ドイツ語語対とスイスドイツ語の音素転写(SAMPA)を補完する。
したがって、この辞書は、大規模自然翻訳と音声の書き起こしを組み合わせた最初のリソースとなる。
論文 参考訳(メタデータ) (2020-03-31T22:10:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。