論文の概要: Dialect Transfer for Swiss German Speech Translation
- arxiv url: http://arxiv.org/abs/2310.09088v1
- Date: Fri, 13 Oct 2023 13:16:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-16 13:11:45.044327
- Title: Dialect Transfer for Swiss German Speech Translation
- Title(参考訳): スイスドイツ語音声翻訳のための方言変換
- Authors: Claudio Paonessa, Yanick Schraner, Jan Deriu, Manuela H\"urlimann,
Manfred Vogel, Mark Cieliebak
- Abstract要約: 本稿では,スイスドイツ語音声翻訳システムの構築における課題について考察する。
方言の多様性の影響とスイスドイツ語と標準ドイツ語の違いに焦点を当てている。
- 参考スコア(独自算出の注目度): 9.373232685350844
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper investigates the challenges in building Swiss German speech
translation systems, specifically focusing on the impact of dialect diversity
and differences between Swiss German and Standard German. Swiss German is a
spoken language with no formal writing system, it comprises many diverse
dialects and is a low-resource language with only around 5 million speakers.
The study is guided by two key research questions: how does the inclusion and
exclusion of dialects during the training of speech translation models for
Swiss German impact the performance on specific dialects, and how do the
differences between Swiss German and Standard German impact the performance of
the systems? We show that dialect diversity and linguistic differences pose
significant challenges to Swiss German speech translation, which is in line
with linguistic hypotheses derived from empirical investigations.
- Abstract(参考訳): 本稿では,スイスドイツ語の言語翻訳システム構築における課題について,特に方言の多様性の影響と,スイスドイツ語と標準ドイツ語の違いに着目して検討する。
スイスドイツ語は公式な表記体系を持たない言語であり、多種多様な方言で構成されており、話者数は500万人程度である。
この研究は、スイスドイツ語の音声翻訳モデルの訓練中に方言の含意と排除が特定の方言のパフォーマンスにどう影響するか、そしてスイスドイツ語と標準ドイツ語の違いがシステムのパフォーマンスにどのように影響するかという2つの主要な研究課題によって導かれる。
方言の多様性と言語的差異は、経験的調査から得られた言語的仮説に沿ったスイスドイツ語の翻訳に重大な課題をもたらす。
関連論文リスト
- What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - Modular Adaptation of Multilingual Encoders to Written Swiss German
Dialect [52.1701152610258]
モジュラーエンコーダにスイスドイツ語のアダプタを加えると、完全なモノリシックな適応性能の97.5%が達成される。
標準ドイツ語の問合せを与えられたスイスドイツ語の文を検索する作業において、文字レベルのモデルを適用することは、他の適応戦略よりも効果的である。
論文 参考訳(メタデータ) (2024-01-25T18:59:32Z) - STT4SG-350: A Speech Corpus for All Swiss German Dialect Regions [5.6787416472329495]
本稿では,STT4SG-350(Speech-to-Text for Swiss German)について述べる。
データは、話者が標準ドイツ語の文を表示するWebアプリを使って収集され、スイスドイツ語に翻訳され、記録される。
全ての方言地域から343時間のスピーチがあり、現在までスイスドイツ人にとって最大の公的なスピーチコーパスである。
論文 参考訳(メタデータ) (2023-05-30T08:49:38Z) - SwissBERT: The Multilingual Language Model for Switzerland [52.1701152610258]
SwissBERTは、スイス関連のテキストを処理するために特別に作られたマスク付き言語モデルである。
SwissBERTはトレーニング済みのモデルで、スイスの国語で書かれたニュース記事に適用しました。
スイスバーティ語は言語アダプターを使用しているため、将来の研究でスイスドイツ語の方言に拡張される可能性がある。
論文 参考訳(メタデータ) (2023-03-23T14:44:47Z) - 2nd Swiss German Speech to Standard German Text Shared Task at SwissText
2022 [3.910747992453137]
目的は、GrisonsスピーチのテストセットでBLEUスコアを最大化することであった。
3チームが参加し、最高成績のBLEUスコアは70.1となった。
論文 参考訳(メタデータ) (2023-01-17T10:31:11Z) - Cross-Linguistic Syntactic Difference in Multilingual BERT: How Good is
It and How Does It Affect Transfer? [50.48082721476612]
マルチリンガルBERT (mBERT) は, 言語間シンタクティックな機能を示した。
我々は,mBERTから引き起こされる文法的関係の分布を,24言語に類型的に異なる文脈で検討した。
論文 参考訳(メタデータ) (2022-12-21T09:44:08Z) - Multi-VALUE: A Framework for Cross-Dialectal English NLP [49.55176102659081]
マルチディレクト (Multi-Dilect) は、50の英語方言にまたがる制御可能なルールベースの翻訳システムである。
ストレステストは、非標準方言の先行モデルに対する顕著な性能格差を示す。
私たちはチカノやインド英語のネイティブスピーカーと提携して、人気のあるCoQAタスクの新しいゴールドスタンダード版をリリースしています。
論文 参考訳(メタデータ) (2022-12-15T18:17:01Z) - Dialectal Speech Recognition and Translation of Swiss German Speech to
Standard German Text: Microsoft's Submission to SwissText 2021 [17.675379299410054]
スイスドイツ語(Swiss German)は、スイスのドイツ語圏で話されるアレマン語の方言。
本稿では,翻訳を組み込んだ辞書を用いたハイブリッド音声認識システムを提案する。
我々の応募は盲目の会話テストセットで46.04% BLEUに達し、第2位の競争相手を12%の差で上回っている。
論文 参考訳(メタデータ) (2021-06-15T13:34:02Z) - SwissDial: Parallel Multidialectal Corpus of Spoken Swiss German [22.30271453485001]
我々は8つの主要な方言にまたがるスイス系ドイツ語の最初の注釈付き並列コーパスと標準ドイツ語の参照を紹介する。
私たちの目標は、スイスドイツ語でデータ駆動nlpアプリケーションを使用するための基本的なデータセットを作成し、利用可能にすることです。
論文 参考訳(メタデータ) (2021-03-21T14:00:09Z) - A Swiss German Dictionary: Variation in Speech and Writing [45.82374977939355]
スイスドイツ語の諸方言における共通語の形態を含む辞書をハイドイツ語に正規化する。
この多様性に関連する不確実性を軽減するため、スイスドイツ語の高ドイツ語語対とスイスドイツ語の音素転写(SAMPA)を補完する。
したがって、この辞書は、大規模自然翻訳と音声の書き起こしを組み合わせた最初のリソースとなる。
論文 参考訳(メタデータ) (2020-03-31T22:10:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。