Fugu-MT 論文翻訳(概要): SwissGPC v1.0 -- The Swiss German Podcasts Corpus

論文の概要: SwissGPC v1.0 -- The Swiss German Podcasts Corpus

arxiv url: http://arxiv.org/abs/2509.19866v1
Date: Wed, 24 Sep 2025 08:13:44 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-25 20:53:19.730783
Title: SwissGPC v1.0 -- The Swiss German Podcasts Corpus
Title（参考訳）: スイスGPC v1.0 - ドイツのポッドキャスト会社
Authors: Samuel Stucki, Mark Cieliebak, Jan Deriu,
Abstract要約: 我々はスイスGPC v1.0について紹介する。データセットは、Schweizer Radio und FernsehenとYouTubeでホストされているトーク番組やポッドキャストへのリンクで構成されており、生のオーディオは約5400時間である。セグメンテーションと弱い注釈の後、5000時間近い演説が残され、標準ドイツ語と共に7つの主要なスイスドイツ語方言地域をカバーした。
参考スコア（独自算出の注目度）: 7.0900880654100895
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present SwissGPC v1.0, the first mid-to-large-scale corpus of spontaneous Swiss German speech, developed to support research in ASR, TTS, dialect identification, and related fields. The dataset consists of links to talk shows and podcasts hosted on Schweizer Radio und Fernsehen and YouTube, which contain approximately 5400 hours of raw audio. After segmentation and weak annotation, nearly 5000 hours of speech were retained, covering the seven major Swiss German dialect regions alongside Standard German. We describe the corpus construction methodology, including an automated annotation pipeline, and provide statistics on dialect distribution, token counts, and segmentation characteristics. Unlike existing Swiss German speech corpora, which primarily feature controlled speech, this corpus captures natural, spontaneous conversations, making it a valuable resource for real-world speech applications.
Abstract（参考訳）: ASR, TTS, 方言識別, 関連分野の研究を支援するために開発された, 自発性スイスドイツ語音声の最初の中から大規模コーパスであるSwissGPC v1.0を提示する。データセットは、Schweizer Radio und FernsehenとYouTubeでホストされているトーク番組やポッドキャストへのリンクで構成されており、生のオーディオは約5400時間である。セグメンテーションと弱い注釈の後、5000時間近い演説が残され、標準ドイツ語と共に7つの主要なスイスドイツ語方言地域をカバーした。本稿では,自動アノテーションパイプラインを含むコーパス構築手法について述べるとともに,方言分布,トークン数,セグメンテーション特性に関する統計情報を提供する。制御された音声を主とする既存のスイスの音声コーパスとは異なり、このコーパスは自然で自然に会話を捉え、現実世界の音声アプリケーションにとって貴重な資源となっている。

関連論文リスト

Voice Adaptation for Swiss German [7.4162190889971]
本研究は、スイスドイツ語方言における音声適応モデルの性能、すなわち標準ドイツ語のテキストをスイスドイツ語の方言言語に翻訳する性能について検討する。このために、スイスのポッドキャストの大規模なデータセットを前処理し、方言のクラスを自動で書き起こし、注釈付けします。このデータセット上でXTTSv2モデルを微調整し、人や自動化された評価において良好なスコアを達成し、所望の方言を正しく描画できることを示す。
論文参考訳（メタデータ） (2025-05-28T07:24:40Z)
SpeechTokenizer: Unified Speech Tokenizer for Speech Large Language Models [58.996653700982556]
既存の音声トークンは、特に音声言語モデリングのために設計されていない。音声大言語モデルのための統一型音声トークンであるSpeechTokenizerを提案する。実験により,SpeechTokenizerは音声再構成においてEnCodecと相容れない性能を示し,SLMTokBenchベンチマークで強い性能を示す。
論文参考訳（メタデータ） (2023-08-31T12:53:09Z)
SeamlessM4T: Massively Multilingual & Multimodal Machine Translation [90.71078166159295]
音声から音声への翻訳,音声からテキストへの翻訳,テキストからテキストへの翻訳,最大100言語の自動音声認識をサポートする単一モデルSeamlessM4Tを紹介する。我々は、音声とテキストの両方に英語を翻訳できる最初の多言語システムを開発した。 FLEURSでは、SeamlessM4Tが複数のターゲット言語への翻訳の新しい標準を設定し、音声からテキストへの直接翻訳において、以前のSOTAよりも20%BLEUの改善を実現している。
論文参考訳（メタデータ） (2023-08-22T17:44:18Z)
STT4SG-350: A Speech Corpus for All Swiss German Dialect Regions [5.6787416472329495]
本稿では,STT4SG-350(Speech-to-Text for Swiss German)について述べる。データは、話者が標準ドイツ語の文を表示するWebアプリを使って収集され、スイスドイツ語に翻訳され、記録される。全ての方言地域から343時間のスピーチがあり、現在までスイスドイツ人にとって最大の公的なスピーチコーパスである。
論文参考訳（メタデータ） (2023-05-30T08:49:38Z)
Scaling Speech Technology to 1,000+ Languages [66.31120979098483]
MMS(Massively Multilingual Speech)プロジェクトは、タスクに応じてサポート言語を10～40倍増やす。主な材料は、一般に公開されている宗教文書の読解に基づく新しいデータセットである。我々は,1,406言語,1,107言語用1つの多言語自動音声認識モデル,同一言語用音声合成モデル,4,017言語用言語識別モデルについて,事前学習したwav2vec 2.0モデルを構築した。
論文参考訳（メタデータ） (2023-05-22T22:09:41Z)
SwissBERT: The Multilingual Language Model for Switzerland [52.1701152610258]
SwissBERTは、スイス関連のテキストを処理するために特別に作られたマスク付き言語モデルである。 SwissBERTはトレーニング済みのモデルで、スイスの国語で書かれたニュース記事に適用しました。スイスバーティ語は言語アダプターを使用しているため、将来の研究でスイスドイツ語の方言に拡張される可能性がある。
論文参考訳（メタデータ） (2023-03-23T14:44:47Z)
SDS-200: A Swiss German Speech to Standard German Text Corpus [5.370317759946287]
SDS-200は、標準ドイツ語翻訳によるスイスドイツ語方言のコーパスである。データはウェブ記録ツールを使って収集され、一般に公開されている。このデータは、約4000人の異なる話者による200時間のスピーチで構成され、スイス・ドイツ方言の風景の大部分をカバーしている。
論文参考訳（メタデータ） (2022-05-19T12:16:29Z)
Dialectal Speech Recognition and Translation of Swiss German Speech to Standard German Text: Microsoft's Submission to SwissText 2021 [17.675379299410054]
スイスドイツ語(Swiss German)は、スイスのドイツ語圏で話されるアレマン語の方言。本稿では,翻訳を組み込んだ辞書を用いたハイブリッド音声認識システムを提案する。我々の応募は盲目の会話テストセットで46.04% BLEUに達し、第2位の競争相手を12%の差で上回っている。
論文参考訳（メタデータ） (2021-06-15T13:34:02Z)
GigaSpeech: An Evolving, Multi-domain ASR Corpus with 10,000 Hours of Transcribed Audio [88.20960848885575]
GigaSpeechは英語の多分野音声認識コーパスで、教師あり訓練に適した高品質なラベル付きオーディオが1万時間ある。約4万時間の音声が、まずオーディオブック、ポッドキャスト、YouTubeから収集され、読み書きと自発的な話し方の両方をカバーする。システムトレーニングのために、GigaSpeechは10h, 250h, 1000h, 2500h, 10000hの5つのサブセットを提供する。
論文参考訳（メタデータ） (2021-06-13T04:09:16Z)
SwissDial: Parallel Multidialectal Corpus of Spoken Swiss German [22.30271453485001]
我々は8つの主要な方言にまたがるスイス系ドイツ語の最初の注釈付き並列コーパスと標準ドイツ語の参照を紹介する。私たちの目標は、スイスドイツ語でデータ駆動nlpアプリケーションを使用するための基本的なデータセットを作成し、利用可能にすることです。
論文参考訳（メタデータ） (2021-03-21T14:00:09Z)
CoVoST: A Diverse Multilingual Speech-To-Text Translation Corpus [57.641761472372814]
CoVoSTは11言語から英語への多言語による音声からテキストへの翻訳コーパスである。 11,000人以上の話者と60以上のアクセントで多様化した。 CoVoSTはCC0ライセンスでリリースされており、無料で利用できる。
論文参考訳（メタデータ） (2020-02-04T14:35:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。