論文の概要: Preparing an Endangered Language for the Digital Age: The Case of
Judeo-Spanish
- arxiv url: http://arxiv.org/abs/2205.15599v1
- Date: Tue, 31 May 2022 08:26:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-01 13:54:26.106289
- Title: Preparing an Endangered Language for the Digital Age: The Case of
Judeo-Spanish
- Title(参考訳): デジタル時代の絶滅危惧言語の作成 : ジュデオ・スペインを事例として
- Authors: Alp \"Oktem, Rodolfo Zevallos, Yasmin Moslem, G\"une\c{s} \"Ozt\"urk,
Karen \c{S}arhon
- Abstract要約: ジュデオ・スペイン語の再活性化の取り組みを補完する機械翻訳と音声合成システムを開発した。
機械翻訳では、まずスペイン語からスペイン語への規則に基づく機械翻訳システムを開発する。
本稿では,音声合成エンジンを構築するための3.5時間1話者音声コーパスを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We develop machine translation and speech synthesis systems to complement the
efforts of revitalizing Judeo-Spanish, the exiled language of Sephardic Jews,
which survived for centuries, but now faces the threat of extinction in the
digital age. Building on resources created by the Sephardic community of Turkey
and elsewhere, we create corpora and tools that would help preserve this
language for future generations. For machine translation, we first develop a
Spanish to Judeo-Spanish rule-based machine translation system, in order to
generate large volumes of synthetic parallel data in the relevant language
pairs: Turkish, English and Spanish. Then, we train baseline neural machine
translation engines using this synthetic data and authentic parallel data
created from translations by the Sephardic community. For text-to-speech
synthesis, we present a 3.5 hour single speaker speech corpus for building a
neural speech synthesis engine. Resources, model weights and online inference
engines are shared publicly.
- Abstract(参考訳): 我々は、何世紀にもわたって生き残ったセファルディム系ユダヤ人の亡命言語であるユダヤ・スペイン語を復活させる努力を補完するために、機械翻訳と音声合成システムを開発したが、現在ではデジタル時代の絶滅の脅威に直面している。
トルコのセファルディク人コミュニティによって作られた資源に基づいて、私たちはこの言語を将来の世代に保存するためのコーパスとツールを作りました。
機械翻訳では、まずスペイン語からスペイン語への規則に基づく機械翻訳システムを開発し、関連する言語対(トルコ語、英語、スペイン語)で大量の合成並列データを生成する。
そして、この合成データとセファルディック・コミュニティの翻訳から生成された真の並列データを用いてベースラインニューラルネットワーク翻訳エンジンを訓練する。
本稿では,音声合成エンジンを構築するための3.5時間1話者音声コーパスを提案する。
リソース、モデルウェイト、オンライン推論エンジンが公開されています。
関連論文リスト
- High-Fidelity Simultaneous Speech-To-Speech Translation [75.69884829562591]
本稿では,同時音声翻訳のためのデコーダのみのモデルであるHibikiを紹介する。
Hibikiは、マルチストリーム言語モデルを利用して、ソースとターゲットの音声を同期的に処理し、テキストとオーディオトークンを共同で生成し、音声からテキストへの変換と音声から音声への変換を行う。
論文 参考訳(メタデータ) (2025-02-05T17:18:55Z) - CrossSpeech++: Cross-lingual Speech Synthesis with Decoupled Language and Speaker Generation [25.82932373649325]
CrossSpeech++は、言語と話者情報をアンタングルする方法である。
これにより、言語間音声合成の品質が大幅に向上する。
さまざまなメトリクスを使って広範な実験を行い、CrossSpeech++が大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2024-12-28T06:32:49Z) - CosyVoice 2: Scalable Streaming Speech Synthesis with Large Language Models [74.80386066714229]
改良されたストリーミング音声合成モデルCosyVoice 2を提案する。
具体的には,音声トークンのコードブック利用を改善するために,有限スカラー量子化を導入する。
我々は,様々な合成シナリオをサポートするために,チャンク対応因果フローマッチングモデルを開発した。
論文 参考訳(メタデータ) (2024-12-13T12:59:39Z) - Dialectal and Low-Resource Machine Translation for Aromanian [44.99833362998488]
本稿では,英語,ルーマニア語,ルーマニア語をサポートするニューラルマシン翻訳システムの構築プロセスについて述べる。
主な貢献は、79,000の文対からなるルーマニアとルーマニアの最も広範な平行コーパスの作成である。
そこで本研究では,テキストマイニングと自動評価のための言語に依存しない文埋め込みモデルを含む補助ツール群を提案する。
論文 参考訳(メタデータ) (2024-10-23T10:00:23Z) - Enhancing Language Learning through Technology: Introducing a New English-Azerbaijani (Arabic Script) Parallel Corpus [0.9051256541674136]
本稿では,英語・アゼルバイジャン語の並列コーパスについて紹介する。
これは、低リソース言語のための言語学習と機械翻訳の技術的ギャップを埋めるように設計されている。
論文 参考訳(メタデータ) (2024-07-06T21:23:20Z) - TransVIP: Speech to Speech Translation System with Voice and Isochrony Preservation [97.54885207518946]
カスケード方式で多様なデータセットを活用する新しいモデルフレームワークTransVIPを提案する。
本稿では、話者の音声特性と、翻訳過程における音源音声からの等時性を維持するために、2つの分離エンコーダを提案する。
フランス語と英語のペアに関する実験により、我々のモデルは、現在最先端の音声音声翻訳モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-05-28T04:11:37Z) - Neural Machine Translation Data Generation and Augmentation using
ChatGPT [5.815623778585195]
手動並列コーパスの代替として,生成言語モデルを用いて生成した幻覚並列コーパスについて検討する。
実験では、出力の多様性の欠如にもかかわらず、幻覚データにより翻訳信号が改善された。
論文 参考訳(メタデータ) (2023-07-11T20:15:47Z) - PolyVoice: Language Models for Speech to Speech Translation [50.31000706309143]
PolyVoiceは音声音声翻訳のための言語モデルに基づくフレームワーク
我々は、完全に教師なしの方法で生成される離散化音声単位を使用する。
音声合成部では、既存のVALL-E Xアプローチを採用し、単位ベース音声言語モデルを構築する。
論文 参考訳(メタデータ) (2023-06-05T15:53:15Z) - Building African Voices [125.92214914982753]
本稿では,低リソースのアフリカ言語を対象とした音声合成について述べる。
我々は,最小限の技術資源で音声合成システムを構築するための汎用的な指示セットを作成する。
研究者や開発者を支援するために、12のアフリカ言語のための音声データ、コード、訓練された音声をリリースします。
論文 参考訳(メタデータ) (2022-07-01T23:28:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。