論文の概要: FFSTC: Fongbe to French Speech Translation Corpus
- arxiv url: http://arxiv.org/abs/2403.05488v1
- Date: Fri, 8 Mar 2024 17:53:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 12:55:56.344984
- Title: FFSTC: Fongbe to French Speech Translation Corpus
- Title(参考訳): FFSTC:フランスの音声翻訳会社に出資
- Authors: D. Fortune Kponou, Frejus A. A. Laleye, Eugene C. Ezin
- Abstract要約: Fongbe to French Speech Translation Corpus (FFSTC) を初めて紹介する。
このコーパスには約31時間のフォンベ語の内容が含まれており、フランス語の書き起こしと対応するフォンベの音声記録の両方が収録されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce the Fongbe to French Speech Translation Corpus
(FFSTC) for the first time. This corpus encompasses approximately 31 hours of
collected Fongbe language content, featuring both French transcriptions and
corresponding Fongbe voice recordings. FFSTC represents a comprehensive dataset
compiled through various collection methods and the efforts of dedicated
individuals. Furthermore, we conduct baseline experiments using Fairseq's
transformer_s and conformer models to evaluate data quality and validity. Our
results indicate a score of 8.96 for the transformer_s model and 8.14 for the
conformer model, establishing a baseline for the FFSTC corpus.
- Abstract(参考訳): 本稿では,Fongbe to French Speech Translation Corpus (FFSTC)を初めて紹介する。
このコーパスは、約31時間のfongbe言語コンテンツを含んでおり、フランス語の書き起こしと対応するfongbe音声録音の両方を特徴としている。
FFSTCは、様々な収集方法と専用個人の努力によってまとめられた包括的なデータセットである。
さらに,fairseqのtransform_sとconformerモデルを用いたベースライン実験を行い,データ品質と妥当性を評価した。
その結果, コンバータモデルでは8.96点, コンバータモデルでは8.14点を示し, FFSTCコーパスではベースラインを確立した。
関連論文リスト
- TransVIP: Speech to Speech Translation System with Voice and Isochrony Preservation [97.54885207518946]
カスケード方式で多様なデータセットを活用する新しいモデルフレームワークTransVIPを提案する。
本稿では、話者の音声特性と、翻訳過程における音源音声からの等時性を維持するために、2つの分離エンコーダを提案する。
フランス語と英語のペアに関する実験により、我々のモデルは、現在最先端の音声音声翻訳モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-05-28T04:11:37Z) - The Claire French Dialogue Dataset [9.45456707528025]
本稿では,CFDDを構成する24個のコーパスについて述べる。
また、提案した完全なCFDDデータセットを8つのサブコーパスに分類し、最終データセットのフォーマットを標準化するためのプロセスを記述する。
論文 参考訳(メタデータ) (2023-11-28T14:55:22Z) - FreCDo: A Large Corpus for French Cross-Domain Dialect Identification [22.132457694021184]
本稿では,413,522のフランス語テキストサンプルからなるフランス語方言識別のための新しいコーパスを提案する。
トレーニング、検証、テストの分割は、異なるニュースウェブサイトから収集される。
これはフランスのクロスドメイン(FreCDo)の方言識別タスクにつながります。
論文 参考訳(メタデータ) (2022-12-15T10:32:29Z) - M3ST: Mix at Three Levels for Speech Translation [66.71994367650461]
本稿では,M3ST法を3段階に分けて提案し,拡張学習コーパスの多様性を高める。
ファインチューニングの第1段階では、単語レベル、文レベル、フレームレベルを含む3段階のトレーニングコーパスを混合し、モデル全体を混合データで微調整する。
MuST-C音声翻訳ベンチマークと分析実験により、M3STは現在の強いベースラインより優れ、平均的なBLEU29.9の8方向の最先端の結果が得られることが示された。
論文 参考訳(メタデータ) (2022-12-07T14:22:00Z) - Cross-modal Contrastive Learning for Speech Translation [36.63604508886932]
ConSTは、エンドツーエンドの音声からテキストへの翻訳のための、モーダルなコントラスト学習手法である。
実験の結果、提案されたConSTは、以前の方法よりも一貫して優れていた。
その学習表現は、モーダル音声テキスト検索の精度を4%から88%に向上させる。
論文 参考訳(メタデータ) (2022-05-05T05:14:01Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z) - BSTC: A Large-Scale Chinese-English Speech Translation Dataset [26.633433687767553]
BSTC (Baidu Speech Translation Corpus) は、中国語と英語の大規模翻訳データセットである。
このデータセットは、約68時間のマンダリンデータを含む講演や講義のライセンス付きビデオのコレクションに基づいて構築されている。
3名の経験豊富な通訳者に、模擬会議の設定で同時にテストトークを解釈するよう依頼しました。
論文 参考訳(メタデータ) (2021-04-08T07:38:51Z) - Consecutive Decoding for Speech-to-text Translation [51.155661276936044]
COnSecutive Transcription and Translation (COSTT)は、音声からテキストへの翻訳に不可欠な手法である。
鍵となるアイデアは、ソースの書き起こしとターゲットの翻訳テキストを1つのデコーダで生成することである。
本手法は3つの主流データセットで検証する。
論文 参考訳(メタデータ) (2020-09-21T10:10:45Z) - Spectrum and Prosody Conversion for Cross-lingual Voice Conversion with
CycleGAN [81.79070894458322]
言語間の音声変換は、ソース話者とターゲット話者が異なる言語を話すとき、ソース話者の音声をターゲット話者の音声のように聞こえるようにすることを目的としている。
従来の言語間音声変換の研究は、主にF0転送のための線形変換を伴うスペクトル変換に焦点を当てていた。
本稿では,F0モデリングにおける連続ウェーブレット変換(CWT)の分解手法を提案する。
論文 参考訳(メタデータ) (2020-08-11T07:29:55Z) - CoVoST: A Diverse Multilingual Speech-To-Text Translation Corpus [57.641761472372814]
CoVoSTは11言語から英語への多言語による音声からテキストへの翻訳コーパスである。
11,000人以上の話者と60以上のアクセントで多様化した。
CoVoSTはCC0ライセンスでリリースされており、無料で利用できる。
論文 参考訳(メタデータ) (2020-02-04T14:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。