論文の概要: VAKTA-SETU: A Speech-to-Speech Machine Translation Service in Select
Indic Languages
- arxiv url: http://arxiv.org/abs/2305.12518v1
- Date: Sun, 21 May 2023 17:23:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 19:54:23.193140
- Title: VAKTA-SETU: A Speech-to-Speech Machine Translation Service in Select
Indic Languages
- Title(参考訳): VAKTA-SETU: 言語選択のための音声音声機械翻訳サービス
- Authors: Shivam Mhaskar, Vineet Bhat, Akshay Batheja, Sourabh Deoghare,
Paramveer Choudhary, Pushpak Bhattacharyya
- Abstract要約: 英語・ヒンディー語・英語・マラティー語・ヒンディー語・マラティー語対のための音声音声合成システム(SSMT)
自動音声認識(ASR)、拡散補正(DC)、機械翻訳(MT)、テキスト音声合成(TTS)モデルをカスケードしてSSMTシステムの開発を行う。
パイプラインのMT部分でも、英語、ヒンディー語、マラティー語を含む6つの翻訳方向すべてで、テキストからテキストへの機械翻訳(TTMT)サービスを作成しています。
- 参考スコア(独自算出の注目度): 23.76977378957555
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this work, we present our deployment-ready Speech-to-Speech Machine
Translation (SSMT) system for English-Hindi, English-Marathi, and Hindi-Marathi
language pairs. We develop the SSMT system by cascading Automatic Speech
Recognition (ASR), Disfluency Correction (DC), Machine Translation (MT), and
Text-to-Speech Synthesis (TTS) models. We discuss the challenges faced during
the research and development stage and the scalable deployment of the SSMT
system as a publicly accessible web service. On the MT part of the pipeline
too, we create a Text-to-Text Machine Translation (TTMT) service in all six
translation directions involving English, Hindi, and Marathi. To mitigate data
scarcity, we develop a LaBSE-based corpus filtering tool to select high-quality
parallel sentences from a noisy pseudo-parallel corpus for training the TTMT
system. All the data used for training the SSMT and TTMT systems and the best
models are being made publicly available. Users of our system are (a) Govt. of
India in the context of its new education policy (NEP), (b) tourists who
criss-cross the multilingual landscape of India, (c) Indian Judiciary where a
leading cause of the pendency of cases (to the order of 10 million as on date)
is the translation of case papers, (d) farmers who need weather and price
information and so on. We also share the feedback received from various
stakeholders when our SSMT and TTMT systems were demonstrated in large public
events.
- Abstract(参考訳): 本研究では,英語-ヒンディー語,英語-マラティー語,ヒンディー語-マラティー語対を対象としたSSMTシステムを提案する。
自動音声認識(ASR)、拡散補正(DC)、機械翻訳(MT)、テキスト音声合成(TTS)モデルをカスケードしてSSMTシステムの開発を行う。
本稿では,研究・開発段階で直面する課題と,公開WebサービスとしてのSSMTシステムの拡張性について論じる。
パイプラインのMT部分でも、英語、ヒンディー語、マラティー語を含む6つの翻訳方向すべてで、テキストからテキストへの機械翻訳(TTMT)サービスを作成しています。
データ不足を軽減するため, TTMTシステムのトレーニングのために, ノイズの多い擬似並列コーパスから高品質な並列文を選択するためのLaBSEベースのコーパスフィルタリングツールを開発した。
SSMTとTTMTシステムのトレーニングに使用されるすべてのデータと最高のモデルは公開されています。
我々のシステムのユーザーは
(a)ゴット。
新教育政策(NEP)の文脈におけるインドの
(b)インドの多言語景観を横切る観光客
(c)インドの司法機関で、判例の刑罰の主たる原因(現在のように1000万の命令)は、判例の翻訳である。
(d)天気・価格情報等を必要とする農家
また,大規模な公開イベントでSSMTとTTMTシステムが実証された際に,様々な利害関係者から得られたフィードバックを共有した。
関連論文リスト
- Attempt Towards Stress Transfer in Speech-to-Speech Machine Translation [0.0]
インドの教育分野における言語多様性は、インクリシティを阻害する重要な課題となっている。
オンライン教育コンテンツによる知識の民主化にもかかわらず、英語の優位はアクセシビリティを制限している。
既存の音声音声機械翻訳(SSMT)技術にもかかわらず、これらのシステムにおけるイントネーションの欠如は単調な翻訳をもたらす。
本稿では、インド英語のストレスアノテーションを用いたデータセットと、合成音声にストレスを組み込むことのできるテクスチャ・トゥ・スペーチ(TTS)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-03-07T03:21:19Z) - MunTTS: A Text-to-Speech System for Mundari [18.116359188623832]
MnTTSは,オーストリア・アジア系の低リソースのインド語であるムンダリ(Mundari)のための,エンドツーエンドのテキスト音声合成システムである。
本研究は、音声合成システムを構築するために、データを収集し、処理することで、未表現言語における言語技術のギャップに対処する。
論文 参考訳(メタデータ) (2024-01-28T06:27:17Z) - Translation-Enhanced Multilingual Text-to-Image Generation [61.41730893884428]
テキスト・ツー・イメージ・ジェネレーション(TTI)の研究は、現在でも主に英語に焦点を当てている。
そこで本研究では,多言語TTIとニューラルマシン翻訳(NMT)のブートストラップmTTIシステムへの応用について検討する。
我々は,mTTIフレームワーク内で多言語テキスト知識を重み付け,統合する新しいパラメータ効率アプローチであるEnsemble Adapter (EnsAd)を提案する。
論文 参考訳(メタデータ) (2023-05-30T17:03:52Z) - Selective Data Augmentation for Robust Speech Translation [17.56859840101276]
英ヒンディー語(en-hi)STのe2eアーキテクチャを提案する。
We use two imperfect machine translation (MT) services to translate Libri-trans en text into hi text。
この結果から, MTデータのブルート力増強に比べて, ST(BLEU) スコアが良好であることが示唆された。
論文 参考訳(メタデータ) (2023-03-22T19:36:07Z) - End-to-End Speech Translation of Arabic to English Broadcast News [2.375764121997739]
音声翻訳(英: speech translation, ST)とは、ソース言語の音声信号を外国語のテキストに翻訳する作業である。
本稿では,最初のアラビア語から英語への翻訳システムであるブロードキャストニュースの開発に向けた取り組みについて述べる。
論文 参考訳(メタデータ) (2022-12-11T11:35:46Z) - A Bilingual Parallel Corpus with Discourse Annotations [82.07304301996562]
本稿では,Jiang et al. (2022)で最初に導入された大きな並列コーパスであるBWBと,注釈付きテストセットについて述べる。
BWBコーパスは、専門家によって英語に翻訳された中国の小説で構成されており、注釈付きテストセットは、様々な談話現象をモデル化する機械翻訳システムの能力を調査するために設計されている。
論文 参考訳(メタデータ) (2022-10-26T12:33:53Z) - Enhanced Direct Speech-to-Speech Translation Using Self-supervised
Pre-training and Data Augmentation [76.13334392868208]
直接音声音声変換(S2ST)モデルは、データ不足の問題に悩まされる。
本研究では,この課題に対処するために,ラベルのない音声データとデータ拡張を用いた自己教師付き事前学習について検討する。
論文 参考訳(メタデータ) (2022-04-06T17:59:22Z) - SJTU-NICT's Supervised and Unsupervised Neural Machine Translation
Systems for the WMT20 News Translation Task [111.91077204077817]
我々は英語・中国語・英語・ポーランド語・ドイツ語・アッパー・ソルビアンという3つの言語対の4つの翻訳指導に参加した。
言語ペアの異なる条件に基づいて、我々は多様なニューラルネットワーク翻訳(NMT)技術の実験を行った。
私たちの提出書では、主要なシステムは英語、中国語、ポーランド語、英語、ドイツ語から上セルビア語への翻訳の道順で第一位を獲得しました。
論文 参考訳(メタデータ) (2020-10-11T00:40:05Z) - WeChat Neural Machine Translation Systems for WMT20 [61.03013964996131]
本システムは,有効な変種とDTMTアーキテクチャを備えたTransformerをベースとしている。
実験では,データ選択,複数の合成データ生成手法,高度な微調整手法,自己視覚モデルアンサンブルを用いた。
制約のある中国語と英語のシステムでは36.9のケースセンシティブなBLEUスコアが得られます。
論文 参考訳(メタデータ) (2020-10-01T08:15:09Z) - An Augmented Translation Technique for low Resource language pair:
Sanskrit to Hindi translation [0.0]
本研究では、低リソース言語ペアに対してZST(Zero Shot Translation)を検査する。
サンスクリット語からヒンディー語への翻訳では、データが不足しているのと同じアーキテクチャがテストされている。
データストレージのメモリ使用量を削減するため,単語埋め込みの次元化を行う。
論文 参考訳(メタデータ) (2020-06-09T17:01:55Z) - Neural Machine Translation: Challenges, Progress and Future [62.75523637241876]
機械翻訳(英: Machine translation, MT)は、コンピュータを利用して人間の言語を自動翻訳する技術である。
ニューラルマシン翻訳(NMT)は、ディープニューラルネットワークを用いたソース言語とターゲット言語間の直接マッピングをモデル化する。
この記事では、NMTフレームワークをレビューし、NMTの課題について論じ、最近のエキサイティングな進歩を紹介します。
論文 参考訳(メタデータ) (2020-04-13T07:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。