論文の概要: Breeding Gender-aware Direct Speech Translation Systems
- arxiv url: http://arxiv.org/abs/2012.04955v1
- Date: Wed, 9 Dec 2020 10:18:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 10:57:27.791411
- Title: Breeding Gender-aware Direct Speech Translation Systems
- Title(参考訳): 育種性を考慮した直接音声翻訳システム
- Authors: Marco Gaido, Beatrice Savoldi, Luisa Bentivogli, Matteo Negri, Marco
Turchi
- Abstract要約: 性別認識型stソリューションは強い-しかし性別認識型stモデルを大きく上回る可能性がある。
ジェンダーマーク付き単語の翻訳は、全体的な翻訳品質を維持しながら、精度が最大30ポイント向上する。
- 参考スコア(独自算出の注目度): 14.955696163410254
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In automatic speech translation (ST), traditional cascade approaches
involving separate transcription and translation steps are giving ground to
increasingly competitive and more robust direct solutions. In particular, by
translating speech audio data without intermediate transcription, direct ST
models are able to leverage and preserve essential information present in the
input (e.g. speaker's vocal characteristics) that is otherwise lost in the
cascade framework. Although such ability proved to be useful for gender
translation, direct ST is nonetheless affected by gender bias just like its
cascade counterpart, as well as machine translation and numerous other natural
language processing applications. Moreover, direct ST systems that exclusively
rely on vocal biometric features as a gender cue can be unsuitable and
potentially harmful for certain users. Going beyond speech signals, in this
paper we compare different approaches to inform direct ST models about the
speaker's gender and test their ability to handle gender translation from
English into Italian and French. To this aim, we manually annotated large
datasets with speakers' gender information and used them for experiments
reflecting different possible real-world scenarios. Our results show that
gender-aware direct ST solutions can significantly outperform strong - but
gender-unaware - direct ST models. In particular, the translation of
gender-marked words can increase up to 30 points in accuracy while preserving
overall translation quality.
- Abstract(参考訳): 自動翻訳(st)では、分離された翻訳と翻訳ステップを含む従来のカスケードアプローチが、競争的でより堅牢な直接解の基盤となっている。
特に、中間転写なしで音声音声データを翻訳することにより、直接STモデルは入力(例えば、)に存在する必須情報を利用して保存することができる。
スピーカーの発声特性) さもなくばカスケードの枠組みで失われる。
このような能力は、性翻訳に有用であることが証明されているが、直接STは、そのカスケードと同様の性別バイアスや、機械翻訳や他の多くの自然言語処理アプリケーションの影響を受けている。
さらに、性別のキューとして音声バイオメトリック機能のみに依存する直接STシステムは、特定のユーザにとって不適当であり、潜在的に有害である可能性がある。
本稿では、音声信号を超えて、話者の性別について直接STモデルに通知するための異なるアプローチを比較し、英語からイタリア語とフランス語への性別翻訳を処理できる能力をテストする。
この目的のために,話者の性別情報を含む大規模データセットを手作業でアノテートし,様々な現実シナリオを反映する実験に用いた。
以上の結果から,性認識型stソリューションは強い-しかし性認識型stモデルを大きく上回ることが示された。
特に、ジェンダーマーク付き単語の翻訳は、全体的な翻訳品質を維持しながら、30ポイントまで精度を上げることができる。
関連論文リスト
- Beyond Binary Gender: Evaluating Gender-Inclusive Machine Translation with Ambiguous Attitude Words [85.48043537327258]
既存の機械翻訳の性別バイアス評価は主に男性と女性の性別に焦点を当てている。
本研究では,AmbGIMT (Gender-Inclusive Machine Translation with Ambiguous attitude words) のベンチマークを示す。
本研究では,感情的態度スコア(EAS)に基づく性別バイアス評価手法を提案する。
論文 参考訳(メタデータ) (2024-07-23T08:13:51Z) - TransVIP: Speech to Speech Translation System with Voice and Isochrony Preservation [97.54885207518946]
カスケード方式で多様なデータセットを活用する新しいモデルフレームワークTransVIPを提案する。
本稿では、話者の音声特性と、翻訳過程における音源音声からの等時性を維持するために、2つの分離エンコーダを提案する。
フランス語と英語のペアに関する実験により、我々のモデルは、現在最先端の音声音声翻訳モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-05-28T04:11:37Z) - Twists, Humps, and Pebbles: Multilingual Speech Recognition Models Exhibit Gender Performance Gaps [25.95711246919163]
現在の自動音声認識(ASR)モデルは、多くの言語やタスクでかなりの変更を加えることなく使用できるように設計されている。
本研究では,3つのデータセット上で広く使用されている2つの多言語ASRモデルの性能を体系的に評価する。
以上の結果から,言語やモデルによって異なる傾向がみられた。
論文 参考訳(メタデータ) (2024-02-28T00:24:29Z) - Prosody in Cascade and Direct Speech-to-Text Translation: a case study
on Korean Wh-Phrases [79.07111754406841]
本研究は,韻律が重要な役割を果たす発話を明瞭にするための直接S2TTシステムの能力を評価するために,コントラスト評価を用いることを提案する。
本結果は,カスケード翻訳モデルよりも直接翻訳システムの価値を明確に示すものである。
論文 参考訳(メタデータ) (2024-02-01T14:46:35Z) - Integrating Language Models into Direct Speech Translation: An
Inference-Time Solution to Control Gender Inflection [23.993869026482415]
本稿では,音声翻訳における話者関連性摂動を制御するための最初の推論時解を提案する。
我々のソリューションは、STデコーダによって暗黙的に学習された(バイアス付き)内部言語モデル(LM)を、性別固有の外部LMに部分的に置き換える。
論文 参考訳(メタデータ) (2023-10-24T11:55:16Z) - How To Build Competitive Multi-gender Speech Translation Models For
Controlling Speaker Gender Translation [21.125217707038356]
発音性言語から文法性言語に翻訳する場合、生成された翻訳は、話者を参照する者を含む様々な単語に対して、明確なジェンダー代入を必要とする。
このような偏見や包括的行動を避けるために、話者の性別に関する外部から提供されたメタデータによって、話者関連表現の性別割当を導出すべきである。
本稿では、話者のジェンダーメタデータを単一の「マルチジェンダー」ニューラルSTモデルに統合し、維持しやすくすることで、同じ結果を達成することを目的とする。
論文 参考訳(メタデータ) (2023-10-23T17:21:32Z) - Speech-to-Speech Translation with Discrete-Unit-Based Style Transfer [53.72998363956454]
個別の自己教師付き表現を用いた音声音声合成(S2ST)は顕著な精度を達成している。
高品質な話者並列データの不足は、翻訳中にスタイル転送を学習する上での課題となる。
我々は、個別の自己教師付き音声表現と音色単位に基づいて、スタイル変換機能を備えたS2STパイプラインを設計する。
論文 参考訳(メタデータ) (2023-09-14T09:52:08Z) - The Gender-GAP Pipeline: A Gender-Aware Polyglot Pipeline for Gender
Characterisation in 55 Languages [51.2321117760104]
本稿では,55言語を対象とした大規模データセットにおけるジェンダー表現を特徴付ける自動パイプラインであるGender-GAP Pipelineについて述べる。
このパイプラインは、性別付き人称名詞の多言語語彙を用いて、テキスト中の性別表現を定量化する。
本稿では、WMTのトレーニングデータとNewsタスクの開発データにジェンダー表現を報告し、現在のデータが男性表現にスキューされていることを確認する。
論文 参考訳(メタデータ) (2023-08-31T17:20:50Z) - Gender Lost In Translation: How Bridging The Gap Between Languages
Affects Gender Bias in Zero-Shot Multilingual Translation [12.376309678270275]
並列データが利用できない言語間のギャップを埋めることは、多言語NTTの性別バイアスに影響を与える。
本研究では, 言語に依存しない隠蔽表現が, ジェンダーの保存能力に及ぼす影響について検討した。
言語に依存しない表現は、ゼロショットモデルの男性バイアスを緩和し、ブリッジ言語におけるジェンダーインフレクションのレベルが増加し、話者関連性合意に対するより公平なジェンダー保存に関するゼロショット翻訳を超越することがわかった。
論文 参考訳(メタデータ) (2023-05-26T13:51:50Z) - Simple and Effective Unsupervised Speech Translation [68.25022245914363]
ラベル付きデータなしで音声翻訳システムを構築するための,シンプルで効果的な手法について検討する。
事前学習された音声モデルに対する教師なし領域適応手法を提案する。
実験により、教師なし音声からテキストへの翻訳は、それまでの教師なし状態よりも優れていたことが示されている。
論文 参考訳(メタデータ) (2022-10-18T22:26:13Z) - Gender in Danger? Evaluating Speech Translation Technology on the
MuST-SHE Corpus [20.766890957411132]
英語のような生産的な文法的なジェンダーのない言語からジェンダーマーク付き言語に翻訳することは、機械にとってよく知られた困難である。
ジェンダーバイアスを減らすために、オーディオは追加情報を提供できるか?
本稿では、音声翻訳における性差に関する最初の徹底的な調査を行い、将来の研究に役立つベンチマークのリリースに寄与する。
論文 参考訳(メタデータ) (2020-06-10T09:55:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。