論文の概要: Who Are We Talking About? Handling Person Names in Speech Translation
- arxiv url: http://arxiv.org/abs/2205.06755v1
- Date: Fri, 13 May 2022 16:37:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-16 13:34:06.871782
- Title: Who Are We Talking About? Handling Person Names in Speech Translation
- Title(参考訳): 誰の話だ?
音声翻訳における人名処理
- Authors: Marco Gaido, Matteo Negri and Marco Turchi
- Abstract要約: 我々は、ASR/STシステムの出力を分析し、人名転写/翻訳の失敗の原因を特定する。
次に、多言語モデルを作成することで問題を緩和し、それらを共同で書き起こしや翻訳を強制することでSTシステムをさらに改善する。
- 参考スコア(独自算出の注目度): 18.56702596427545
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Recent work has shown that systems for speech translation (ST) -- similarly
to automatic speech recognition (ASR) -- poorly handle person names. This
shortcoming does not only lead to errors that can seriously distort the meaning
of the input, but also hinders the adoption of such systems in application
scenarios (like computer-assisted interpreting) where the translation of named
entities, like person names, is crucial. In this paper, we first analyse the
outputs of ASR/ST systems to identify the reasons of failures in person name
transcription/translation. Besides the frequency in the training data, we
pinpoint the nationality of the referred person as a key factor. We then
mitigate the problem by creating multilingual models, and further improve our
ST systems by forcing them to jointly generate transcripts and translations,
prioritising the former over the latter. Overall, our solutions result in a
relative improvement in token-level person name accuracy by 47.8% on average
for three language pairs (en->es,fr,it).
- Abstract(参考訳): 近年の研究では、自動音声認識(ASR)と同様の音声翻訳システム(ST)が、人物名を扱いにくいことが示されている。
この欠点は、入力の意味をひどく歪めるようなエラーにつながるだけでなく、人名のような名前付きエンティティの翻訳が不可欠であるアプリケーションシナリオ(コンピュータによる解釈など)におけるそのようなシステムの採用を妨げます。
本稿では、まずASR/STシステムの出力を分析し、人名転写/翻訳の失敗の原因を特定する。
トレーニングデータの頻度に加えて、対象者の国籍を重要な要因として挙げる。
そして,複数言語モデルの作成によりこの問題を軽減し,さらにstシステムを改良し,書き起こしと翻訳を共同生成させ,前者よりも前者を優先させる。
全体として、我々のソリューションは、3つの言語ペア(en->es,fr,it)に対して平均47.8%のトークンレベルの人物名精度を相対的に向上させる。
関連論文リスト
- Adversarial Training For Low-Resource Disfluency Correction [50.51901599433536]
ディフルエンシ補正(DC)のための逆学習型シーケンスタグ付けモデルを提案する。
提案手法の利点は,3つのインド語でDCに対して評価することで,合成された非流動データに大きく依存することを示す。
また,本手法は,音声障害によって導入されたASR文字の破面的不一致の除去にも有効である。
論文 参考訳(メタデータ) (2023-06-10T08:58:53Z) - On the Copying Problem of Unsupervised NMT: A Training Schedule with a
Language Discriminator Loss [120.19360680963152]
unsupervised neural machine translation (UNMT)は多くの言語で成功している。
コピー問題、すなわち、入力文の一部を翻訳として直接コピーする問題は、遠い言語対に共通している。
本稿では,言語識別器の損失を取り入れた,シンプルだが効果的な訓練スケジュールを提案する。
論文 参考訳(メタデータ) (2023-05-26T18:14:23Z) - Cross-lingual Knowledge Transfer and Iterative Pseudo-labeling for
Low-Resource Speech Recognition with Transducers [6.017182111335404]
言語間知識伝達と反復的擬似ラベル化は、ASRシステムの精度向上に成功していることを示す2つの手法である。
そこで本研究では,ハイブリッドシステムで作成したテキストを用いてトレーニングしたTransducerシステムが,単語誤り率の18%の削減を実現していることを示す。
論文 参考訳(メタデータ) (2023-05-23T03:50:35Z) - A Survey on Zero Pronoun Translation [69.09774294082965]
ゼロ代名詞(ZP)はプロドロップ言語では省略されることが多いが、非プロドロップ言語ではリコールされるべきである。
本研究は, 神経革命後のゼロ代名詞翻訳(ZPT)における主要な研究について述べる。
1) ZPTは大規模言語モデルの発展傾向と一致している; 2) データの制限は言語やドメインの学習バイアスを引き起こす; 3) 性能改善は単一のベンチマークで報告されることが多いが、高度な手法はまだ実世界の利用には程遠い。
論文 参考訳(メタデータ) (2023-05-17T13:19:01Z) - Investigating the Sensitivity of Automatic Speech Recognition Systems to
Phonetic Variation in L2 Englishes [3.198144010381572]
この研究は、複数のL2英語で音声変化を処理する方法を見つけるために、ASRシステムを探索する方法を実証する。
ASRの振る舞いは、類似した話し言葉を持つ話者間で体系的かつ一貫性があることが示されている。
論文 参考訳(メタデータ) (2023-05-12T11:29:13Z) - CROP: Zero-shot Cross-lingual Named Entity Recognition with Multilingual
Labeled Sequence Translation [113.99145386490639]
言語間NERは、整列した言語間表現や機械翻訳結果を通じて、言語間で知識を伝達することができる。
ゼロショット言語間NERを実現するために,クロスランガル・エンティティ・プロジェクション・フレームワーク(CROP)を提案する。
多言語ラベル付きシーケンス翻訳モデルを用いて、タグ付けされたシーケンスをターゲット言語に投影し、ターゲットの原文にラベル付けする。
論文 参考訳(メタデータ) (2022-10-13T13:32:36Z) - DEEP: DEnoising Entity Pre-training for Neural Machine Translation [123.6686940355937]
機械翻訳モデルは通常、トレーニングコーパスで稀な名前付きエンティティの翻訳を貧弱に生成することが示されている。
文中の名前付きエンティティ翻訳精度を向上させるために,大量のモノリンガルデータと知識ベースを利用するDenoising Entity Pre-training法であるDEEPを提案する。
論文 参考訳(メタデータ) (2021-11-14T17:28:09Z) - A transfer learning based approach for pronunciation scoring [7.98890440106366]
携帯電話レベルの発音は、人間のアノテータよりもはるかにパフォーマンスが低い、難しい作業である。
標準システムは、ネイティブデータのみを持つ自動音声認識(ASR)のために訓練されたモデルを使用して、フレーズで各電話機にスコアを生成する。
本稿では、ASRで訓練されたモデルを活用し、発音評価のタスクに適応するトランスファー学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-11-01T14:37:06Z) - Detecting over/under-translation errors for determining adequacy in
human translations [0.0]
本稿では,翻訳評価における誤りチェックの一部として,OT/UT(Over and Under translations)の新たな手法を提案する。
我々は、機械翻訳(mt)出力に制限はせず、特に人間が生成した翻訳パイプラインでアプリケーションをターゲットにしています。
本システムの目的は、人間の翻訳ビデオ字幕からOT/UTエラーを高いエラーリコールで識別することである。
論文 参考訳(メタデータ) (2021-04-01T06:06:36Z) - Repairing Pronouns in Translation with BERT-Based Post-Editing [7.6344611819427035]
いくつかの領域では、代名詞選択がNMTシステムのエラーの半数以上を占めることが示される。
次に、ソース側文のチャンクを使用して、代名詞予測タスクでBERTを微調整するソリューションを検討します。
論文 参考訳(メタデータ) (2021-03-23T21:01:03Z) - Interpretability Analysis for Named Entity Recognition to Understand
System Predictions and How They Can Improve [49.878051587667244]
名前付きエンティティ認識のためのLSTM-CRFアーキテクチャの性能について検討する。
文脈表現はシステムの性能に寄与するが、ハイパフォーマンスを駆動する主な要因は、名前トークン自体を学習することにある。
我々は、コンテキストのみからエンティティタイプを推測する可能性を評価するために、人間アノテーションを登録し、コンテキストのみのシステムによるエラーの大部分に対してエンティティタイプを推論することはできないが、改善の余地はいくつかある。
論文 参考訳(メタデータ) (2020-04-09T14:37:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。