論文の概要: PHRASED: Phrase Dictionary Biasing for Speech Translation
- arxiv url: http://arxiv.org/abs/2506.09175v1
- Date: Tue, 10 Jun 2025 18:42:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 06:35:01.897323
- Title: PHRASED: Phrase Dictionary Biasing for Speech Translation
- Title(参考訳): PHRASED: 音声翻訳のためのフレーズ辞書
- Authors: Peidong Wang, Jian Xue, Rui Zhao, Junkun Chen, Aswin Shanmugam Subramanian, Jinyu Li,
- Abstract要約: 本稿では,ソース言語から対象言語への一対のフレーズマッピングを利用するフレーズ辞書バイアス法を提案する。
本稿では,このフレーズ辞書バイアス法を,トランスデューサに基づく音声翻訳モデルとマルチモーダル大言語モデルという,広く採用されている2種類のモデルに適用する。
- 参考スコア(独自算出の注目度): 41.03459069364749
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Phrases are essential to understand the core concepts in conversations. However, due to their rare occurrence in training data, correct translation of phrases is challenging in speech translation tasks. In this paper, we propose a phrase dictionary biasing method to leverage pairs of phrases mapping from the source language to the target language. We apply the phrase dictionary biasing method to two types of widely adopted models, a transducer-based streaming speech translation model and a multimodal large language model. Experimental results show that the phrase dictionary biasing method outperforms phrase list biasing by 21% relatively for the streaming speech translation model. In addition, phrase dictionary biasing enables multimodal large language models to use external phrase information, achieving 85% relative improvement in phrase recall.
- Abstract(参考訳): フレーズは会話の中核となる概念を理解するのに不可欠である。
しかし、訓練データに稀に発生するため、音声翻訳作業ではフレーズの正しい翻訳が困難である。
本稿では、ソース言語から対象言語への一対のフレーズマッピングを利用するための句辞書バイアス法を提案する。
本稿では,このフレーズ辞書バイアス法を,トランスデューサに基づく音声翻訳モデルとマルチモーダル大言語モデルという,広く採用されている2種類のモデルに適用する。
実験結果から, フレーズ辞書バイアス法は, ストリーム音声翻訳モデルにおいて, フレーズリストバイアスを相対的に21%上回ることがわかった。
さらに、句辞書バイアスにより、多モーダルな大言語モデルで外部のフレーズ情報を利用することができ、フレーズリコールにおいて85%の相対的な改善が達成される。
関連論文リスト
- Dictionaries to the Rescue: Cross-Lingual Vocabulary Transfer for Low-Resource Languages Using Bilingual Dictionaries [22.562544826766917]
言語間の語彙移動は、事前訓練された言語モデルを新しい言語に適応させる上で有望な役割を担っている。
モノリンガルまたはパラレルコーパスを利用する既存のアプローチは、限られたリソースを持つ言語に適用する場合、課題に直面します。
論文 参考訳(メタデータ) (2025-06-02T10:52:52Z) - Languages in Multilingual Speech Foundation Models Align Both Phonetically and Semantically [58.019484208091534]
事前訓練された言語モデル(LM)における言語間アライメントは、テキストベースのLMの効率的な転送を可能にしている。
テキストに基づく言語間アライメントの発見と手法が音声に適用されるかどうかについては、未解決のままである。
論文 参考訳(メタデータ) (2025-05-26T07:21:20Z) - Optimizing Rare Word Accuracy in Direct Speech Translation with a Retrieval-and-Demonstration Approach [25.166206924366527]
直接音声翻訳モデルにおいて,稀な単語翻訳精度を高めるための検索・復調手法を提案する。
まず,レアワード翻訳のための検索例を組み込むために,既存のSTモデルを適用した。
次に、適切な例を見つけるために、クロスモーダル(音声から音声へ、音声からテキストへ、テキストからテキストへ)検索装置を開発する。
論文 参考訳(メタデータ) (2024-09-13T17:38:03Z) - Contextualized Automatic Speech Recognition with Dynamic Vocabulary [41.892863381787684]
本稿では,推論中にバイアストークンを付加できる動的語彙を提案する。
バイアスリストの各エントリは、既存のサブワードトークンのシーケンスとは異なり、単一のトークンとして表現される。
実験の結果,提案手法は英語と日本語のデータセットにおけるバイアスフレーズWERを3.1~4.9ポイント改善することがわかった。
論文 参考訳(メタデータ) (2024-05-22T05:03:39Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Dict-BERT: Enhancing Language Model Pre-training with Dictionary [42.0998323292348]
事前学習型言語モデル(PLM)は,大規模コーパス上で自己指導型学習タスクを行うことで,普遍的な言語表現を学習することを目的としている。
本研究では,辞書におけるレアワードの定義を活用することで,言語モデル事前学習の強化に焦点をあてる。
入力テキストシーケンスとまれな単語定義間の単語と文レベルのアライメントに関する2つの新しい自己教師付き事前学習タスクを提案する。
論文 参考訳(メタデータ) (2021-10-13T04:29:14Z) - On the Language Coverage Bias for Neural Machine Translation [81.81456880770762]
言語カバレッジバイアスは、ニューラルネットワーク翻訳(NMT)において重要である。
実験を慎重に設計することにより、トレーニングデータにおける言語カバレッジバイアスの包括的分析を行う。
本稿では,言語カバレッジバイアス問題を軽減するための,シンプルで効果的な2つのアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-07T01:55:34Z) - On the Importance of Word Order Information in Cross-lingual Sequence
Labeling [80.65425412067464]
ソース言語の単語順に適合する言語間モデルでは、ターゲット言語を処理できない可能性がある。
本研究では,ソース言語の単語順序に敏感なモデルを作成することで,対象言語の適応性能が向上するかどうかを検討する。
論文 参考訳(メタデータ) (2020-01-30T03:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。