Fugu-MT 論文翻訳(概要): Gradient-Informed Training for Low-Resource Multilingual Speech Translation

論文の概要: Gradient-Informed Training for Low-Resource Multilingual Speech Translation

arxiv url: http://arxiv.org/abs/2603.25836v1
Date: Thu, 26 Mar 2026 19:00:00 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-30 21:49:48.2414
Title: Gradient-Informed Training for Low-Resource Multilingual Speech Translation
Title（参考訳）: 低音源多言語音声翻訳のためのグラディエントインフォームドトレーニング
Authors: Ruiyan Sun, Satoshi Nakamura,
Abstract要約: 本研究は,学習勾配情報をマイニングすることで,レイヤ固有の共有パターンを自動的に決定する手法を提案する。提案手法では, 距離に基づく言語クラスタリング, キャパシティ割り当てのための自己/クロスタスク分散メトリクス, 共同分解の3つの異なる分析手法を用いる。
参考スコア（独自算出の注目度）: 4.344398827902069
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In low-resource multilingual speech-to-text translation, uniform architectural sharing across languages frequently introduces representation conflicts that impede convergence. This work proposes a principled methodology to automatically determine layer-specific sharing patterns by mining training gradient information. Our approach employs three distinct analysis strategies: distance-based language clustering, self/cross-task divergence metrics for capacity allocation, and joint factorization coupled with canonical correlation analysis for subspace alignment. Extensive evaluation across four language pairs (using the SeamlessM4T-Medium architecture) demonstrates persistent improvements in translation quality metrics.
Abstract（参考訳）: 低リソース多言語音声テキスト翻訳では、言語間の均一なアーキテクチャ共有は、収束を妨げる表現競合をしばしば導入する。本研究は,学習勾配情報をマイニングすることで,レイヤ固有の共有パターンを自動的に決定する手法を提案する。提案手法では,距離に基づく言語クラスタリング,キャパシティアロケーションのための自己/クロスタスク分散メトリクス,および部分空間アライメントのための標準相関解析と結合因数分解という,3つの異なる分析手法を用いる。 4つの言語ペア(SeamlessM4T-Mediumアーキテクチャを使用する)にわたる広範囲な評価は、翻訳品質メトリクスの持続的な改善を示している。

関連論文リスト

Multilinguality as Sense Adaptation [24.548610248136352]
SENSE-based Symmetric Interlingual Alignment (SENSIA) SENse-based Symmetric Interlingual Alignment (SENSIA)について紹介する。これは、ある言語から別の言語へのバックパック言語モデルへの適応であり、並列データに対する感覚レベルの混合とコンテキスト表現を明確に調整する。
論文参考訳（メタデータ） (2026-01-15T11:44:01Z)
Enhancing LLM Language Adaption through Cross-lingual In-Context Pre-training [57.62126373849383]
CrossIC-PT(クロスランガル・イン・コンテクスト・プレトレーニング)は、クロスランガル・トランスファーを強化するシンプルでスケーラブルなアプローチである。セマンティック関連のバイリンガルウィキペディア文書を1つのコンテキストウィンドウにインターリーブすることで、CrossIC-PTサンプルを構築する。実験の結果、CrossIC-PTは6つの対象言語にわたる3つのモデルの多言語性能を改善することが示された。
論文参考訳（メタデータ） (2025-04-29T07:24:25Z)
Optimal Transport Posterior Alignment for Cross-lingual Semantic Parsing [68.47787275021567]
言語間のセマンティックパーシングは、高いソース言語(例えば英語)から少ないトレーニングデータを持つ低リソース言語へのパーシング能力を伝達する。そこで本稿では,最適輸送を用いた係り受け変数間の言語間相違を明示的に最小化することで,言語間セマンティック解析のための新しい手法を提案する。
論文参考訳（メタデータ） (2023-07-09T04:52:31Z)
Cross-Align: Modeling Deep Cross-lingual Interactions for Word Alignment [63.0407314271459]
提案したCross-Alignは、5つの言語ペアのうち4つで最先端(SOTA)のパフォーマンスを達成する。実験の結果,提案したCross-Alignは5つの言語ペアのうち4つで最先端(SOTA)のパフォーマンスを達成することがわかった。
論文参考訳（メタデータ） (2022-10-09T02:24:35Z)
Multilingual Mix: Example Interpolation Improves Multilingual Neural Machine Translation [45.77509642452541]
インスタンスレベルで言語ペアを融合するために,多言語クロスオーバーエンコーダデコーダ(mXEncDec)を導入する。提案手法は,言語間の入力空間と出力空間の共有を促進するために,異なる言語ペアのインスタンスを共同でクロスオーバー例に補間する。
論文参考訳（メタデータ） (2022-03-15T03:56:22Z)
Uncertainty-Aware Balancing for Multilingual and Multi-Domain Neural Machine Translation Training [58.72619374790418]
MultiUATはモデルの不確実性に基づいてトレーニングデータの使用量を動的に調整する。クロスドメイン転送を解析し、静的および類似性に基づく手法の欠如を示す。
論文参考訳（メタデータ） (2021-09-06T08:30:33Z)
Cross-lingual Text Classification with Heterogeneous Graph Neural Network [2.6936806968297913]
言語間テキスト分類は、ソース言語上の分類器を訓練し、その知識を対象言語に伝達することを目的としている。近年の多言語事前学習言語モデル (mPLM) は言語間分類タスクにおいて顕著な結果をもたらす。言語間テキスト分類のための言語内および言語間における異種情報を統合するための,単純かつ効果的な手法を提案する。
論文参考訳（メタデータ） (2021-05-24T12:45:42Z)
Unsupervised Word Translation Pairing using Refinement based Point Set Registration [8.568050813210823]
単語埋め込みの言語間アライメントは、言語間の知識伝達において重要な役割を果たす。現在の教師なしのアプローチは、言語にまたがる単語埋め込み空間の幾何学的構造における類似性に依存している。本稿では,バイリンガル単語の共有ベクトル空間への埋め込みを教師なしでマッピングするBioSpereを提案する。
論文参考訳（メタデータ） (2020-11-26T09:51:29Z)
Cross-lingual Spoken Language Understanding with Regularized Representation Alignment [71.53159402053392]
外部リソースを使わずに言語間で単語レベルの表現と文レベルの表現を整列する正規化手法を提案する。言語間言語理解タスクの実験により、我々のモデルは、数ショットとゼロショットの両方のシナリオにおいて、最先端の手法よりも優れていることが示された。
論文参考訳（メタデータ） (2020-09-30T08:56:53Z)
Fine-Grained Analysis of Cross-Linguistic Syntactic Divergences [18.19093600136057]
並列コーパスから任意の言語対の発散パターンを抽出するフレームワークを提案する。我々のフレームワークは、言語間の相違の詳細な図を提供し、以前のアプローチを一般化し、完全に自動化することを示します。
論文参考訳（メタデータ） (2020-05-07T13:05:03Z)
Robust Cross-lingual Embeddings from Parallel Sentences [65.85468628136927]
本稿では,文整合コーパスを利用して頑健な言語間単語表現を実現するCBOW手法のバイリンガル拡張を提案する。提案手法は,他のすべての手法と比較して,言語間文検索性能を著しく向上させる。また、ゼロショットのクロスランガル文書分類タスクにおいて、ディープRNN法と同等性を実現する。
論文参考訳（メタデータ） (2019-12-28T16:18:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。