論文の概要: TokenVerse++: Towards Flexible Multitask Learning with Dynamic Task Activation
- arxiv url: http://arxiv.org/abs/2508.19856v1
- Date: Wed, 27 Aug 2025 13:16:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.638679
- Title: TokenVerse++: Towards Flexible Multitask Learning with Dynamic Task Activation
- Title(参考訳): TokenVerse++:動的タスクアクティベーションによる柔軟なマルチタスク学習を目指す
- Authors: Shashi Kumar, Srikanth Madikeri, Esaú Villatoro-Tello, Sergio Burdisso, Pradeep Rangappa, Andrés Carofilis, Petr Motlicek, Karthik Pandia, Shankar Venkatesan, Kadri Hacioğlu, Andreas Stolcke,
- Abstract要約: TokenVerse++は、動的タスクアクティベーションのためのXLSR-Transducer ASRモデルの音響埋め込み空間に学習可能なベクトルを導入する。
データセットを部分ラベルとうまく統合し、特にASRと追加タスクである言語識別に役立てることにより、これを実証する。
TokenVerse++の結果は、複数のタスクにまたがるTokenVerseと同等かそれ以上であり、ASRパフォーマンスを犠牲にすることなく、より実用的なマルチタスク代替品として確立されている。
- 参考スコア(独自算出の注目度): 13.676666039727904
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Token-based multitasking frameworks like TokenVerse require all training utterances to have labels for all tasks, hindering their ability to leverage partially annotated datasets and scale effectively. We propose TokenVerse++, which introduces learnable vectors in the acoustic embedding space of the XLSR-Transducer ASR model for dynamic task activation. This core mechanism enables training with utterances labeled for only a subset of tasks, a key advantage over TokenVerse. We demonstrate this by successfully integrating a dataset with partial labels, specifically for ASR and an additional task, language identification, improving overall performance. TokenVerse++ achieves results on par with or exceeding TokenVerse across multiple tasks, establishing it as a more practical multitask alternative without sacrificing ASR performance.
- Abstract(参考訳): TokenVerseのようなトークンベースのマルチタスクフレームワークは、すべてのタスクにラベルを付けるために、すべてのトレーニング発話を必要とする。
動的タスクアクティベーションのためのXLSR-Transducer ASRモデルの音響埋め込み空間に学習可能なベクトルを導入するTokenVerse++を提案する。
この中核的なメカニズムは、タスクのサブセットのみにラベル付けされた発話によるトレーニングを可能にする。
我々は、データセットを部分ラベルとうまく統合し、特にASRと追加のタスク、言語識別、全体的なパフォーマンスを改善することでこれを実証する。
TokenVerse++は、複数のタスクでTokenVerseと同等かそれ以上の結果を達成し、ASRパフォーマンスを犠牲にすることなく、より実用的なマルチタスク代替品として確立している。
関連論文リスト
- ToDRE: Visual Token Pruning via Diversity and Task Awareness for Efficient Large Vision-Language Models [59.47738955960352]
ToDREは、2段階でトレーニング不要なトークン圧縮フレームワークである。
トークンの多様性とトークン-タスク関連性に基づいてトークンをプルーニングすることで、優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-05-24T15:47:49Z) - Multi-Task Label Discovery via Hierarchical Task Tokens for Partially Annotated Dense Predictions [44.78165979575075]
本稿では,コンパクトな学習可能な階層型タスクトークンの集合を最適化する新しい手法を提案する。
グローバルタスクトークンは、グローバルコンテキストにおける効果的なクロスタスク機能インタラクションのために設計されている。
各タスクに対するきめ細かいタスク固有の空間トークンのグループを、対応するグローバルタスクトークンから学習する。
学習されたグローバルおよび局所的な細粒度タスクトークンは、異なるレベルの粒度で擬似タスク固有の密度ラベルを発見するためにさらに使用される。
論文 参考訳(メタデータ) (2024-11-27T23:53:27Z) - Learning Multi-Aspect Item Palette: A Semantic Tokenization Framework for Generative Recommendation [55.99632509895994]
マルチアスペクトセマンティックトークン化のための新しいアプローチであるLAMIAを紹介する。
単一の埋め込みを使用するRQ-VAEとは異なり、LAMIAは独立的でセマンティックな並列な埋め込みの集合である「アイテムパレット」を学習する。
その結果,提案手法よりも提案手法の精度が大幅に向上した。
論文 参考訳(メタデータ) (2024-09-11T13:49:48Z) - TokenVerse: Towards Unifying Speech and NLP Tasks via Transducer-based ASR [3.717584661565119]
TokenVerseは、複数のタスクを処理するように設計された単一のTransducerベースのモデルである。
ASRモデルトレーニング中にタスク固有のトークンを参照テキストに統合することで実現される。
実験の結果,提案手法は相対的なWERにおいて最大7.7%向上することがわかった。
論文 参考訳(メタデータ) (2024-07-05T11:54:38Z) - PartAL: Efficient Partial Active Learning in Multi-Task Visual Settings [57.08386016411536]
注記すべき画像だけでなく、各アクティブラーニング(AL)にアノテーションを提供するタスクのサブセットを選択する方が効果的であることを示す。
提案手法の有効性を,複数の一般的なマルチタスクデータセットに示す。
論文 参考訳(メタデータ) (2022-11-21T15:08:35Z) - Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised
Semantic Segmentation [88.49669148290306]
そこで我々はAuxSegNetと呼ばれる弱教師付きマルチタスク・フレームワークを提案し,サリエンシ検出とマルチラベル画像分類を補助タスクとして活用する。
同様の構造的セマンティクスに着想を得て,サリエンシとセグメンテーションの表現から,クロスタスクなグローバル画素レベルの親和性マップを学習することを提案する。
学習されたクロスタスク親和性は、両方のタスクに対して改善された擬似ラベルを提供するために、唾液度予測を洗練し、CAMマップを伝播するために使用することができる。
論文 参考訳(メタデータ) (2021-07-25T11:39:58Z) - Adaptive Self-training for Few-shot Neural Sequence Labeling [55.43109437200101]
ニューラルシークエンスラベリングモデルにおけるラベル不足問題に対処する手法を開発した。
自己学習は、大量のラベルのないデータから学ぶための効果的なメカニズムとして機能する。
メタラーニングは、適応的なサンプル再重み付けにおいて、ノイズのある擬似ラベルからのエラー伝播を軽減するのに役立つ。
論文 参考訳(メタデータ) (2020-10-07T22:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。