論文の概要: BandiK: Efficient Multi-Task Decomposition Using a Multi-Bandit Framework
- arxiv url: http://arxiv.org/abs/2512.24708v1
- Date: Wed, 31 Dec 2025 08:25:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.605237
- Title: BandiK: Efficient Multi-Task Decomposition Using a Multi-Bandit Framework
- Title(参考訳): BandiK: マルチバンドフレームワークを用いた効率的なマルチタスク分割
- Authors: András Millinghoffer, András Formanek, András Antos, Péter Antal,
- Abstract要約: BandiKは、マルチバンドを用いた新しいマルチタスク補助タスクサブセット選択法である。
これは、共同学習の恩恵を受ける可能性のあるタスクを特定するのに役立つタスク間のペアワイズ転送を推定する。
第2段階では、初期推定に基づいて、各目標タスクに対する補助タスクの候補セットの線形数を構築する。
- 参考スコア(独自算出の注目度): 0.05142666700569701
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The challenge of effectively transferring knowledge across multiple tasks is of critical importance and is also present in downstream tasks with foundation models. However, the nature of transfer, its transitive-intransitive nature, is still an open problem, and negative transfer remains a significant obstacle. Selection of beneficial auxiliary task sets in multi-task learning is frequently hindered by the high computational cost of their evaluation, the high number of plausible candidate auxiliary sets, and the varying complexity of selection across target tasks. To address these constraints, we introduce BandiK, a novel three-stage multi-task auxiliary task subset selection method using multi-bandits, where each arm pull evaluates candidate auxiliary sets by training and testing a multiple output neural network on a single random train-test dataset split. Firstly, BandiK estimates the pairwise transfers between tasks, which helps in identifying which tasks are likely to benefit from joint learning. In the second stage, it constructs a linear number of candidate sets of auxiliary tasks (in the number of all tasks) for each target task based on the initial estimations, significantly reducing the exponential number of potential auxiliary task sets. Thirdly, it employs a Multi-Armed Bandit (MAB) framework for each task, where the arms correspond to the performance of candidate auxiliary sets realized as multiple output neural networks over train-test data set splits. To enhance efficiency, BandiK integrates these individual task-specific MABs into a multi-bandit structure. The proposed multi-bandit solution exploits that the same neural network realizes multiple arms of different individual bandits corresponding to a given candidate set. This semi-overlapping arm property defines a novel multi-bandit cost/reward structure utilized in BandiK.
- Abstract(参考訳): 複数のタスク間で知識を効果的に伝達するという課題は重要であり、ファンデーションモデルによる下流タスクにも存在している。
しかし、移動の性質、その推移的非推移的性質は依然として未解決の問題であり、負の移動は重要な障害である。
マルチタスク学習における有用な補助的タスクセットの選択は、高い計算コスト、高い候補補助セット、ターゲットタスク間の選択の複雑さによって、しばしば妨げられる。
これらの制約に対処するために、BandiKという新しい3段階のマルチタスク補助タスクサブセット選択手法を導入し、各アームプルが単一のランダムトレインテストデータセットスプリット上で複数の出力ニューラルネットワークをトレーニングし、テストすることにより、候補補助セットを評価する。
まず、BandiKはタスク間のペア転送を推定し、共同学習の恩恵を受ける可能性のあるタスクを特定するのに役立つ。
第2段階では、初期推定に基づいて、各タスクに対する補助タスクの候補セットの線形数(全タスク数)を構築し、潜在的な補助タスクセットの指数的な数を大幅に減少させる。
第3に、各タスクにMulti-Armed Bandit (MAB) フレームワークを使用し、腕は列車テストデータセットの分割よりも複数の出力ニューラルネットワークとして実現される候補補助セットのパフォーマンスに対応する。
効率を高めるために、BandiKはこれらのタスク固有のMABをマルチバンド構造に統合する。
提案したマルチバンドソリューションは、同一のニューラルネットワークが、与えられた候補セットに対応する異なる個々のバンドレットの複数のアームを実現することを悪用する。
半重なり合うアーム特性は、BandiKで使用される新しいマルチバンドコスト/リワード構造を定義する。
関連論文リスト
- Task Selection and Assignment for Multi-modal Multi-task Dialogue Act
Classification with Non-stationary Multi-armed Bandits [11.682678945754837]
マルチタスク学習(MTL)は、関連する補助タスクと共同学習することで、一次タスクの性能を向上させることを目的としている。
これまでの研究では、このようなランダムなタスクの選択は役に立たない可能性があり、パフォーマンスに有害な可能性があることが示唆されている。
本稿では,非定常的マルチアームバンディットに基づくタスクの選択と割り当てを行う手法を提案する。
論文 参考訳(メタデータ) (2023-09-18T14:51:51Z) - Identification of Negative Transfers in Multitask Learning Using
Surrogate Models [29.882265735630046]
マルチタスク学習は、複数の関連するソースタスクで強化することで、低リソースのターゲットタスクのトレーニングに広く使用されている。
マルチタスク学習における重要な問題は、ターゲットタスクに利益をもたらすソースタスクのサブセットを特定することである。
本稿では,サロゲートモデルを用いてこの問題に対処する効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-25T23:16:11Z) - Multi-task Bias-Variance Trade-off Through Functional Constraints [102.64082402388192]
マルチタスク学習は、多様なタスクによく機能する関数の集合を取得することを目的としている。
本稿では,2つの極端な学習シナリオ,すなわちすべてのタスクに対する単一関数と,他のタスクを無視するタスク固有関数から直感を抽出する。
本稿では,集中関数に対するドメイン固有解を強制する制約付き学習定式化を導入する。
論文 参考訳(メタデータ) (2022-10-27T16:06:47Z) - Sparsely Activated Mixture-of-Experts are Robust Multi-Task Learners [67.5865966762559]
本研究では,Mixture-of-Experts (MoE) がマルチタスク学習を改善するかを検討した。
タスク認識ゲーティング関数を考案し、異なるタスクから専門の専門家にサンプルをルーティングする。
これにより、多数のパラメータを持つ疎活性化マルチタスクモデルが得られるが、高密度モデルの計算コストは同じである。
論文 参考訳(メタデータ) (2022-04-16T00:56:12Z) - Variational Multi-Task Learning with Gumbel-Softmax Priors [105.22406384964144]
マルチタスク学習は、タスク関連性を探究し、個々のタスクを改善することを目的としている。
本稿では,複数のタスクを学習するための一般的な確率的推論フレームワークである変分マルチタスク学習(VMTL)を提案する。
論文 参考訳(メタデータ) (2021-11-09T18:49:45Z) - Multi-Task Learning with Sequence-Conditioned Transporter Networks [67.57293592529517]
シーケンスコンディショニングと重み付きサンプリングのレンズによるマルチタスク学習の実現を目指している。
合成タスクを対象とした新しいベンチマークであるMultiRavensを提案する。
次に,視覚に基づくエンドツーエンドシステムアーキテクチャであるSequence-Conditioned Transporter Networksを提案する。
論文 参考訳(メタデータ) (2021-09-15T21:19:11Z) - Multi-task Supervised Learning via Cross-learning [102.64082402388192]
我々は,様々なタスクを解くことを目的とした回帰関数の集合を適合させることで,マルチタスク学習と呼ばれる問題を考える。
我々の新しい定式化では、これらの関数のパラメータを2つに分けて、互いに近づきながらタスク固有のドメインで学習する。
これにより、異なるドメインにまたがって収集されたデータが、互いのタスクにおける学習パフォーマンスを改善するのに役立つ、クロス・ファーティライズが促進される。
論文 参考訳(メタデータ) (2020-10-24T21:35:57Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。