論文の概要: Co-Exploration and Co-Exploitation via Shared Structure in Multi-Task Bandits
- arxiv url: http://arxiv.org/abs/2512.12693v1
- Date: Sun, 14 Dec 2025 13:56:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.386167
- Title: Co-Exploration and Co-Exploitation via Shared Structure in Multi-Task Bandits
- Title(参考訳): マルチタスク帯域における共有構造による共探索と共探索
- Authors: Sumantrak Mukherjee, Serafima Lebedeva, Valentin Margraf, Jonas Hanselle, Kanta Yamaoka, Viktor Bengs, Stefan Konigorski, Eyke Hüllermeier, Sebastian Josef Vollmer,
- Abstract要約: 本稿では,コンテキスト型マルチタスク・マルチアーム・バンディット・セッティングにおける効率的な探索のための新しいフレームワークを提案する。
提案手法は,全タスクの観察を統合し,新たなタスクに対する個人化された推論が可能でありながら,グローバルな共同分布を学習する。
- 参考スコア(独自算出の注目度): 26.213618533559423
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a novel Bayesian framework for efficient exploration in contextual multi-task multi-armed bandit settings, where the context is only observed partially and dependencies between reward distributions are induced by latent context variables. In order to exploit these structural dependencies, our approach integrates observations across all tasks and learns a global joint distribution, while still allowing personalised inference for new tasks. In this regard, we identify two key sources of epistemic uncertainty, namely structural uncertainty in the latent reward dependencies across arms and tasks, and user-specific uncertainty due to incomplete context and limited interaction history. To put our method into practice, we represent the joint distribution over tasks and rewards using a particle-based approximation of a log-density Gaussian process. This representation enables flexible, data-driven discovery of both inter-arm and inter-task dependencies without prior assumptions on the latent variables. Empirically, we demonstrate that our method outperforms baselines such as hierarchical model bandits, especially in settings with model misspecification or complex latent heterogeneity.
- Abstract(参考訳): そこで我々は,コンテキストを部分的にのみ観察し,報酬分布間の依存関係を潜在文脈変数によって誘導する,コンテキストマルチタスクマルチタスクバンディット設定における効率的な探索のための新しいベイズフレームワークを提案する。
これらの構造的依存関係を活用するために、我々の手法は全てのタスクをまたいだ観察を統合し、新たなタスクに対する個人化された推論を可能にしながら、グローバルな共同分布を学習する。
そこで本研究では,武器・タスク間の潜在報酬依存性の構造的不確実性と,不完全なコンテキストや限られたインタラクション履歴によるユーザ固有の不確実性という,疫学的不確実性の2つの要因を同定する。
本手法を実践するために, 対数密度ガウス過程の粒子近似を用いて, タスクと報酬に対する共同分布を表現した。
この表現は、潜伏変数に対する事前の仮定なしに、アーム間およびタスク間依存関係の両方を柔軟かつデータ駆動で発見することを可能にする。
実験により,本手法は階層型モデルバンドイットなどのベースライン,特にモデル不特定性や複雑な潜時不均一性の設定において,優れた性能を示すことを示す。
関連論文リスト
- Empirical Bayesian Multi-Bandit Learning [8.980876474818153]
文脈的包帯におけるマルチタスク学習は、大きな研究関心を集めている。
本稿では,様々な帯域で学習する階層型ベイズフレームワークを提案する。
提案アルゴリズムは既存の手法に比べて累積的後悔度が低いことを示す。
論文 参考訳(メタデータ) (2025-10-30T09:08:07Z) - Synergy Between Sufficient Changes and Sparse Mixing Procedure for Disentangled Representation Learning [32.482584125236016]
アンタングル表現学習は、観測データの背後にある潜伏変数を明らかにすることを目的としている。
いくつかのアプローチは、ドメインインデックスのような補助変数によって示される潜伏変数の分布に十分な変化に依存する。
本稿では,分散変化とスパース混合過程に関する制約の少ない識別可能性理論を提案する。
論文 参考訳(メタデータ) (2025-03-01T22:21:37Z) - InterHandGen: Two-Hand Interaction Generation via Cascaded Reverse Diffusion [53.90516061351706]
両手インタラクションに先立って生成を学習する新しいフレームワークであるInterHandGenを提案する。
サンプリングにアンチペネティフィケーションと合成フリーガイダンスを組み合わせることで、プラウシブルな生成を可能にする。
本手法は, 妥当性と多様性の観点から, ベースライン生成モデルよりも有意に優れていた。
論文 参考訳(メタデータ) (2024-03-26T06:35:55Z) - Similarity-based Memory Enhanced Joint Entity and Relation Extraction [3.9659135716762894]
文書レベルの共同エンティティと関係抽出は難解な情報抽出問題である。
タスク間の双方向メモリのような依存性を持つマルチタスク学習フレームワークを提案する。
実験により,提案手法が既存手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-07-14T12:26:56Z) - Leveraging sparse and shared feature activations for disentangled
representation learning [112.22699167017471]
本稿では,教師付きタスクの多種多様な集合から抽出した知識を活用し,共通不整合表現を学習することを提案する。
我々は6つの実世界分布シフトベンチマークと異なるデータモダリティに対するアプローチを検証する。
論文 参考訳(メタデータ) (2023-04-17T01:33:24Z) - Dive into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty
Estimation for Facial Expression Recognition [59.52434325897716]
DMUE(DMUE)という,アノテーションのあいまいさを2つの視点から解決するソリューションを提案する。
前者に対しては,ラベル空間における潜伏分布をよりよく記述するために,補助的マルチブランチ学習フレームワークを導入する。
後者の場合、インスタンス間の意味的特徴のペアワイズ関係を完全に活用して、インスタンス空間のあいまいさの程度を推定する。
論文 参考訳(メタデータ) (2021-04-01T03:21:57Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z) - COBRA: Contrastive Bi-Modal Representation Algorithm [43.33840912256077]
本稿では,CPC(Contrastive Predictive Coding)とNCE(Noth Contrastive Estimation)のパラダイムにインスパイアされた,2つのモダリティの学習を目的とした新しいフレームワークを提案する。
本研究では,この枠組みがモダリティギャップを大幅に減らし,ロバストでタスクに依存しない共同埋め込み空間を生成することを実証的に示す。
7つのベンチマークのクロスモーダルデータセットにまたがる4つのダウンストリームタスクにおいて、既存の作業よりも優れています。
論文 参考訳(メタデータ) (2020-05-07T18:20:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。