論文の概要: When Exploration Comes for Free with Mixture-Greedy: Do we need UCB in Diversity-Aware Multi-Armed Bandits?
- arxiv url: http://arxiv.org/abs/2603.21716v1
- Date: Mon, 23 Mar 2026 08:59:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.577545
- Title: When Exploration Comes for Free with Mixture-Greedy: Do we need UCB in Diversity-Aware Multi-Armed Bandits?
- Title(参考訳): Mixture-Greedyによる無料探査:多様性に配慮したマルチアーマッドバンドに UCB は必要か?
- Authors: Bahar Dibaei Nia, Farzan Farnia,
- Abstract要約: 明示的な UCB 型最適化を伴わない簡単な emphMixture-Greedy 戦略はより高速に収束し,より優れた性能が得られることを示す。
透明な構造条件下では、多様性を意識した目的は内部混合物を好んで暗黙的な探索を引き起こす。
これらの結果は,多様性を意識したモデル選択のためのマルチアーム帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状
- 参考スコア(独自算出の注目度): 18.528635656824864
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient selection among multiple generative models is increasingly important in modern generative AI, where sampling from suboptimal models is costly. This problem can be formulated as a multi-armed bandit task. Under diversity-aware evaluation metrics, a non-degenerate mixture of generators can outperform any individual model, distinguishing this setting from classical best-arm identification. Prior approaches therefore incorporate an Upper Confidence Bound (UCB) exploration bonus into the mixture objective. However, across multiple datasets and evaluation metrics, we observe that the UCB term consistently slows convergence and often reduces sample efficiency. In contrast, a simple \emph{Mixture-Greedy} strategy without explicit UCB-type optimism converges faster and achieves even better performance, particularly for widely used metrics such as FID and Vendi where tight confidence bounds are difficult to construct. We provide theoretical insight explaining this behavior: under transparent structural conditions, diversity-aware objectives induce implicit exploration by favoring interior mixtures, leading to linear sampling of all arms and sublinear regret guarantees for entropy-based, kernel-based, and FID-type objectives. These results suggest that in diversity-aware multi-armed bandits for generative model selection, exploration can arise intrinsically from the objective geometry, questioning the necessity of explicit confidence bonuses.
- Abstract(参考訳): 複数の生成モデル間の効率的な選択は、最適下モデルからのサンプリングがコストがかかる現代の生成AIにおいて、ますます重要になっている。
この問題は、マルチアームバンディットタスクとして定式化することができる。
多様性を意識した評価指標の下では、非退化したジェネレータの混合は個々のモデルよりも優れており、この設定を古典的なベストアーム識別と区別することができる。
したがって、事前のアプローチでは、アッパー信頼境界(UCB)探索ボーナスを混合目的に組み込む。
しかし、複数のデータセットや評価指標を通して、UTB項が一貫して収束を遅くし、しばしばサンプル効率を低下させることが観察される。
対照的に、明示的な UCB 型楽観主義を持たない単純な \emph{Mixture-Greedy} 戦略はより早く収束し、特に厳密な信頼境界を構築するのが困難である FID や Vendi のような広く使われている指標に対してより優れた性能を達成する。
透明な構造条件下では、多様性を意識した目的は、内部混合を優先して暗黙的な探索を誘導し、エントロピーベース、カーネルベース、FIDタイプの目的に対する全ての腕の線形サンプリングとサブ線形後悔保証をもたらす。
これらの結果は,多様性を意識したモデル選択のためのマルチアーム帯状帯状帯状帯状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状線状
関連論文リスト
- CAMO: A Conditional Neural Solver for the Multi-objective Multiple Traveling Salesman Problem [13.232337043603161]
多目的多目的トラベリングセールスマン問題(MOMTSP)に対する条件付きニューラルネットワークCAMOを提案する。
ターゲット、エージェント、選好ベクトルの様々な数にまたがって一般化し、パレートフロント(PF)に高品質な近似をもたらす。
実験により、CAMOは神経と慣性の両方に優れており、PFのより近い近似が達成されている。
論文 参考訳(メタデータ) (2026-03-19T15:59:45Z) - BROTHER: Behavioral Recognition Optimized Through Heterogeneous Ensemble Regularization for Ambivalence and Hesitancy [39.407739937584104]
自然主義的なビデオ設定におけるA/H(Ambivalence and Hesitancy)は、感情コンピューティングにおいて重要な課題である。
ビデオレベルでのA/H予測のために,高度に正規化されたマルチモーダル融合パイプラインを提案する。
論文 参考訳(メタデータ) (2026-03-15T12:53:41Z) - HBridge: H-Shape Bridging of Heterogeneous Experts for Unified Multimodal Understanding and Generation [72.69742127579508]
最近の統一モデルでは、理解の専門家(LLMなど)と生成の専門家(拡散モデルなど)を統合している。
本研究では,非対称なH字型アーキテクチャであるHBridgeを提案する。
複数のベンチマークにわたる大規模な実験は、HBridgeの有効性と優れた性能を示している。
論文 参考訳(メタデータ) (2025-11-25T17:23:38Z) - A Unified Contrastive-Generative Framework for Time Series Classification [7.712601563682029]
コントラスト生成時系列フレームワーク(CoGenT)を提案する。
これは、時間的データにおける高いクラス内類似性に対する対照的な学習の感度を克服し、生成的手法の大規模なデータセットへの依存を減らす。
その結果、59.2%と14.27%のF1がスタンドアローンのSimCLRとMAEをそれぞれ上回り、一貫した改善が見られた。
論文 参考訳(メタデータ) (2025-08-13T03:09:14Z) - UGG-ReID: Uncertainty-Guided Graph Model for Multi-Modal Object Re-Identification [26.770271366177603]
マルチモーダルオブジェクトReID(UGG-ReID)に対する不確実性誘導グラフモデルというロバストなアプローチを提案する。
UGG-ReIDは、ノイズ干渉を緩和し、効果的なマルチモーダル融合を促進するように設計されている。
実験結果から,提案手法は全データセットに対して優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2025-07-07T03:41:08Z) - Mitigating Shortcut Learning with Diffusion Counterfactuals and Diverse Ensembles [104.60508550106618]
拡散確率モデル(DPM)を利用したアンサンブル多様化フレームワークDiffDivを提案する。
DPMは、相関した入力特徴を示すサンプルを用いて訓練しても、新しい特徴の組み合わせで画像を生成することができることを示す。
そこで本研究では,DPM誘導の多様化は,教師付き信号の追加を必要とせず,ショートカットキューへの依存を取り除くのに十分であることを示す。
論文 参考訳(メタデータ) (2023-11-23T15:47:33Z) - BOtied: Multi-objective Bayesian optimization with tied multivariate ranks [33.414682601242006]
本稿では,非支配解と結合累積分布関数の極端量子化との自然な関係を示す。
このリンクにより、我々はPareto対応CDFインジケータと関連する取得関数BOtiedを提案する。
種々の合成および実世界の問題に対する実験により,BOtied は最先端MOBO 取得関数より優れていることが示された。
論文 参考訳(メタデータ) (2023-06-01T04:50:06Z) - Cauchy-Schwarz Regularized Autoencoder [68.80569889599434]
変分オートエンコーダ(VAE)は、強力で広く使われている生成モデルのクラスである。
GMMに対して解析的に計算できるCauchy-Schwarz分散に基づく新しい制約対象を導入する。
本研究の目的は,密度推定,教師なしクラスタリング,半教師なし学習,顔分析における変分自動エンコーディングモデルの改善である。
論文 参考訳(メタデータ) (2021-01-06T17:36:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。