論文の概要: Annealed Entropic Allocation for Ranking and Selection
- arxiv url: http://arxiv.org/abs/2606.11347v1
- Date: Tue, 09 Jun 2026 18:25:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.137158
- Title: Annealed Entropic Allocation for Ranking and Selection
- Title(参考訳): Annealed Entropic Allocation for Ranking and Selection
- Authors: Xin Fei, Juergen Branke,
- Abstract要約: Annealed Entropic Allocation(アニールド・エントロピック・アロケーション)は、ランキングとセレクションにおける逐次的な予算配分のための重み付きソフトミンフレームワークである。
本研究では,サロゲートが一様収束し,ソフトミンウェイトがアクティブチャレンジャーに集中し,固定重みの下では,誘導目標割り当てマップがシンプル内部で連続していることを示す。
- 参考スコア(独自算出の注目度): 4.54773250519101
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose Annealed Entropic Allocation, an annealed weighted soft-min framework for sequential budget allocation in ranking and selection. The central idea is to replace the non-smooth maximin large-deviation rate objective with a weighted log-sum-exp surrogate that aggregates challenger-specific pairwise scores through soft-min weights, mitigating hard switching when several challengers are nearly active. To improve finite-budget discrimination, we incorporate the saddlepoint approximation -- a sub-exponential correction derived from refined pairwise tail asymptotics. Because these corrections are sub-exponential and the smoothing parameter is annealed to zero, the surrogate preserves the same first-order large-deviation target as the classical maximin formulation. We show that the surrogate converges uniformly to the hard minimum, that the soft-min weights concentrate on the active challengers, and that, under fixed weights, the induced target allocation map is continuous on the simplex interior. Numerical experiments on Gaussian and exponential instances demonstrate competitive performance, especially when multiple challengers are nearly tied.
- Abstract(参考訳): 本稿では,アニール加重ソフトミンフレームワークであるAnnealed Entropic Allocationを提案する。
中心となる考え方は、非滑らかな最大偏差率目標を、複数の挑戦者がほぼ活動しているときにハードスイッチングを緩和し、挑戦者固有のペアワイズスコアをソフトミンウェイトで集約する重み付き対数sum-expサロゲートに置き換えることである。
有限予算の判別を改善するために、精製された一対の尾の漸近性から導かれる部分指数補正であるサドルポイント近似を組み込む。
これらの補正は部分指数であり、平滑化パラメータはゼロに熱されるので、サロゲートは古典的な最大値の定式化と同じ一階の大偏差ターゲットを保存する。
本研究では,サロゲートが一様収束し,ソフトミンウェイトがアクティブチャレンジャーに集中し,固定重みの下では,誘導されたターゲットアロケーションマップが単純な内部で連続していることを示す。
ガウスおよび指数例に関する数値実験は、特に複数の挑戦者がほぼ結びついている場合、競争性能を示す。
関連論文リスト
- A lift for input-convex neural network training [3.142113135607563]
In Inputdimensional Neural Network (ICNN) は、対数凹密度推定、凸ポテンシャル正規化フロー、最適輸送、後部へのトランスポートマップインバージョンに使用される。
非負の円錐への標準射影勾配降下(PGD)は、硬く非滑らかな投影を施す。
微分可能な代替品であるソフト・プラス・リパラメトリゼーション (Softplus reparametrization) は、重量級数で指数関数的に勾配を減衰させ、層間重量損失を減少させる訓練を停止させる。
揚力はPGDと直接ソフトプラスよりも低い試験損失を示し,プラトーバウンドトレーニングを1つにする。
論文 参考訳(メタデータ) (2026-05-22T22:59:11Z) - Dropout Universality: Scaling Laws and Optimal Scheduling at the Edge-of-Chaos [0.2864713389096699]
我々は,カオスの端における臨界信号伝搬の摂動として,ドロップアウトの平均場理論を開発する。
相関崩壊に対する臨界およびクロスオーバースケーリング法則を導出し、滑らかな活性化とキンクされたReLU様の活性化が異なるクラスであることを示す。
論文 参考訳(メタデータ) (2026-05-20T19:00:02Z) - First-Order Softmax Weighted Switching Gradient Method for Distributed Stochastic Minimax Optimization with Stochastic Constraints [9.141425189503794]
フェデレート学習に適した1次ソフトマックス重み付きスイッチング勾配法を提案する。
完全なクライアント参加の下で、我々のアルゴリズムは標準的な $mathcalO(-4)$ Oracle complexity を達成する。
我々は、統一されたエラー分解を提供し、シャープな$mathcalO(logfrac1)$高確率収束保証を確立する。
論文 参考訳(メタデータ) (2026-03-06T00:14:46Z) - The Implicit Bias of Steepest Descent with Mini-batch Stochastic Gradient [32.97211471008323]
本研究では, バッチサイズ, 運動量, 分散の低減が, 最大張力挙動と収束率の制限をいかに形成するかを検討した。
運動量なしでは、収束は大きなバッチでのみ発生し、バッチ依存のマージンギャップを生じるが、フルバッチ収束速度は得られないことを示す。
論文 参考訳(メタデータ) (2026-02-12T04:25:38Z) - Modality-Balanced Collaborative Distillation for Multi-Modal Domain Generalization [72.83292830785336]
ウェイト平均化 (WA) は, 平坦な損失景観への収束を促進することによって, 一般化を促進する強力な手法として登場した。
マルチモーダル環境での欠点を克服しつつ,WAの平坦性に起因した優位性を保ちつつ,統一的な共同蒸留フレームワークMBCDを提案する。
論文 参考訳(メタデータ) (2025-11-25T12:38:28Z) - Revisiting Zeroth-Order Optimization: Minimum-Variance Two-Point Estimators and Directionally Aligned Perturbations [57.179679246370114]
乱摂動の分布は, 摂動段差がゼロになる傾向にあるため, 推定子の分散を最小限に抑える。
以上の結果から, 一定の長さを維持するのではなく, 真の勾配に方向を合わせることが可能であることが示唆された。
論文 参考訳(メタデータ) (2025-10-22T19:06:39Z) - From Noisy Traces to Stable Gradients: Bias-Variance Optimized Preference Optimization for Aligning Large Reasoning Models [90.45197506653341]
大規模推論モデルは最終回答を生成する前に中間的推論トレースを生成する。
LRMと人間の好みの整合性は、モデルデプロイメントにとって重要な前提条件であり、まだ過小評価されていない。
共通の回避策は1つのサンプル軌道を最適化し、トレースサンプリングからかなり勾配のばらつきをもたらす。
論文 参考訳(メタデータ) (2025-10-06T17:58:01Z) - SeWA: Selective Weight Average via Probabilistic Masking [51.015724517293236]
より良く、より高速な収束を達成するためには、ほんの数ポイントしか必要としないことを示す。
離散選択問題を連続的な部分集合最適化フレームワークに変換する。
両凸画像チェックポイントの値よりもシャープなSeWAの安定性境界を導出する。
論文 参考訳(メタデータ) (2025-02-14T12:35:21Z) - Nesterov Meets Optimism: Rate-Optimal Separable Minimax Optimization [108.35402316802765]
本稿では,新しい一階最適化アルゴリズムであるAcceleratedGradient-OptimisticGradient (AG-OG) Ascentを提案する。
我々はAG-OGが様々な設定に対して最適収束率(定数まで)を達成することを示す。
アルゴリズムを拡張して設定を拡張し、bi-SC-SCとbi-C-SCの両方で最適な収束率を達成する。
論文 参考訳(メタデータ) (2022-10-31T17:59:29Z) - Between Stochastic and Adversarial Online Convex Optimization: Improved
Regret Bounds via Smoothness [2.628557920905129]
我々は,オンライン凸最適化において,対人的損失と完全対人的損失を補間する新たな後悔境界を確立する。
この目的を達成するために、損失系列に関連する2つの重要な量を導入し、累積分散と対角変動と呼ぶ。
完全な i.d. の場合、我々の境界は加速の結果から期待される速度と一致し、完全に反対の場合、ミニマックスの後悔と一致するように優雅に劣化する。
論文 参考訳(メタデータ) (2022-02-15T16:39:33Z) - On the Convergence of Stochastic Extragradient for Bilinear Games with
Restarted Iteration Averaging [96.13485146617322]
本稿では, ステップサイズが一定であるSEG法の解析を行い, 良好な収束をもたらす手法のバリエーションを示す。
平均化で拡張した場合、SEGはナッシュ平衡に確実に収束し、スケジュールされた再起動手順を組み込むことで、その速度が確実に加速されることを証明した。
論文 参考訳(メタデータ) (2021-06-30T17:51:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。