論文の概要: Solving Inverse Problem for Multi-armed Bandits via Convex Optimization
- arxiv url: http://arxiv.org/abs/2501.18945v2
- Date: Wed, 05 Mar 2025 09:13:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-06 15:48:31.158080
- Title: Solving Inverse Problem for Multi-armed Bandits via Convex Optimization
- Title(参考訳): 凸最適化によるマルチアーム帯域の逆問題の解法
- Authors: Hao Zhu, Joschka Boedecker,
- Abstract要約: 行動モデリングのための神経科学・心理学研究で広く用いられている多腕包帯(IMAB)の逆問題について考察する。
まず、IMAB問題は一般の凸問題ではなく、変数変換によって凸問題に緩和できることを示す。
我々は,IMAB問題に対して,IMAB問題に対するグローバルな解決策を提供する条件と,計算時間を短縮するための近似について論じる。
- 参考スコア(独自算出の注目度): 10.218348617571257
- License:
- Abstract: We consider the inverse problem of multi-armed bandits (IMAB) that are widely used in neuroscience and psychology research for behavior modelling. We first show that the IMAB problem is not convex in general, but can be relaxed to a convex problem via variable transformation. Based on this result, we propose a two-step sequential heuristic for (approximately) solving the IMAB problem. We discuss a condition where our method provides global solution to the IMAB problem with certificate, as well as approximations to further save computing time. Numerical experiments indicate that our heuristic method is more robust than directly solving the IMAB problem via repeated local optimization, and can achieve the performance of Monte Carlo methods within a significantly decreased running time. We provide the implementation of our method based on CVXPY, which allows straightforward application by users not well versed in convex optimization.
- Abstract(参考訳): 行動モデリングのための神経科学・心理学研究で広く用いられている多腕包帯(IMAB)の逆問題について考察する。
まず、IMAB問題は一般の凸問題ではなく、変数変換によって凸問題に緩和できることを示す。
この結果に基づき、IMAB問題を解くための2段階の逐次ヒューリスティックを提案する。
我々は,IMAB問題に対して,IMAB問題に対するグローバルな解決策を提供する条件と,計算時間を短縮するための近似について論じる。
数値実験により,我々のヒューリスティック法は局所最適化の繰り返しによる IMAB 問題の直接解法よりも頑健であり,モンテカルロ法の性能を著しく低下した時間で達成できることが示唆された。
本稿では,CVXPYに基づく提案手法の実装について述べる。
関連論文リスト
- Towards graph neural networks for provably solving convex optimization problems [5.966097889241178]
提案するMPNNフレームワークは,検証可能な実現可能性保証を用いて凸最適化問題を解決する。
実験の結果,提案手法は既存の神経ベースラインよりも解の質や実現可能性に優れていた。
論文 参考訳(メタデータ) (2025-02-04T16:11:41Z) - Non-Myopic Multi-Objective Bayesian Optimization [64.31753000439514]
多目的最適化問題を解くために、有限水平逐次実験設計の問題を考察する。
この問題は、材料設計を含む多くの現実世界の応用で発生する。
我々はMOO問題に対する最初の非ミオピック手法を提案する。
論文 参考訳(メタデータ) (2024-12-11T04:05:29Z) - Feature selection in linear SVMs via a hard cardinality constraint: a scalable SDP decomposition approach [3.7876216422538485]
本稿では, 線形支援ベクトルマシン(SVM)において, 濃度制約が適用された場合の組込み特徴選択問題について検討する。
この問題は、元の線形SVMが時間内に解決可能な問題に等しいにもかかわらず、濃度制約が存在するためNPハードである。
この問題に対処するために、まず2つの混合整数式を導入し、新しい半定緩和法を提案する。
論文 参考訳(メタデータ) (2024-04-15T19:15:32Z) - Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Moreau Envelope ADMM for Decentralized Weakly Convex Optimization [55.2289666758254]
本稿では,分散最適化のための乗算器の交互方向法(ADMM)の近位変種を提案する。
数値実験の結果,本手法は広く用いられている手法よりも高速かつ堅牢であることが示された。
論文 参考訳(メタデータ) (2023-08-31T14:16:30Z) - Solving Inverse Problems by Joint Posterior Maximization with
Autoencoding Prior [0.0]
JPal Autoencoder (VAE) が先行する画像における不適切な逆問題解決の問題に対処する。
本手法は,提案した目的関数を満たすのに十分であることを示す。
結果は、より堅牢な見積もりを提供するアプローチの堅牢性も示しています。
論文 参考訳(メタデータ) (2021-03-02T11:18:34Z) - Parallel Stochastic Mirror Descent for MDPs [72.75921150912556]
無限水平マルコフ決定過程(MDP)における最適政策学習の問題を考える。
リプシッツ連続関数を用いた凸プログラミング問題に対してミラー・ディクセントの変種が提案されている。
このアルゴリズムを一般の場合において解析し,提案手法の動作中に誤差を蓄積しない収束率の推定値を得る。
論文 参考訳(メタデータ) (2021-02-27T19:28:39Z) - A Hybrid Framework Using a QUBO Solver For Permutation-Based
Combinatorial Optimization [5.460573052311485]
本稿では,高性能な2次非制約バイナリ最適化器を用いて,大規模な置換に基づく問題を解くためのハイブリッドフレームワークを提案する。
通常はビット数に制限があるQUBOソルバを使用する際の課題を克服する手法を提案する。
論文 参考訳(メタデータ) (2020-09-27T07:15:25Z) - Conditional gradient methods for stochastically constrained convex
minimization [54.53786593679331]
構造凸最適化問題に対する条件勾配に基づく2つの新しい解法を提案する。
私たちのフレームワークの最も重要な特徴は、各イテレーションで制約のサブセットだけが処理されることです。
提案アルゴリズムは, 条件勾配のステップとともに, 分散の低減と平滑化に頼り, 厳密な収束保証を伴っている。
論文 参考訳(メタデータ) (2020-07-07T21:26:35Z) - Stochastic gradient algorithms from ODE splitting perspective [0.0]
我々は、ODEの近似解の分割スキームに遡る最適化に関する異なる見解を示す。
そこで本研究では, ODE の勾配一階分割方式と降下アプローチの関連性について述べる。
我々は、機械学習アプリケーションにインスパイアされた分割の特殊なケースを考察し、それに対するグローバルスプリッティングエラーに新たな上限を導出する。
論文 参考訳(メタデータ) (2020-04-19T22:45:32Z) - GACEM: Generalized Autoregressive Cross Entropy Method for Multi-Modal
Black Box Constraint Satisfaction [69.94831587339539]
本稿では,マスク付き自己回帰ニューラルネットワークを用いて解空間上の均一分布をモデル化するクロスエントロピー法(CEM)を提案する。
我々のアルゴリズムは複雑な解空間を表現でき、様々な異なる解領域を追跡できる。
論文 参考訳(メタデータ) (2020-02-17T20:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。