論文の概要: Multi-armed Bandits with Missing Outcome
- arxiv url: http://arxiv.org/abs/2411.05661v1
- Date: Fri, 08 Nov 2024 16:02:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 14:55:38.275765
- Title: Multi-armed Bandits with Missing Outcome
- Title(参考訳): 出力を欠いたマルチアームバンド
- Authors: Ilia Mahrooghi, Mahshad Moradi, Sina Akbari, Negar Kiyavash,
- Abstract要約: ランダム(MAR)モデルとランダム(MNAR)モデルの両方において欠落を考慮に入れないアルゴリズムを導入する。
これらの設定の欠如を考慮し,意思決定の大幅な改善を実演する。
- 参考スコア(独自算出の注目度): 19.038223551435422
- License:
- Abstract: While significant progress has been made in designing algorithms that minimize regret in online decision-making, real-world scenarios often introduce additional complexities, perhaps the most challenging of which is missing outcomes. Overlooking this aspect or simply assuming random missingness invariably leads to biased estimates of the rewards and may result in linear regret. Despite the practical relevance of this challenge, no rigorous methodology currently exists for systematically handling missingness, especially when the missingness mechanism is not random. In this paper, we address this gap in the context of multi-armed bandits (MAB) with missing outcomes by analyzing the impact of different missingness mechanisms on achievable regret bounds. We introduce algorithms that account for missingness under both missing at random (MAR) and missing not at random (MNAR) models. Through both analytical and simulation studies, we demonstrate the drastic improvements in decision-making by accounting for missingness in these settings.
- Abstract(参考訳): オンライン意思決定における後悔を最小限に抑えるアルゴリズムの設計において、大きな進歩があったが、現実のシナリオは、しばしば追加の複雑さを導入し、おそらく最も難しいのは、結果の欠落である。
この側面を見渡したり、単にランダムな欠落を仮定すれば、報酬の偏見がつき、線形後悔につながる可能性がある。
この課題の実践的関連性にもかかわらず、特に欠損機構がランダムでない場合に、不足を体系的に扱う厳密な方法論は存在しない。
本稿では,マルチアームバンディット(MAB)のコンテキストにおけるこのギャップを,異なる欠落メカニズムが達成可能な後悔境界に与える影響を解析することによって解決する。
ランダム(MAR)モデルとランダム(MNAR)モデルの両方において欠落を考慮に入れないアルゴリズムを導入する。
分析とシミュレーションの両研究を通じて、これらの設定の欠如を考慮し、意思決定の大幅な改善を実演する。
関連論文リスト
- Still More Shades of Null: An Evaluation Suite for Responsible Missing Value Imputation [7.620967781722717]
本稿では,有意な値計算を行うための評価スイートであるShades-of-Nullを紹介する。
我々はShades-of-Nullを使って23,940の実験パイプラインを含む大規模な実験研究を行っている。
論文 参考訳(メタデータ) (2024-09-11T17:58:39Z) - Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Multiplier Bootstrap-based Exploration [18.664354303833022]
重み付き損失最小化に適用可能な任意の報酬モデルに適用可能な新しい探索戦略を提案する。
我々は、ガウス以南のマルチアーマーバンドにおけるMBEのインスタンス依存とインスタンス非依存の速度-最適後悔境界を証明した。
論文 参考訳(メタデータ) (2023-02-03T04:38:00Z) - Understanding the stochastic dynamics of sequential decision-making
processes: A path-integral analysis of multi-armed bandits [7.05949591248206]
マルチアームバンディットモデル(MAB)は、不確実な環境で意思決定を研究する最も一般的なモデルの一つである。
本稿では,MABモデルの解析に統計物理学の手法を用いる。
論文 参考訳(メタデータ) (2022-08-11T09:32:03Z) - Generalization of Neural Combinatorial Solvers Through the Lens of
Adversarial Robustness [68.97830259849086]
ほとんどのデータセットは単純なサブプロブレムのみをキャプチャし、おそらくは突発的な特徴に悩まされる。
本研究では, 局所的な一般化特性である対向ロバスト性について検討し, 厳密でモデル固有な例と突発的な特徴を明らかにする。
他のアプリケーションとは異なり、摂動モデルは知覚できないという主観的な概念に基づいて設計されているため、摂動モデルは効率的かつ健全である。
驚くべきことに、そのような摂動によって、十分に表現力のあるニューラルソルバは、教師あり学習で共通する正確さと悪質さのトレードオフの限界に悩まされない。
論文 参考訳(メタデータ) (2021-10-21T07:28:11Z) - Multivariate Deep Evidential Regression [77.34726150561087]
不確実性を認識するニューラルネットワークによる新しいアプローチは、従来の決定論的手法よりも有望である。
本稿では,レグレッションベースニューラルネットワークからアレータ性およびてんかん性不確かさを抽出する手法を提案する。
論文 参考訳(メタデータ) (2021-04-13T12:20:18Z) - Bayesian Uncertainty Estimation of Learned Variational MRI
Reconstruction [63.202627467245584]
我々は,モデル不連続な不確かさを定量化するベイズ変分フレームワークを提案する。
提案手法はMRIのアンダーサンプを用いた再建術の術後成績を示す。
論文 参考訳(メタデータ) (2021-02-12T18:08:14Z) - Online Model Selection: a Rested Bandit Formulation [49.69377391589057]
静止したバンディット設定における最善のアーム識別問題を紹介し,解析する。
我々は、この問題の後悔の新しい概念を定義し、ゲームの終わりに最小の期待損失を持つ腕を常に再生するポリシーと比較します。
最近のバンディット文献における既知のモデル選択の試みとは異なり、アルゴリズムは問題の特定の構造を利用して、予想される損失関数の未知のパラメータを学習する。
論文 参考訳(メタデータ) (2020-12-07T08:23:08Z) - NeuMiss networks: differentiable programming for supervised learning
with missing values [0.0]
線形性仮定の下で最適予測器の解析形式を導出する。
我々はNeuMissネットワークという新しい原則アーキテクチャを提案する。
パラメータの数と、欠落したデータパターンの数に依存しない計算複雑性の両方で、予測精度が良い。
論文 参考訳(メタデータ) (2020-07-03T11:42:25Z) - Thompson Sampling Algorithms for Mean-Variance Bandits [97.43678751629189]
我々は平均分散MABのためのトンプソンサンプリング型アルゴリズムを開発した。
我々はまた、ガウシアンとベルヌーイの盗賊に対する包括的後悔の分析も提供する。
我々のアルゴリズムは、全てのリスク許容度に対して既存のLCBベースのアルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2020-02-01T15:33:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。