論文の概要: Functional Sequential Treatment Allocation with Covariates
- arxiv url: http://arxiv.org/abs/2001.10996v1
- Date: Wed, 29 Jan 2020 18:08:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 21:13:44.982716
- Title: Functional Sequential Treatment Allocation with Covariates
- Title(参考訳): 共変量を用いた機能的シーケンス処理
- Authors: Anders Bredahl Kock, David Preinerstorfer, Bezirgen Veliyev
- Abstract要約: 意思決定者は、条件付きポテンシャル結果分布の一般関数を最大化する処理を目標とする。
提案手法は,この問題に対して期待される最小限の最小限の最適割当ポリシーを構築した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a multi-armed bandit problem with covariates. Given a realization
of the covariate vector, instead of targeting the treatment with highest
conditional expectation, the decision maker targets the treatment which
maximizes a general functional of the conditional potential outcome
distribution, e.g., a conditional quantile, trimmed mean, or a socio-economic
functional such as an inequality, welfare or poverty measure. We develop
expected regret lower bounds for this problem, and construct a near minimax
optimal assignment policy.
- Abstract(参考訳): 共変量に対する多重武装バンディット問題を考える。
共変量ベクトルの実現が与えられたとき、最も条件付き期待値の高い治療を標的にするのではなく、意思決定者は条件付きポテンシャル結果分布の一般機能、例えば条件付き量子量、トリミング平均、または不平等、福祉、貧困尺度のような社会経済的機能を最大化する治療を目標とする。
我々は,この問題に期待できる限界を低く抑え,ミニマックスに近い最適割当方針を構築する。
関連論文リスト
- Probabilistic Conformal Prediction with Approximate Conditional Validity [81.30551968980143]
本研究では,共形手法の柔軟性と条件分布の推定を組み合わせ,予測セットを生成する手法を開発した。
我々の手法は、条件付きカバレッジの観点から既存の手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2024-07-01T20:44:48Z) - Taking a Moment for Distributional Robustness [19.49177818405511]
我々は、敵の違反違反として知られるものに基づいて、新しいmin-max目標を導入する。
正方形損失の場合、最悪のケースの後悔を最小限に抑えることは、真の条件付き期待値に対する最悪のケースの$ell$-distanceを最小化するのと同等であることを示す。
論文 参考訳(メタデータ) (2024-05-08T23:37:25Z) - Constrained Pure Exploration Multi-Armed Bandits with a Fixed Budget [4.226118870861363]
固定予算の下で、制約のある純粋な探索、多武装バンディットの定式化を検討する。
本稿では,Successive Rejects フレームワークに基づく textscConstrained-SR というアルゴリズムを提案する。
また, ある特別な場合において, 関連する崩壊速度は情報理論的下界に対してほぼ最適であることを示した。
論文 参考訳(メタデータ) (2022-11-27T08:58:16Z) - Algorithm for Constrained Markov Decision Process with Linear
Convergence [55.41644538483948]
エージェントは、そのコストに対する複数の制約により、期待される累積割引報酬を最大化することを目的としている。
エントロピー正規化ポリシーとベイダの二重化という2つの要素を統合した新しい双対アプローチが提案されている。
提案手法は(線形速度で)大域的最適値に収束することが示されている。
論文 参考訳(メタデータ) (2022-06-03T16:26:38Z) - A Quantum Optimal Control Problem with State Constrained Preserving
Coherence [68.8204255655161]
非単体脱コヒーレンスチャネルを特徴とするマルコフ脱コヒーレンスを受ける3レベル$Lambda$型原子を考える。
我々は、デコヒーレンスレベルが予め定義された境界内にある状態制約で量子最適制御問題を定式化する。
論文 参考訳(メタデータ) (2022-03-24T21:31:34Z) - A Globally Convergent Evolutionary Strategy for Stochastic Constrained
Optimization with Applications to Reinforcement Learning [0.6445605125467573]
進化的戦略は、強化学習における複雑な最適化問題に対して、競合する性能のレベルを達成することが示されている。
しかし、制約された問題を最適化する進化戦略の収束保証は文献に欠けている。
論文 参考訳(メタデータ) (2022-02-21T17:04:51Z) - Optimal variance-reduced stochastic approximation in Banach spaces [114.8734960258221]
可分バナッハ空間上で定義された収縮作用素の定点を推定する問題について検討する。
演算子欠陥と推定誤差の両方に対して漸近的でない境界を確立する。
論文 参考訳(メタデータ) (2022-01-21T02:46:57Z) - On Lower Bounds for Standard and Robust Gaussian Process Bandit
Optimization [55.937424268654645]
有界ノルムを持つ関数のブラックボックス最適化問題に対するアルゴリズム非依存な下界を考える。
本稿では, 単純さ, 汎用性, エラー確率への依存性の向上など, 後悔の下位境界を導出するための新しい証明手法を提案する。
論文 参考訳(メタデータ) (2020-08-20T03:48:14Z) - Treatment recommendation with distributional targets [0.0]
実験に基づいて最善を尽くさなければならない意思決定者の課題を考察する。
治療勧告から得られる結果分布の所望性を機能分布特性を用いて測定する。
我々は2つの(近く)最適後悔政策を提案する。
論文 参考訳(メタデータ) (2020-05-19T19:27:21Z) - Distributionally Robust Bayesian Quadrature Optimization [60.383252534861136]
確率分布が未知な分布の不確実性の下でBQOについて検討する。
標準的なBQOアプローチは、固定されたサンプル集合が与えられたときの真の期待目標のモンテカルロ推定を最大化する。
この目的のために,新しい後方サンプリングに基づくアルゴリズム,すなわち分布的に堅牢なBQO(DRBQO)を提案する。
論文 参考訳(メタデータ) (2020-01-19T12:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。