論文の概要: Online Batch Decision-Making with High-Dimensional Covariates
- arxiv url: http://arxiv.org/abs/2002.09438v2
- Date: Thu, 27 Feb 2020 20:43:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 00:42:27.193877
- Title: Online Batch Decision-Making with High-Dimensional Covariates
- Title(参考訳): 高次元共変量を用いたオンラインバッチ決定処理
- Authors: Chi-Hua Wang, Guang Cheng
- Abstract要約: そこで本稿では, テキストタユーザではなく, テキストタバッチと同時に対話するシーケンシャル意思決定のための新しいアルゴリズムのクラスを提案し, 検討する。
textitTeamwork LASSO Banditアルゴリズムは,意思決定プロセス全体において,ステージと利己的なステージを切り替えることで,探索探索ジレンマのバッチバージョンを解決します。
- 参考スコア(独自算出の注目度): 20.06690325969748
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose and investigate a class of new algorithms for sequential decision
making that interacts with \textit{a batch of users} simultaneously instead of
\textit{a user} at each decision epoch. This type of batch models is motivated
by interactive marketing and clinical trial, where a group of people are
treated simultaneously and the outcomes of the whole group are collected before
the next stage of decision. In such a scenario, our goal is to allocate a batch
of treatments to maximize treatment efficacy based on observed high-dimensional
user covariates. We deliver a solution, named \textit{Teamwork LASSO Bandit
algorithm}, that resolves a batch version of explore-exploit dilemma via
switching between teamwork stage and selfish stage during the whole decision
process. This is made possible based on statistical properties of LASSO
estimate of treatment efficacy that adapts to a sequence of batch observations.
In general, a rate of optimal allocation condition is proposed to delineate the
exploration and exploitation trade-off on the data collection scheme, which is
sufficient for LASSO to identify the optimal treatment for observed user
covariates. An upper bound on expected cumulative regret of the proposed
algorithm is provided.
- Abstract(参考訳): 我々は,各決定期において, \textit{a batch of users} の代わりに同時に \textit{a batch of users} と対話する逐次的意思決定のための新しいアルゴリズムのクラスを提案し,検討する。
このタイプのバッチモデルは、対話型マーケティングと臨床試験によって動機付けられ、集団が同時に扱われ、集団全体の成果が決定の次の段階で収集される。
このようなシナリオでは、観察された高次元ユーザ共変量に基づいて治療効果を最大化するために、治療のバッチを割り当てることが目的である。
我々は,チームワークステージと利己的なステージを切り替えることで,探索探索ジレンマのバッチバージョンを解消する,‘textit{Teamwork LASSO Bandit algorithm’というソリューションを提供する。
これは、一連のバッチ観測に適応する治療効果のLASSO推定の統計的特性に基づいて可能である。
一般に、データ収集方式における探索と搾取のトレードオフを明らかにするために最適な割り当て条件の比率が提案され、LASSOが観測されたユーザ共変量に対する最適な処理を識別するのに十分である。
提案アルゴリズムに期待される累積後悔の上限を与える。
関連論文リスト
- Optimizing Treatment Allocation in the Presence of Interference [6.404584255185188]
影響最大化(IM)では、治療対象のネットワーク内の最適なエンティティセットを選択することが目的である。
昇降モデリング(UM)では、エンティティは推定処理効果に応じてランク付けされ、上位エンティティは処理を割り当てる。
本稿では,ネットワーク設定における治療効果を予測するために因果推定器を訓練し,従来のIMアルゴリズムに統合する方法について述べる。
論文 参考訳(メタデータ) (2024-09-30T15:48:22Z) - Training Greedy Policy for Proposal Batch Selection in Expensive Multi-Objective Combinatorial Optimization [52.80408805368928]
本稿では,バッチ取得のための新しいグリーディ型サブセット選択アルゴリズムを提案する。
赤蛍光タンパク質に関する実験により,提案手法は1.69倍少ないクエリでベースライン性能を達成できることが判明した。
論文 参考訳(メタデータ) (2024-06-21T05:57:08Z) - A new fuzzy multi-attribute group decision-making method based on TOPSIS
and optimization models [3.697049647195136]
区間値の直観的ファジィ集合における多属性群決定のための新しい手法を提案する。
全ての専門家の個人評価と全体整合性評価の差の和を最小化することにより、専門家の体重を決定するための新しい最適化モデルが確立される。
完全ファジィ多属性群決定アルゴリズムが定式化され、主観的および客観的重み付け法の利点を最大限に活用することができる。
論文 参考訳(メタデータ) (2023-11-27T15:41:30Z) - Thompson sampling for zero-inflated count outcomes with an application to the Drink Less mobile health study [1.5936659933030128]
モバイルヘルス介入は、ジャスト・イン・タイム・アダプティブ・イン・タイム・イン・アダプティブ・介入によって近位結果の最適化によって、臨床症状などの遠位結果を改善することを目的としている。
コンテキストブレイディットは、個々の時間によって異なるコンテキストに応じて、そのような介入をカスタマイズするための適切なフレームワークを提供する。
現在の作業では、カウントデータモデルをオンライン意思決定アプローチに活用することで、この問題に対処している。
論文 参考訳(メタデータ) (2023-11-24T09:02:24Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - TCFimt: Temporal Counterfactual Forecasting from Individual Multiple
Treatment Perspective [50.675845725806724]
個別多面的治療の観点からの時間的対実予測の包括的枠組み(TCFimt)を提案する。
TCFimtは、選択と時間変化バイアスを軽減するためにSeq2seqフレームワークの逆タスクを構築し、比較学習ベースのブロックを設計し、混合処理効果を分離した主治療効果と因果相互作用に分解する。
提案手法は, 特定の治療法による今後の結果予測と, 最先端手法よりも最適な治療タイプとタイミングを選択する上で, 良好な性能を示す。
論文 参考訳(メタデータ) (2022-12-17T15:01:05Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Multicriteria Group Decision-Making Under Uncertainty Using Interval
Data and Cloud Models [0.0]
本稿では,データを間隔として収集する不確実性の下で,MCGDM(Multicriteria group decision making)アルゴリズムを提案する。
提案したMCGDMアルゴリズムは、データを集約し、基準の最適な重みを決定し、さらに入力を行わずに代替品をランク付けする。
提案アルゴリズムは,サイバーセキュリティ問題のケーススタディに実装され,その実現可能性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-01T06:34:48Z) - Stochastic Optimization Forests [60.523606291705214]
標準的なランダムな森林アルゴリズムのように予測精度を向上させるために分割するのではなく、分割を選択した木を栽培し、下流の意思決定品質を直接最適化することで、森林決定政策の訓練方法を示す。
概略分割基準は、各候補分割に対して正確に最適化された森林アルゴリズムに近い性能を保ちながら、100倍のランニング時間を短縮できることを示す。
論文 参考訳(メタデータ) (2020-08-17T16:56:06Z) - Robust Grouped Variable Selection Using Distributionally Robust
Optimization [11.383869751239166]
摂動下での群付き変数選択のための不確実性セットを用いた分布ロバスト最適化(DRO)の定式化を提案する。
我々は,サンプル外損失と推定バイアスの確率的境界を証明し,推定器の群化効果を確立する。
我々の定式化は,群レベルでの空間性を促進する解釈可能で同相なモデルを生成することを示す。
論文 参考訳(メタデータ) (2020-06-10T22:32:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。