論文の概要: Thompson sampling for zero-inflated count outcomes with an application
to the Drink Less mobile health study
- arxiv url: http://arxiv.org/abs/2311.14359v1
- Date: Fri, 24 Nov 2023 09:02:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-27 15:38:23.296358
- Title: Thompson sampling for zero-inflated count outcomes with an application
to the Drink Less mobile health study
- Title(参考訳): ゼロインフレーション計数結果のためのトンプソンサンプリングとDrink Less Mobile Health研究への応用
- Authors: Xueqing Liu, Nina Deliu, Tanujit Chakraborty, Lauren Bell, Bibhas
Chakraborty
- Abstract要約: モバイルヘルス(mHealth)技術は、ジャスト・イン・タイム・アダプティブ・イン・タイム(ジャスト・イン・タイム・アダプティブ・介入)を通じて近位部の結果を最適化することにより、臨床などの遠位部成績を改善することを目的としている。
コンテキストブレイディットは、個々の時間によって異なるコンテキストに応じて、そのような介入をカスタマイズするための適切なフレームワークを提供する。
しかしながら、バンディットフレームワーク内のカウント結果のモデリングのようなユニークな課題は、文脈的バンディットをmHealth研究に広く適用することを妨げている。
- 参考スコア(独自算出の注目度): 1.7097581131234332
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile health (mHealth) technologies aim to improve distal outcomes, such as
clinical conditions, by optimizing proximal outcomes through just-in-time
adaptive interventions. Contextual bandits provide a suitable framework for
customizing such interventions according to individual time-varying contexts,
intending to maximize cumulative proximal outcomes. However, unique challenges
such as modeling count outcomes within bandit frameworks have hindered the
widespread application of contextual bandits to mHealth studies. The current
work addresses this challenge by leveraging count data models into online
decision-making approaches. Specifically, we combine four common offline count
data models (Poisson, negative binomial, zero-inflated Poisson, and
zero-inflated negative binomial regressions) with Thompson sampling, a popular
contextual bandit algorithm. The proposed algorithms are motivated by and
evaluated on a real dataset from the Drink Less trial, where they are shown to
improve user engagement with the mHealth system. The proposed methods are
further evaluated on simulated data, achieving improvement in maximizing
cumulative proximal outcomes over existing algorithms. Theoretical results on
regret bounds are also derived. A user-friendly R package countts that
implements the proposed methods for assessing contextual bandit algorithms is
made publicly available at https://cran.r-project.org/web/packages/countts.
- Abstract(参考訳): モバイルヘルス(mhealth)技術は、just-in-timeadaptive interventions(ジャスト・イン・タイム・アダプティブ・インターベンション)を通じて近位部アウトカムを最適化することで、臨床状態などの遠位部アウトカムを改善することを目的としている。
コンテキストバンディットは、個々の時間変動コンテキストに応じてそのような介入をカスタマイズするための適切なフレームワークを提供する。
しかしながら、バンディットフレームワーク内のカウント結果のモデリングのようなユニークな課題は、文脈的バンディットをmHealth研究に広く適用することを妨げている。
現在の作業は、カウントデータモデルをオンライン意思決定アプローチに活用することで、この課題に対処している。
具体的には、一般的なオフラインカウントデータモデル(Poisson, negative binomial, zero-inflated Poisson, zero-inflated negative binomial regressions)と、一般的な文脈的バンディットアルゴリズムであるThompsonサンプリングを組み合わせた。
提案アルゴリズムは,mHealthシステムとのユーザエンゲージメントを改善するために,ドリンク・スリート・トライアルの実際のデータセットを用いて,モチベーションと評価を行う。
提案手法はシミュレーションデータ上でさらに評価され,既存のアルゴリズムよりも累積的近位結果の最大化が図られる。
後悔の限界に関する理論的結果も導かれる。
提案手法を実装したユーザフレンドリなRパッケージカウントをhttps://cran.r-project.org/web/packages/counttsで公開している。
関連論文リスト
- Deep Ensembles Meets Quantile Regression: Uncertainty-aware Imputation for Time Series [45.76310830281876]
量子回帰に基づくタスクネットワークのアンサンブルを用いて不確実性を推定する新しい手法であるQuantile Sub-Ensemblesを提案する。
提案手法は,高い損失率に頑健な高精度な計算法を生成するだけでなく,非生成モデルの高速な学習により,計算効率も向上する。
論文 参考訳(メタデータ) (2023-12-03T05:52:30Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - Policy Optimization for Personalized Interventions in Behavioral Health [8.10897203067601]
デジタルプラットフォームを通じて提供される行動的健康介入は、健康結果を大幅に改善する可能性がある。
患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討した。
患者システムの状態空間を個別のレベルに分解するDecompPIをダブする新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-21T21:42:03Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Estimating Optimal Infinite Horizon Dynamic Treatment Regimes via
pT-Learning [2.0625936401496237]
モバイルヘルス(mHealth)技術の最近の進歩は、個人の健康状態を監視し、ジャスト・イン・タイムのパーソナライズされた介入を提供する効果的な方法を提供する。
mHealthテクノロジーの実用化は、最適な動的治療体制を学習する上で、既存の方法論に固有の課題を提起する。
本稿では,決定論的とスパース政策モデルの間で適応的に調整された最適条件を推定する近時学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-20T18:38:22Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Post-Contextual-Bandit Inference [57.88785630755165]
コンテキストバンディットアルゴリズムは、電子商取引、医療、政策立案における非適応的なA/Bテストを置き換える傾向にある。
研究参加者の成果を改善することもでき、良い方針や最良の政策を特定できる可能性を高めることもできる。
研究の終盤における新規介入の信頼性推論を支援するため, 平均治療効果, サブグループ効果, あるいは新政策の価値について, 有効な信頼区間を構築したい。
論文 参考訳(メタデータ) (2021-06-01T12:01:51Z) - Doubly-Adaptive Thompson Sampling for Multi-Armed and Contextual Bandits [28.504921333436833]
本稿では,トンプソンサンプリングに基づくアルゴリズムの変種について,両腕の真の平均報酬に対する2倍頑健な推定器の項を適応的に再検討する。
提案アルゴリズムは, 半合成実験における最適(最小)後悔率とその経験的評価に適合する。
このアプローチは、適応データ収集とは別に、より多くのバイアス源が存在するコンテキスト的包帯に拡張する。
論文 参考訳(メタデータ) (2021-02-25T22:29:25Z) - Batched Neural Bandits [107.5072688105936]
BatchNeuralUCBはニューラルネットワークと楽観性を組み合わせ、探索と探索のトレードオフに対処する。
BatchNeuralUCBは、完全なシーケンシャルバージョンと同じ後悔を達成しつつ、ポリシー更新の数を大幅に減らしています。
論文 参考訳(メタデータ) (2021-02-25T17:36:44Z) - Slice Sampling for General Completely Random Measures [74.24975039689893]
本稿では, 後続推定のためのマルコフ連鎖モンテカルロアルゴリズムについて, 補助スライス変数を用いてトランケーションレベルを適応的に設定する。
提案アルゴリズムの有効性は、いくつかの一般的な非パラメトリックモデルで評価される。
論文 参考訳(メタデータ) (2020-06-24T17:53:53Z) - Online Batch Decision-Making with High-Dimensional Covariates [20.06690325969748]
そこで本稿では, テキストタユーザではなく, テキストタバッチと同時に対話するシーケンシャル意思決定のための新しいアルゴリズムのクラスを提案し, 検討する。
textitTeamwork LASSO Banditアルゴリズムは,意思決定プロセス全体において,ステージと利己的なステージを切り替えることで,探索探索ジレンマのバッチバージョンを解決します。
論文 参考訳(メタデータ) (2020-02-21T17:36:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。