論文の概要: Contextual Bandits with Budgeted Information Reveal
- arxiv url: http://arxiv.org/abs/2305.18511v1
- Date: Mon, 29 May 2023 16:18:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 19:55:55.200159
- Title: Contextual Bandits with Budgeted Information Reveal
- Title(参考訳): 予算情報公開を伴うコンテキスト帯域
- Authors: Kyra Gan, Esmaeil Keyvanshokooh, Xueqing Liu, Susan Murphy
- Abstract要約: コンテキストバンディットアルゴリズムは、パーソナライズされた治療を推奨するために、デジタルヘルスで一般的に使用される。
治療の有効性を確保するため、患者は直接の利益のない行動を取るよう要求されることが多い。
本稿では,この問題に対処するための新しい最適化と学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 3.363188654124328
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Contextual bandit algorithms are commonly used in digital health to recommend
personalized treatments. However, to ensure the effectiveness of the
treatments, patients are often requested to take actions that have no immediate
benefit to them, which we refer to as pro-treatment actions. In practice,
clinicians have a limited budget to encourage patients to take these actions
and collect additional information. We introduce a novel optimization and
learning algorithm to address this problem. This algorithm effectively combines
the strengths of two algorithmic approaches in a seamless manner, including 1)
an online primal-dual algorithm for deciding the optimal timing to reach out to
patients, and 2) a contextual bandit learning algorithm to deliver personalized
treatment to the patient. We prove that this algorithm admits a sub-linear
regret bound. We illustrate the usefulness of this algorithm on both synthetic
and real-world data.
- Abstract(参考訳): コンテキストバンディットアルゴリズムは、パーソナライズされた治療を推奨するために一般的にデジタルヘルスで使用される。
しかし、治療の有効性を確保するために、患者は直接の利益のない行動を取るよう要求されることがしばしばあり、これは前処置行動(pro-treatment action)と呼ばれる。
実際には、臨床医は患者にこれらの行動を奨励し、追加情報を集めるための予算が限られている。
本稿では,この問題に対処するための新しい最適化と学習アルゴリズムを提案する。
このアルゴリズムは、シームレスな方法で2つのアルゴリズムアプローチの強みを効果的に結合する。
1)患者にリーチする最適なタイミングを決定するオンラインプライマル・デュアルアルゴリズム,および
2)患者にパーソナライズされた治療を提供するコンテキストバンディット学習アルゴリズム。
我々は、このアルゴリズムがサブ線形後悔境界を認めることを証明した。
本アルゴリズムは,合成データと実世界のデータの両方において有用であることを示す。
関連論文リスト
- Monitoring Fidelity of Online Reinforcement Learning Algorithms in Clinical Trials [20.944037982124037]
本稿では,オンラインRLアルゴリズムを臨床試験に導入するための重要な要件として,アルゴリズムの忠実性を提案する。
我々は,アルゴリズム開発者や臨床研究者がアルゴリズムの忠実性を確保するのに役立つ,事前デプロイ計画とリアルタイムモニタリングのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-26T20:19:14Z) - Biomimicry in Radiation Therapy: Optimizing Patient Scheduling for Improved Treatment Outcomes [0.0]
本研究は,放射線治療領域(RT)におけるバイオミミクリー原則の統合と,患者スケジューリングの最適化について考察する。
複雑なオンラインスケジューリング問題に対処するため、3つのバイオインスパイアされたアルゴリズムが最適化に使用される。
本研究は,RTの患者スケジューリングの最適化に応用されたバイオインスパイアされたアルゴリズムの有効性を明らかにするものである。
論文 参考訳(メタデータ) (2024-01-16T15:37:23Z) - Clinical Validation of Single-Chamber Model-Based Algorithms Used to
Estimate Respiratory Compliance [2.9511531830032083]
人工肺のオープンで臨床的に検証されたデータセットを構築し,18名の挿管患者から約4万回の呼吸を行った。
次に,呼吸コンプライアンスを推定する「単一室」モデルを用いた15種類のアルゴリズムの評価を行った。
特に,4種類の患者換気器の非同期性に基づくアルゴリズムの性能について検討する。
論文 参考訳(メタデータ) (2021-09-19T07:34:15Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - Deep Algorithm Unrolling for Biomedical Imaging [99.73317152134028]
本章では,アルゴリズムのアンロールによるバイオメディカル応用とブレークスルーについて概説する。
我々はアルゴリズムのアンローリングの起源を辿り、反復アルゴリズムをディープネットワークにアンローリングする方法に関する包括的なチュートリアルを提供する。
オープンな課題を議論し、今後の研究方向性を提案することで、この章を締めくくります。
論文 参考訳(メタデータ) (2021-08-15T01:06:26Z) - An Asymptotically Optimal Primal-Dual Incremental Algorithm for
Contextual Linear Bandits [129.1029690825929]
複数の次元に沿った最先端技術を改善する新しいアルゴリズムを提案する。
非文脈線形帯域の特別な場合において、学習地平線に対して最小限の最適性を確立する。
論文 参考訳(メタデータ) (2020-10-23T09:12:47Z) - A black-box adversarial attack for poisoning clustering [78.19784577498031]
本稿では,クラスタリングアルゴリズムのロバスト性をテストするために,ブラックボックス対逆攻撃法を提案する。
我々の攻撃は、SVM、ランダムフォレスト、ニューラルネットワークなどの教師付きアルゴリズムに対しても転送可能であることを示す。
論文 参考訳(メタデータ) (2020-09-09T18:19:31Z) - New Oracle-Efficient Algorithms for Private Synthetic Data Release [52.33506193761153]
微分プライベートな合成データを構築するための3つの新しいアルゴリズムを提案する。
アルゴリズムは最悪の場合でも差分プライバシーを満たす。
現状の手法である高次元行列機構 citeMcKennaMHM18 と比較すると,我々のアルゴリズムは大規模作業負荷の精度が向上する。
論文 参考訳(メタデータ) (2020-07-10T15:46:05Z) - Run2Survive: A Decision-theoretic Approach to Algorithm Selection based
on Survival Analysis [75.64261155172856]
生存分析(SA)は、自然に検閲されたデータをサポートし、アルゴリズムランタイムの分散モデルを学習するためにそのようなデータを使用する適切な方法を提供する。
我々は、アルゴリズム選択に対する洗練された決定論的アプローチの基礎として、そのようなモデルを活用し、Run2Surviveを疑う。
標準ベンチマークASlibによる広範な実験では、我々のアプローチは競争力が高く、多くの場合、最先端のASアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-07-06T15:20:17Z) - Delay-Adaptive Learning in Generalized Linear Contextual Bandits [18.68458152442088]
遅延設定に適応した2つのよく知られたアルゴリズムの性能について検討する。
本稿では,この2つのアルゴリズムを遅延処理に適応させる方法について述べる。
この結果は,文脈的盗賊文学の広範な景観に寄与する。
論文 参考訳(メタデータ) (2020-03-11T09:12:44Z) - Boosting Algorithms for Estimating Optimal Individualized Treatment
Rules [4.898659895355356]
最適な個別化処理規則を推定するための非パラメトリックアルゴリズムを提案する。
提案アルゴリズムは機械学習文学において最も強力なアルゴリズムの1つであるXGBoostアルゴリズムに基づいている。
論文 参考訳(メタデータ) (2020-01-31T22:26:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。