論文の概要: Reliable Off-Policy Learning for Dosage Combinations
- arxiv url: http://arxiv.org/abs/2305.19742v1
- Date: Wed, 31 May 2023 11:08:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 17:11:10.613327
- Title: Reliable Off-Policy Learning for Dosage Combinations
- Title(参考訳): 投薬組み合わせのための信頼性のあるオフポリシー学習
- Authors: Jonas Schweisthal, Dennis Frauen, Valentyn Melnychuk, Stefan
Feuerriegel
- Abstract要約: パーソナライズド医療における意思決定は、しばしば服薬の組み合わせを選択する必要がある。
ドセージ・コンビネーションのための信頼性の高いオフ・ポリティクス学習手法を提案する。
- 参考スコア(独自算出の注目度): 16.58511429995231
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decision-making in personalized medicine such as cancer therapy or critical
care must often make choices for dosage combinations, i.e., multiple continuous
treatments. Existing work for this task has modeled the effect of multiple
treatments independently, while estimating the joint effect has received little
attention but comes with non-trivial challenges. In this paper, we propose a
novel method for reliable off-policy learning for dosage combinations. Our
method proceeds along three steps: (1) We develop a tailored neural network
that estimates the individualized dose-response function while accounting for
the joint effect of multiple dependent dosages. (2) We estimate the generalized
propensity score using conditional normalizing flows in order to detect regions
with limited overlap in the shared covariate-treatment space. (3) We present a
gradient-based learning algorithm to find the optimal, individualized dosage
combinations. Here, we ensure reliable estimation of the policy value by
avoiding regions with limited overlap. We finally perform an extensive
evaluation of our method to show its effectiveness. To the best of our
knowledge, ours is the first work to provide a method for reliable off-policy
learning for optimal dosage combinations.
- Abstract(参考訳): がん治療や重篤な治療などのパーソナライズド医療における意思決定は、しばしば服用の組み合わせ、すなわち複数の継続的治療を選択する必要がある。
既存の作業は、個別に複数の治療の効果をモデル化し、共同効果を推定することはほとんど注目されていないが、非自明な課題が伴っている。
本稿では, 投薬の組み合わせに対する信頼性の高いオフポリシー学習法を提案する。
提案手法は3つのステップに沿って進行する: 1) 複数の依存量による連関効果を考慮しつつ、個別化された線量応答関数を推定するニューラルネットワークを開発する。
2) 共変量処理空間の重複が限定された領域を検出するために, 条件付き正規化フローを用いた一般化確率スコアを推定する。
(3)最適な個別化量の組み合わせを見つけるための勾配に基づく学習アルゴリズムを提案する。
ここでは,重複の少ない地域を避けて,政策価値の信頼性の高い推定を行う。
最終的に,本手法の有効性を示すため,広範囲な評価を行った。
我々の知識を最大限に活用するため、我々の研究は最適な投与量の組合せのための信頼できるオフポリシー学習の方法を提供する最初の研究である。
関連論文リスト
- Individualized Multi-Treatment Response Curves Estimation using RBF-net with Shared Neurons [1.1119247609126184]
反応曲線の非パラメトリックモデリングは、共有された隠れニューロンを持つ放射基底関数(RBF)-ネットに依存している。
本手法をMIMICデータに適用し, 在宅中絶患者に対するICU滞在時間と12時間SOFAスコアに対する異なる治療方法の効果に関する興味深い知見を得た。
論文 参考訳(メタデータ) (2024-01-29T21:13:01Z) - The Blessings of Multiple Treatments and Outcomes in Treatment Effect
Estimation [53.81860494566915]
既存の研究では、プロキシ変数や複数の処理を利用してバイアスを補正している。
多くの実世界のシナリオでは、複数の結果に対する影響を研究することにより大きな関心がある。
この設定に関わる複数の結果の並列研究は、因果同定において互いに助け合うことが示されている。
論文 参考訳(メタデータ) (2023-09-29T14:33:48Z) - A Flexible Framework for Incorporating Patient Preferences Into
Q-Learning [1.2891210250935146]
現実の医療問題では、治療効果や副作用の重症度など、多くの競合する結果がしばしば存在する。
動的治療体制(DTR)を推定するための統計的手法は、通常、単一の関心の結果を仮定する。
これには、単一時点の制限と2つの結果、自己報告された患者の嗜好を組み込むことができないこと、理論的な保証が制限されていることが含まれる。
論文 参考訳(メタデータ) (2023-07-22T08:58:07Z) - TCFimt: Temporal Counterfactual Forecasting from Individual Multiple
Treatment Perspective [50.675845725806724]
個別多面的治療の観点からの時間的対実予測の包括的枠組み(TCFimt)を提案する。
TCFimtは、選択と時間変化バイアスを軽減するためにSeq2seqフレームワークの逆タスクを構築し、比較学習ベースのブロックを設計し、混合処理効果を分離した主治療効果と因果相互作用に分解する。
提案手法は, 特定の治療法による今後の結果予測と, 最先端手法よりも最適な治療タイプとタイミングを選択する上で, 良好な性能を示す。
論文 参考訳(メタデータ) (2022-12-17T15:01:05Z) - Policy Learning for Optimal Individualized Dose Intervals [3.9801611649762263]
このような政策を推定する新しい手法を提案する。
推定された政策は一貫しており、そのリスクはルートnレートで最良クラスの政策に収束する。
論文 参考訳(メタデータ) (2022-02-24T17:59:20Z) - SurvITE: Learning Heterogeneous Treatment Effects from Time-to-Event
Data [83.50281440043241]
時系列データから不均一な処理効果を推定する問題について検討する。
本稿では,バランス表現に基づく治療特異的ハザード推定のための新しいディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2021-10-26T20:13:17Z) - On Inductive Biases for Heterogeneous Treatment Effect Estimation [91.3755431537592]
我々は、異なる治療下で、個人の潜在的成果(PO)の構造的類似性を利用する方法について検討する。
この問題を克服するために、エンドツーエンドの学習戦略を3つ比較する。
論文 参考訳(メタデータ) (2021-06-07T16:30:46Z) - Kernel Assisted Learning for Personalized Dose Finding [20.52632915107782]
個別化線量規則は、患者レベル情報に基づいて、連続した安全な線量範囲内の線量レベルを推奨する。
本稿では,最適な個別化線量規則を推定するためのカーネル支援学習法を提案する。
論文 参考訳(メタデータ) (2020-07-19T23:03:26Z) - Learning for Dose Allocation in Adaptive Clinical Trials with Safety
Constraints [84.09488581365484]
新しい化合物の有効性と毒性の関係がより複雑になるにつれて、第1相線量測定試験はますます困難になっている。
最も一般的に使われている方法は、毒性事象のみから学習することで、最大許容量(MTD)を特定することである。
本稿では, 毒性安全性の制約を高い確率で満たしつつ, 累積効果を最大化することを目的とした, 適応型臨床試験手法を提案する。
論文 参考訳(メタデータ) (2020-06-09T03:06:45Z) - Treatment Policy Learning in Multiobjective Settings with Fully Observed
Outcomes [6.944742823560999]
個別化された治療方針を学習するための3つのアプローチを提示し、比較し、評価する。
我々は,全てのアプローチが臨床医よりも厳格に優れた成績を得られる政策を学習していることを示す。
論文 参考訳(メタデータ) (2020-06-01T13:22:51Z) - Almost-Matching-Exactly for Treatment Effect Estimation under Network
Interference [73.23326654892963]
本研究では,観測ネットワーク上でユニットが接続されたランダム化実験から直接処理効果を回復するマッチング手法を提案する。
本手法は, 近傍グラフ内の一意部分グラフの個数にほぼ一致する。
論文 参考訳(メタデータ) (2020-03-02T15:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。