論文の概要: A Flexible Framework for Incorporating Patient Preferences Into
Q-Learning
- arxiv url: http://arxiv.org/abs/2307.12022v1
- Date: Sat, 22 Jul 2023 08:58:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-25 18:18:00.610023
- Title: A Flexible Framework for Incorporating Patient Preferences Into
Q-Learning
- Title(参考訳): 患者選好をQ-Learningに組み込むフレキシブルなフレームワーク
- Authors: Joshua P. Zitovsky, Leslie Wilson and Michael R. Kosorok
- Abstract要約: 現実の医療問題では、治療効果や副作用の重症度など、多くの競合する結果がしばしば存在する。
動的治療体制(DTR)を推定するための統計的手法は、通常、単一の関心の結果を仮定する。
これには、単一時点の制限と2つの結果、自己報告された患者の嗜好を組み込むことができないこと、理論的な保証が制限されていることが含まれる。
- 参考スコア(独自算出の注目度): 1.2891210250935146
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In real-world healthcare problems, there are often multiple competing
outcomes of interest, such as treatment efficacy and side effect severity.
However, statistical methods for estimating dynamic treatment regimes (DTRs)
usually assume a single outcome of interest, and the few methods that deal with
composite outcomes suffer from important limitations. This includes
restrictions to a single time point and two outcomes, the inability to
incorporate self-reported patient preferences and limited theoretical
guarantees. To this end, we propose a new method to address these limitations,
which we dub Latent Utility Q-Learning (LUQ-Learning). LUQ-Learning uses a
latent model approach to naturally extend Q-learning to the composite outcome
setting and adopt the ideal trade-off between outcomes to each patient. Unlike
previous approaches, our framework allows for an arbitrary number of time
points and outcomes, incorporates stated preferences and achieves strong
asymptotic performance with realistic assumptions on the data. We conduct
simulation experiments based on an ongoing trial for low back pain as well as a
well-known completed trial for schizophrenia. In all experiments, our method
achieves highly competitive empirical performance compared to several
alternative baselines.
- Abstract(参考訳): 現実の医療問題では、治療効果や副作用の重症度など、多くの競合する結果がしばしば存在する。
しかしながら、動的治療体制(DTR)を推定するための統計的手法は、通常、単一の関心の結果を仮定し、複合的な結果を扱う数少ない手法は重要な制約に悩まされる。
これには、単一の時点と2つの結果への制限、自己報告された患者の好みを組み込むことができないこと、理論的保証の制限が含まれる。
そこで本稿では,Latent Utility Q-Learning (LUQ-Learning) を用いて,これらの制約に対処する新しい手法を提案する。
LUQ-Learningは、Q学習を複合的な結果設定に自然に拡張し、各患者に対する結果間の理想的なトレードオフを採用するために、潜在モデルアプローチを使用する。
従来のアプローチとは異なり、我々のフレームワークは任意の回数の時間ポイントと結果を可能にし、記述された好みを取り入れ、データに対する現実的な仮定で強い漸近的なパフォーマンスを達成する。
低腰痛に対する臨床試験と統合失調症に対するよく知られた完全治験に基づくシミュレーション実験を行った。
全ての実験において,本手法はいくつかの代替ベースラインと比較して高い競争力を持つ経験的性能を達成する。
関連論文リスト
- Stage-Aware Learning for Dynamic Treatments [3.6923632650826486]
動的治療体制のための新しい個別化学習法を提案する。
観測軌道が最適処理と完全に一致しなければならないという制約を緩和することにより,本手法はIPWE法における試料効率と安定性を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-30T06:35:31Z) - Reliable Off-Policy Learning for Dosage Combinations [27.385663284378854]
パーソナライズド医療における意思決定は、しばしば服薬の組み合わせを選択する必要がある。
ドセージ・コンビネーションのための信頼性の高いオフ・ポリティクス学習手法を提案する。
論文 参考訳(メタデータ) (2023-05-31T11:08:43Z) - Causal Inference under Data Restrictions [0.0]
この論文は、不確実性とデータ制限の下での現代の因果推論に焦点を当てている。
これには、ネオアジュバント臨床試験、分散データネットワーク、堅牢な個別化意思決定へのアプリケーションが含まれる。
論文 参考訳(メタデータ) (2023-01-20T20:14:32Z) - TCFimt: Temporal Counterfactual Forecasting from Individual Multiple
Treatment Perspective [50.675845725806724]
個別多面的治療の観点からの時間的対実予測の包括的枠組み(TCFimt)を提案する。
TCFimtは、選択と時間変化バイアスを軽減するためにSeq2seqフレームワークの逆タスクを構築し、比較学習ベースのブロックを設計し、混合処理効果を分離した主治療効果と因果相互作用に分解する。
提案手法は, 特定の治療法による今後の結果予測と, 最先端手法よりも最適な治療タイプとタイミングを選択する上で, 良好な性能を示す。
論文 参考訳(メタデータ) (2022-12-17T15:01:05Z) - Robust and Agnostic Learning of Conditional Distributional Treatment
Effects [62.44901952244514]
条件平均治療効果(CATE)は、個々の因果効果の最適点予測である。
集約分析では、通常は分布処理効果(DTE)の測定によって対処される。
我々は,多種多様な問題に対して条件付きDTE(CDTE)を学習するための,新しい堅牢でモデルに依存しない手法を提供する。
論文 参考訳(メタデータ) (2022-05-23T17:40:31Z) - Disentangled Counterfactual Recurrent Networks for Treatment Effect
Inference over Time [71.30985926640659]
本稿では,DCRN(Disentangled Counterfactual Recurrent Network)を提案する。
時間とともに治療効果の因果構造に完全にインスパイアされたアーキテクチャでは、予測精度と疾患理解が向上する。
実データとシミュレーションデータの両方において,DCRNが処理応答予測の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-12-07T16:40:28Z) - SurvITE: Learning Heterogeneous Treatment Effects from Time-to-Event
Data [83.50281440043241]
時系列データから不均一な処理効果を推定する問題について検討する。
本稿では,バランス表現に基づく治療特異的ハザード推定のための新しいディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2021-10-26T20:13:17Z) - Stochastic Intervention for Causal Inference via Reinforcement Learning [7.015556609676951]
因果推論の中心は介入戦略の処理効果推定である。
既存の方法はほとんどが決定論的治療に限られており、異なる治療下での結果を比較する。
介入に対する治療効果を推定するための新しい効果的な枠組みを提案する。
論文 参考訳(メタデータ) (2021-05-28T00:11:22Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - Generalization Bounds and Representation Learning for Estimation of
Potential Outcomes and Causal Effects [61.03579766573421]
代替薬に対する患者一人の反応など,個人レベルの因果効果の推定について検討した。
我々は,表現の誘導的処理群距離を正規化することにより,境界を最小化する表現学習アルゴリズムを考案した。
これらのアルゴリズムを拡張して、重み付き表現を同時に学習し、治療群距離をさらに削減する。
論文 参考訳(メタデータ) (2020-01-21T10:16:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。