論文の概要: A Flexible Framework for Incorporating Patient Preferences Into Q-Learning
- arxiv url: http://arxiv.org/abs/2307.12022v2
- Date: Tue, 02 Sep 2025 12:15:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:02.86461
- Title: A Flexible Framework for Incorporating Patient Preferences Into Q-Learning
- Title(参考訳): 患者選好をQ-Learningに組み込むフレキシブルなフレームワーク
- Authors: Joshua P. Zitovsky, Yating Zou, Leslie Wilson, Michael R. Kosorok,
- Abstract要約: 上記の課題に対処するために,Q-ラーニングに適応する潜在モデルアプローチを提案する。
低腰痛に対する臨床試験および統合失調症に対するよく知られた臨床試験に基づいてシミュレーション実験を行った。
LUQ-Learningは、代替ベースラインに比べて高い競争性能を達成する。
- 参考スコア(独自算出の注目度): 1.2999518604217852
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In real-world healthcare settings, treatment decisions often involve optimizing for multivariate outcomes such as treatment efficacy and severity of side effects based on individual preferences. However, existing statistical methods for estimating dynamic treatment regimes (DTRs) usually assume a univariate outcome, and the few methods that deal with composite outcomes suffer from limitations such as restrictions to a single time point and limited theoretical guarantees. To address these limitations, we propose Latent Utility Q-Learning (LUQ-Learning), a latent model approach that adapts Q-learning to tackle the aforementioned difficulties. Our framework allows for an arbitrary finite number of decision points and outcomes, incorporates personal preferences, and achieves asymptotic performance guarantees with realistic assumptions. We conduct simulation experiments based on an ongoing trial for low back pain as well as a well-known trial for schizophrenia. In both settings, LUQ-Learning achieves highly competitive performance compared to alternative baselines.
- Abstract(参考訳): 現実世界の医療環境では、治療の判断は、治療効果や個人の嗜好に基づく副作用の重症度といった多変量の結果を最適化することを伴うことが多い。
しかしながら、動的治療体制(DTR)を推定するための既存の統計手法は、通常、単変量の結果を仮定するものであり、複合的な結果を扱う数少ない方法は、単一時点への制限や限定的な理論的保証といった制限に悩まされている。
これらの制約に対処するために、上記の困難に対処するためにQラーニングを適用する潜在モデルアプローチであるLatent Utility Q-Learning(LUQ-Learning)を提案する。
我々のフレームワークは、任意の数の意思決定ポイントと結果を可能にし、個人の好みを取り入れ、現実的な仮定で漸近的なパフォーマンス保証を実現する。
低腰痛に対する臨床試験および統合失調症に対するよく知られた臨床試験に基づいてシミュレーション実験を行った。
どちらの設定でも、LUQ-Learningは代替ベースラインに比べて高い競争性能を達成する。
関連論文リスト
- Individualised Treatment Effects Estimation with Composite Treatments and Composite Outcomes [13.925793826373706]
個別治療効果(ITE)の推定は因果推論の基本的な問題である。
ITE推定のための因果機械学習におけるこれまでの作業は、単一の処理や単一の結果など、単純な設定に限られていた。
本稿では, 複合処理および複合処理によるITT推定を解くために, emphH-Learner と呼ばれる, 斬新で革新的なハイパーネットワークベースの手法を提案する。
論文 参考訳(メタデータ) (2025-02-12T10:41:21Z) - Stage-Aware Learning for Dynamic Treatments [3.6923632650826486]
動的治療体制のための新しい個別化学習法を提案する。
観測軌道が最適処理と完全に一致しなければならないという制約を緩和することにより,本手法はIPWE法における試料効率と安定性を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-30T06:35:31Z) - Reliable Off-Policy Learning for Dosage Combinations [27.385663284378854]
パーソナライズド医療における意思決定は、しばしば服薬の組み合わせを選択する必要がある。
ドセージ・コンビネーションのための信頼性の高いオフ・ポリティクス学習手法を提案する。
論文 参考訳(メタデータ) (2023-05-31T11:08:43Z) - Causal Inference under Data Restrictions [0.0]
この論文は、不確実性とデータ制限の下での現代の因果推論に焦点を当てている。
これには、ネオアジュバント臨床試験、分散データネットワーク、堅牢な個別化意思決定へのアプリケーションが含まれる。
論文 参考訳(メタデータ) (2023-01-20T20:14:32Z) - TCFimt: Temporal Counterfactual Forecasting from Individual Multiple
Treatment Perspective [50.675845725806724]
個別多面的治療の観点からの時間的対実予測の包括的枠組み(TCFimt)を提案する。
TCFimtは、選択と時間変化バイアスを軽減するためにSeq2seqフレームワークの逆タスクを構築し、比較学習ベースのブロックを設計し、混合処理効果を分離した主治療効果と因果相互作用に分解する。
提案手法は, 特定の治療法による今後の結果予測と, 最先端手法よりも最適な治療タイプとタイミングを選択する上で, 良好な性能を示す。
論文 参考訳(メタデータ) (2022-12-17T15:01:05Z) - Robust and Agnostic Learning of Conditional Distributional Treatment
Effects [62.44901952244514]
条件平均治療効果(CATE)は、個々の因果効果の最適点予測である。
集約分析では、通常は分布処理効果(DTE)の測定によって対処される。
我々は,多種多様な問題に対して条件付きDTE(CDTE)を学習するための,新しい堅牢でモデルに依存しない手法を提供する。
論文 参考訳(メタデータ) (2022-05-23T17:40:31Z) - Disentangled Counterfactual Recurrent Networks for Treatment Effect
Inference over Time [71.30985926640659]
本稿では,DCRN(Disentangled Counterfactual Recurrent Network)を提案する。
時間とともに治療効果の因果構造に完全にインスパイアされたアーキテクチャでは、予測精度と疾患理解が向上する。
実データとシミュレーションデータの両方において,DCRNが処理応答予測の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-12-07T16:40:28Z) - SurvITE: Learning Heterogeneous Treatment Effects from Time-to-Event
Data [83.50281440043241]
時系列データから不均一な処理効果を推定する問題について検討する。
本稿では,バランス表現に基づく治療特異的ハザード推定のための新しいディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2021-10-26T20:13:17Z) - An Investigation of Replay-based Approaches for Continual Learning [79.0660895390689]
連続学習(CL)は機械学習(ML)の大きな課題であり、破滅的忘れ(CF)を伴わずに連続的に複数のタスクを学習する能力を記述する。
いくつかの解クラスが提案されており、その単純さと堅牢性から、いわゆるリプレイベースのアプローチは非常に有望であるように思われる。
連続学習におけるリプレイに基づくアプローチを実証的に検討し,応用の可能性を評価する。
論文 参考訳(メタデータ) (2021-08-15T15:05:02Z) - Stochastic Intervention for Causal Inference via Reinforcement Learning [7.015556609676951]
因果推論の中心は介入戦略の処理効果推定である。
既存の方法はほとんどが決定論的治療に限られており、異なる治療下での結果を比較する。
介入に対する治療効果を推定するための新しい効果的な枠組みを提案する。
論文 参考訳(メタデータ) (2021-05-28T00:11:22Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - Generalization Bounds and Representation Learning for Estimation of
Potential Outcomes and Causal Effects [61.03579766573421]
代替薬に対する患者一人の反応など,個人レベルの因果効果の推定について検討した。
我々は,表現の誘導的処理群距離を正規化することにより,境界を最小化する表現学習アルゴリズムを考案した。
これらのアルゴリズムを拡張して、重み付き表現を同時に学習し、治療群距離をさらに削減する。
論文 参考訳(メタデータ) (2020-01-21T10:16:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。