論文の概要: Jump Interval-Learning for Individualized Decision Making
- arxiv url: http://arxiv.org/abs/2111.08885v1
- Date: Wed, 17 Nov 2021 03:29:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 14:47:51.985258
- Title: Jump Interval-Learning for Individualized Decision Making
- Title(参考訳): 個別意思決定のためのジャンプ間隔学習
- Authors: Hengrui Cai, Chengchun Shi, Rui Song, Wenbin Lu
- Abstract要約: 個別化区間値決定ルール(I2DR)を開発するためのジャンプインターバル学習を提案する。
単一の治療を推奨するIDRとは異なり、提案されたI2DRは個々の治療オプションの間隔を与える。
- 参考スコア(独自算出の注目度): 21.891586204541877
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An individualized decision rule (IDR) is a decision function that assigns
each individual a given treatment based on his/her observed characteristics.
Most of the existing works in the literature consider settings with binary or
finitely many treatment options. In this paper, we focus on the continuous
treatment setting and propose a jump interval-learning to develop an
individualized interval-valued decision rule (I2DR) that maximizes the expected
outcome. Unlike IDRs that recommend a single treatment, the proposed I2DR
yields an interval of treatment options for each individual, making it more
flexible to implement in practice. To derive an optimal I2DR, our jump
interval-learning method estimates the conditional mean of the outcome given
the treatment and the covariates via jump penalized regression, and derives the
corresponding optimal I2DR based on the estimated outcome regression function.
The regressor is allowed to be either linear for clear interpretation or deep
neural network to model complex treatment-covariates interactions. To implement
jump interval-learning, we develop a searching algorithm based on dynamic
programming that efficiently computes the outcome regression function.
Statistical properties of the resulting I2DR are established when the outcome
regression function is either a piecewise or continuous function over the
treatment space. We further develop a procedure to infer the mean outcome under
the (estimated) optimal policy. Extensive simulations and a real data
application to a warfarin study are conducted to demonstrate the empirical
validity of the proposed I2DR.
- Abstract(参考訳): 個別決定ルール(英: individualized decision rule、IDR)とは、観察された特徴に基づいて各個人に所定の処置を割り当てる決定関数である。
文献にある既存の作品の多くは、二項または有限個の治療オプションを持つ設定を考慮に入れている。
本稿では,連続的な治療設定に着目し,ジャンプ間隔学習を行い,期待される結果を最大化する個別化区間値決定規則(i2dr)を考案する。
単一の治療を推奨するIDRとは異なり、提案されたI2DRは個々の治療オプションの間隔を確保でき、実際はより柔軟に実施できる。
最適I2DRを導出するために,ジャンプ間隔学習法は,処理結果と共変量の条件平均をジャンプペナル化回帰により推定し,その推定結果回帰関数に基づいて対応する最適I2DRを導出する。
回帰器は、明確な解釈のために線形的であるか、複雑な処理-共変量相互作用をモデル化するためにディープニューラルネットワークが許される。
ジャンプ間隔学習を実現するために,結果回帰関数を効率的に計算する動的プログラミングに基づく探索アルゴリズムを開発した。
結果i2drの統計的性質は、結果回帰関数が処理空間上の分割関数または連続関数であるときに確立される。
さらに、(推定)最適政策の下で、平均結果を推測する手順を開発する。
提案したI2DRの実証的妥当性を示すため, 大規模シミュレーションと実データを用いたワーファリン研究を行った。
関連論文リスト
- Robust Learning for Optimal Dynamic Treatment Regimes with Observational Data [0.0]
本研究では,各段階における各個人に対する最適な治療課題を,個人の進化史に基づいて導くための最適動的治療体制(DTR)の統計的学習について検討する。
論文 参考訳(メタデータ) (2024-03-30T02:33:39Z) - Doubly Robust Proximal Causal Learning for Continuous Treatments [56.05592840537398]
本稿では,カーネルベースの2倍頑健な因果学習推定器を提案する。
オラクル形式は影響関数の一貫した近似であることを示す。
次に、平均二乗誤差の観点から総合収束解析を行う。
論文 参考訳(メタデータ) (2023-09-22T12:18:53Z) - Efficient and robust transfer learning of optimal individualized
treatment regimes with right-censored survival data [7.308241944759317]
個別治療体制(英: individualized treatment regime、ITR)は、患者の特徴に基づいて治療を割り当てる決定規則である。
本稿では、値関数の2倍頑健な推定器を提案し、その最適ITRは、予め指定されたIRRのクラス内の値関数を最大化することにより学習する。
重篤なメタボリックアシダ血症に対するバイカーボネートナトリウム療法のシミュレーションおよび実データによる評価を行った。
論文 参考訳(メタデータ) (2023-01-13T11:47:10Z) - Nearly Minimax Optimal Reinforcement Learning for Linear Markov Decision
Processes [80.89852729380425]
そこで本研究では,最小限の最小残差である$tilde O(dsqrtH3K)$を計算効率よく実現したアルゴリズムを提案する。
我々の研究は線形 MDP を用いた最適 RL に対する完全な答えを提供する。
論文 参考訳(メタデータ) (2022-12-12T18:58:59Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Robust and Agnostic Learning of Conditional Distributional Treatment
Effects [62.44901952244514]
条件平均治療効果(CATE)は、個々の因果効果の最適点予測である。
集約分析では、通常は分布処理効果(DTE)の測定によって対処される。
我々は,多種多様な問題に対して条件付きDTE(CDTE)を学習するための,新しい堅牢でモデルに依存しない手法を提供する。
論文 参考訳(メタデータ) (2022-05-23T17:40:31Z) - Variance-Aware Off-Policy Evaluation with Linear Function Approximation [85.75516599931632]
線形関数近似を用いた強化学習における非政治的評価問題について検討する。
本稿では,値関数の分散を推定し,フィルタQ-Iterationにおけるベルマン残差を再重み付けするアルゴリズムVA-OPEを提案する。
論文 参考訳(メタデータ) (2021-06-22T17:58:46Z) - Machine Learning based optimization for interval uncertainty propagation
with application to vibro-acoustic models [0.0]
工学系の性能解析には2つの非侵入的不確実性伝播法が提案されている。
1つのアプローチは、応答変数の上と下の境界を別々に評価するために、2つの異なるトレーニングデータセットを反復的に構築する。
もう1つは反復的に単一のトレーニングデータセットを構築します。
論文 参考訳(メタデータ) (2021-06-21T15:57:11Z) - Evaluating (weighted) dynamic treatment effects by double machine
learning [0.12891210250935145]
本研究では,データ駆動方式で動的処理の因果効果を評価する。
いわゆるNeyman-orthogonal score関数を用いて,中等度(局所的な)不特定性に対する治療効果推定の頑健さを示唆する。
推定子は正規に正規であり、特定の条件下では$sqrtn$-consistentであることを示す。
論文 参考訳(メタデータ) (2020-12-01T09:55:40Z) - Leveraging both Lesion Features and Procedural Bias in Neuroimaging: An
Dual-Task Split dynamics of inverse scale space [21.05070956384346]
病変の予測と選択は、ボクセルによる神経画像解析において2つの重要な課題である。
本稿では, 神経画像データの特徴/語彙は, 病変特徴, 手続きバイアス, ヌル特徴の3つの部分から構成されることを示す。
病変の特徴を安定的に選択し,手続き的バイアスを予測に活用するために,反復アルゴリズム(GSplit LBI)を提案する。
本モデルの有効性とメリットは,予測結果の改善と,視覚化された手続きバイアスと病変の特徴の解釈可能性によって示される。
論文 参考訳(メタデータ) (2020-07-17T03:41:48Z) - DTR Bandit: Learning to Make Response-Adaptive Decisions With Low Regret [59.81290762273153]
動的治療体制 (DTR) はパーソナライズされ適応された多段階の治療計画であり、治療決定を個人の初期特徴に適応させ、その後の各段階における中間結果と特徴に適応させる。
本稿では,探索と搾取を慎重にバランスさせることで,遷移モデルと報酬モデルが線形である場合に,速度-最適後悔を実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-06T13:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。