Fugu-MT 論文翻訳(概要): Externally Valid Policy Choice

論文の概要: Externally Valid Policy Choice

arxiv url: http://arxiv.org/abs/2205.05561v2
Date: Tue, 23 May 2023 13:23:28 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-25 02:01:28.540773
Title: Externally Valid Policy Choice
Title（参考訳）: 外部に有効な政策選択
Authors: Christopher Adjaho and Timothy Christensen
Abstract要約: 対外的あるいは一般化可能なパーソナライズされた治療方針を学習することの問題点を考察する。まず,実験人口に対する福祉最大化政策は,成果の分布の変化に対して堅牢であることを示す。そして、結果や特徴の変化に頑健な政策を学ぶための新しい方法を開発する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We consider the problem of learning personalized treatment policies that are externally valid or generalizable: they perform well in other target populations besides the experimental (or training) population from which data are sampled. We first show that welfare-maximizing policies for the experimental population are robust to shifts in the distribution of outcomes (but not characteristics) between the experimental and target populations. We then develop new methods for learning policies that are robust to shifts in outcomes and characteristics. In doing so, we highlight how treatment effect heterogeneity within the experimental population affects the generalizability of policies. Our methods may be used with experimental or observational data (where treatment is endogenous). Many of our methods can be implemented with linear programming.
Abstract（参考訳）: 我々は、データをサンプル化した実験的(または訓練的)人口以外に、他の対象集団でよく機能する、外部的に有効または一般化可能なパーソナライズされた治療方針を学習する問題を考える。まず, 実験集団の福祉最大化政策は, 実験個体群と対象個体群間の結果の分布(特性)の変化に頑健であることを示す。そして、結果や特徴の変化に頑健な政策を学ぶための新しい方法を開発する。そこで本研究では, 実験集団における治療効果の多様性が, 政策の一般化性に与える影響を強調する。本手法は実験データや観察データ(内因性の場合)で用いることができる。私たちの手法の多くは線形プログラミングで実装できます。

関連論文リスト

Estimating Individual Dose-Response Curves under Unobserved Confounders from Observational Data [6.166869525631879]
本稿では,連続治療の因果効果を推定するための新しいフレームワークであるContiVAEについて述べる。 ContiVAEは既存の手法を最大62%上回り、その堅牢性と柔軟性を示す。
論文参考訳（メタデータ） (2024-10-21T07:24:26Z)
Reduced-Rank Multi-objective Policy Learning and Optimization [57.978477569678844]
実際には、因果研究者は先験を念頭において1つの結果を持っていない。政府支援の社会福祉プログラムでは、政策立案者は貧困の多次元的性質を理解するために多くの成果を集めている。本稿では、最適政策学習の文脈において、複数の結果に対するデータ駆動型次元性推論手法を提案する。
論文参考訳（メタデータ） (2024-04-29T08:16:30Z)
Adaptive Instrument Design for Indirect Experiments [48.815194906471405]
RCTとは異なり、間接的な実験は条件付き機器変数を利用して治療効果を推定する。本稿では,データ収集ポリシーを適応的に設計することで,間接実験におけるサンプル効率の向上に向けた最初のステップについて述べる。我々の主な貢献は、影響関数を利用して最適なデータ収集ポリシーを探索する実用的な計算手順である。
論文参考訳（メタデータ） (2023-12-05T02:38:04Z)
Policy Learning with Distributional Welfare [1.0742675209112622]
治療選択に関する文献の多くは、条件平均治療効果(ATE)に基づく実用的福祉を考慮したものである。本稿では,個別処理効果(QoTE)の条件量子化に基づく処理を最適に割り当てる政策を提案する。
論文参考訳（メタデータ） (2023-11-27T14:51:30Z)
Externally Valid Policy Evaluation Combining Trial and Observational Data [6.875312133832077]
対象人口に対する政策の結果について有効な推測を行うために,試行データを用いたい。本研究では,任意のモデル誤校正範囲下で有効な試行ベースの政策評価を行う手法を開発した。
論文参考訳（メタデータ） (2023-10-23T10:01:50Z)
Effect-Invariant Mechanisms for Policy Generalization [3.701112941066256]
不変条件分布を利用して、目に見えない環境をより一般化するモデルを学ぶことが提案されている。効果不変性(英語版)と呼ばれる完全な不変性の緩和を導入し、ゼロショットポリシーの一般化には適切な仮定の下で十分であることを示す。シミュレーションデータと移動体保健介入データセットを用いて実験結果を提示し,本手法の有効性を実証した。
論文参考訳（メタデータ） (2023-06-19T14:50:24Z)
Learnable Behavior Control: Breaking Atari Human World Records via Sample-Efficient Behavior Selection [56.87650511573298]
本稿では,LBC(Learable Behavioral Control)と呼ばれるフレームワークを提案する。我々のエージェントは10077.52%の平均正規化スコアを達成し、1Bのトレーニングフレーム内で24人の世界記録を突破した。
論文参考訳（メタデータ） (2023-05-09T08:00:23Z)
Conformal Off-Policy Evaluation in Markov Decision Processes [53.786439742572995]
強化学習は、データから効率的な制御ポリシーを特定し評価することを目的としている。この学習タスクのほとんどの方法は、Off-Policy Evaluation (OPE)と呼ばれ、正確さと確実性を保証するものではない。本稿では,目標方針の真報を含む区間を所定の確信度で出力するコンフォーマル予測に基づく新しいOPE手法を提案する。
論文参考訳（メタデータ） (2023-04-05T16:45:11Z)
Improved Policy Evaluation for Randomized Trials of Algorithmic Resource Allocation [54.72195809248172]
提案する新しい概念を応用した新しい推定器を提案する。我々は,このような推定器が,サンプル手段に基づく一般的な推定器よりも精度が高いことを理論的に証明した。
論文参考訳（メタデータ） (2023-02-06T05:17:22Z)
Policy learning "without" overlap: Pessimism and generalized empirical Bernstein's inequality [94.89246810243053]
本論文は,事前収集した観測値を利用して最適な個別化決定規則を学習するオフライン政策学習について検討する。既存の政策学習法は、一様重なりの仮定、すなわち、全ての個々の特性に対する全ての作用を探索する正当性は、境界を低くしなければならない。我々は,点推定の代わりに低信頼度境界(LCB)を最適化する新しいアルゴリズムであるPPLを提案する。
論文参考訳（メタデータ） (2022-12-19T22:43:08Z)
Generalizing Off-Policy Learning under Sample Selection Bias [15.733136147164032]
本稿では,対象人口に一般化する学習政策の枠組みを提案する。不確実性セットが適切に特定されている場合、トレーニングデータよりも悪いことができないため、我々の政策が対象人口に一般化されることを実証する。
論文参考訳（メタデータ） (2021-12-02T16:18:16Z)
Identification of Subgroups With Similar Benefits in Off-Policy Policy Evaluation [60.71312668265873]
我々は,パーソナライズの必要性と自信ある予測とのバランスをとる方法を開発した。本手法は不均一な治療効果の正確な予測に有効であることを示す。
論文参考訳（メタデータ） (2021-11-28T23:19:12Z)
Plinko: A Theory-Free Behavioral Measure of Priors for Statistical Learning and Mental Model Updating [62.997667081978825]
Plinko(リンク)は,参加者が利用可能なすべての結果に対してボール滴の分布を推定する行動課題である。対象者は,確率分布の確率分布を中心にクラスタリングし,事前クラスタメンバシップは学習能力を示す可能性があることを示す。我々は,個々の参加者が信頼できる表現であり,物理的に不可解な球滴分布に直面した場合,学習が阻害されないことを検証した。
論文参考訳（メタデータ） (2021-07-23T22:27:30Z)
A Review of Generalizability and Transportability [0.18275108630751835]
ランダム化されたデータからの見積もりは内部的妥当性を持つが、しばしば対象人口を表すものではない。観測データは対象の個体群をよりよく反映し、したがって外的妥当性が高いが、未測定の埋没により潜在的なバイアスにさらされる可能性がある。本稿では,一般化可能性と可搬性に対するアプローチの合成を含む外部妥当性バイアスに対処するためのフレームワークを提案する。
論文参考訳（メタデータ） (2021-02-23T19:34:13Z)
Policy design in experiments with unknown interference [0.0]
流出効果を考慮した政策の推定と推定について検討した。単位は有限個の大きなクラスタにまとめられる。本研究では,大規模フィールド実験における理論的保証と実装について述べる。
論文参考訳（メタデータ） (2020-11-16T18:58:54Z)
Enabling Counterfactual Survival Analysis with Balanced Representations [64.17342727357618]
生存データは様々な医学的応用、すなわち薬物開発、リスクプロファイリング、臨床試験で頻繁に見られる。本稿では,生存結果に適用可能な対実的推論のための理論的基盤を持つ統一的枠組みを提案する。
論文参考訳（メタデータ） (2020-06-14T01:15:00Z)
Active Invariant Causal Prediction: Experiment Selection through Stability [4.56877715768796]
本研究では、不変因果予測(ICP)に基づく新しい能動学習(実験選択)フレームワーク(A-ICP)を提案する。一般的な構造因果モデルでは、いわゆる安定集合に対する介入の効果を特徴づける。本稿では,A-ICPの介入選択ポリシーを提案し,因果グラフにおける応答変数の直接原因を素早く明らかにする。実験により, 人口および有限登録実験において提案した政策の有効性を実証的に分析した。
論文参考訳（メタデータ） (2020-06-10T07:07:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。