論文の概要: Estimating Structural Target Functions using Machine Learning and
Influence Functions
- arxiv url: http://arxiv.org/abs/2008.06461v3
- Date: Mon, 8 Feb 2021 13:15:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 17:48:12.598192
- Title: Estimating Structural Target Functions using Machine Learning and
Influence Functions
- Title(参考訳): 機械学習と影響関数を用いた構造目標関数の推定
- Authors: Alicia Curth and Ahmed M. Alaa and Mihaela van der Schaar
- Abstract要約: 統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
- 参考スコア(独自算出の注目度): 103.47897241856603
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We aim to construct a class of learning algorithms that are of practical
value to applied researchers in fields such as biostatistics, epidemiology and
econometrics, where the need to learn from incompletely observed information is
ubiquitous. We propose a new framework for statistical machine learning of
target functions arising as identifiable functionals from statistical models,
which we call `IF-learning' due to its reliance on influence functions (IFs).
This framework is problem- and model-agnostic and can be used to estimate a
broad variety of target parameters of interest in applied statistics: we can
consider any target function for which an IF of a population-averaged version
exists in analytic form. Throughout, we put particular focus on so-called
coarsening at random/doubly robust problems with partially unobserved
information. This includes problems such as treatment effect estimation and
inference in the presence of missing outcome data. Within this framework, we
propose two general learning algorithms that build on the idea of nonparametric
plug-in bias removal via IFs: the 'IF-learner' which uses pseudo-outcomes
motivated by uncentered IFs for regression in large samples and outputs entire
target functions without confidence bands, and the 'Group-IF-learner', which
outputs only approximations to a function but can give confidence estimates if
sufficient information on coarsening mechanisms is available. We apply both in
a simulation study on inferring treatment effects.
- Abstract(参考訳): 我々は, 生物統計学, 疫学, 計量学などの応用研究者にとって実用的な学習アルゴリズムのクラスを構築し, 不完全に観察された情報から学ぶ必要性がユビキタスである。
本稿では,その影響関数(IF)に依存するため,統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題やモデルに依存しないものであり、応用統計学に関心のある幅広いターゲットパラメータを推定するのに使うことができる: 人口平均バージョンのifが解析形式で存在する任意のターゲット関数を考えることができる。
全体としては,ランダム/二重ロバストな問題における,いわゆる粗大化に注目した。
これには、治療効果の推定や、欠落した結果データの存在による推測などの問題が含まれる。
このフレームワークでは,ifsを用いた非パラメトリックプラグインバイアス除去の考え方に基づく2つの一般的な学習アルゴリズムを提案する。大きなサンプルにおける回帰のための非中心型ifによって動機づけられた擬似アウトカムを使用する'if-learner'と,粗粒化機構に関する十分な情報があれば信頼度評価を行う'group-if-learner'である。
どちらも治療効果を推測するシミュレーション研究に応用する。
関連論文リスト
- Exploiting the Data Gap: Utilizing Non-ignorable Missingness to Manipulate Model Learning [13.797822374912773]
敵対的ミススティングネス(AM)攻撃は、悪意ある無知の欠陥メカニズムによって動機づけられる。
本研究は,AM攻撃の文脈における連帯学習に焦点を当てる。
両レベルの最適化として,対向的欠落メカニズムの学習を定式化する。
論文 参考訳(メタデータ) (2024-09-06T17:10:28Z) - Towards Better Modeling with Missing Data: A Contrastive Learning-based
Visual Analytics Perspective [7.577040836988683]
データ不足は機械学習(ML)モデリングの課題となる可能性がある。
現在のアプローチは、特徴計算とラベル予測に分類される。
本研究は、観測データに欠落した値でモデル化するコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T13:16:24Z) - FAStEN: An Efficient Adaptive Method for Feature Selection and Estimation in High-Dimensional Functional Regressions [7.674715791336311]
本稿では,スパース関数オン・ファンクション回帰問題において特徴選択を行うための,新しい,柔軟な,超効率的なアプローチを提案する。
我々はそれをスカラー・オン・ファンクション・フレームワークに拡張する方法を示す。
AOMIC PIOP1による脳MRIデータへの応用について述べる。
論文 参考訳(メタデータ) (2023-03-26T19:41:17Z) - On the Efficacy of Generalization Error Prediction Scoring Functions [33.24980750651318]
一般化誤差予測器(GEP)は,サンプルレベルのスコアからデータセットレベルの誤差推定を導出することにより,未知分布のモデル性能を予測することを目的としている。
機構選択に依存しない一般的なスコアリング関数(自信,局所多様体の滑らかさ,モデル適合性)の有効性を厳密に研究する。
論文 参考訳(メタデータ) (2023-03-23T18:08:44Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms [82.90843777097606]
欠落データに対する因果認識型計算アルゴリズム(MIRACLE)を提案する。
MIRACLEは、欠落発生機構を同時にモデル化することにより、ベースラインの計算を反復的に洗練する。
我々は、MIRACLEが一貫してイミューテーションを改善することができることを示すために、合成および様々な公開データセットに関する広範な実験を行う。
論文 参考訳(メタデータ) (2021-11-04T22:38:18Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - On the Estimation of Complex Circuits Functional Failure Rate by Machine
Learning Techniques [0.16311150636417257]
デレーティング(De-Rating)あるいは脆弱性要因(Vulnerability Factors)は、今日の機能的安全要件によって管理される障害分析の最大の特徴である。
機械学習を用いて個々のフリップフロップの関数的デレートを推定する新しい手法が提案されている。
論文 参考訳(メタデータ) (2020-02-18T15:18:31Z) - Localized Debiased Machine Learning: Efficient Inference on Quantile
Treatment Effects and Beyond [69.83813153444115]
因果推論における(局所)量子化処理効果((L)QTE)の効率的な推定式を検討する。
Debiased Machine Learning (DML)は、高次元のニュアンスを推定するデータ分割手法である。
本稿では、この負担のかかるステップを避けるために、局所的脱バイアス機械学習(LDML)を提案する。
論文 参考訳(メタデータ) (2019-12-30T14:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。