論文の概要: Estimating Structural Target Functions using Machine Learning and
Influence Functions
- arxiv url: http://arxiv.org/abs/2008.06461v3
- Date: Mon, 8 Feb 2021 13:15:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 17:48:12.598192
- Title: Estimating Structural Target Functions using Machine Learning and
Influence Functions
- Title(参考訳): 機械学習と影響関数を用いた構造目標関数の推定
- Authors: Alicia Curth and Ahmed M. Alaa and Mihaela van der Schaar
- Abstract要約: 統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
- 参考スコア(独自算出の注目度): 103.47897241856603
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We aim to construct a class of learning algorithms that are of practical
value to applied researchers in fields such as biostatistics, epidemiology and
econometrics, where the need to learn from incompletely observed information is
ubiquitous. We propose a new framework for statistical machine learning of
target functions arising as identifiable functionals from statistical models,
which we call `IF-learning' due to its reliance on influence functions (IFs).
This framework is problem- and model-agnostic and can be used to estimate a
broad variety of target parameters of interest in applied statistics: we can
consider any target function for which an IF of a population-averaged version
exists in analytic form. Throughout, we put particular focus on so-called
coarsening at random/doubly robust problems with partially unobserved
information. This includes problems such as treatment effect estimation and
inference in the presence of missing outcome data. Within this framework, we
propose two general learning algorithms that build on the idea of nonparametric
plug-in bias removal via IFs: the 'IF-learner' which uses pseudo-outcomes
motivated by uncentered IFs for regression in large samples and outputs entire
target functions without confidence bands, and the 'Group-IF-learner', which
outputs only approximations to a function but can give confidence estimates if
sufficient information on coarsening mechanisms is available. We apply both in
a simulation study on inferring treatment effects.
- Abstract(参考訳): 我々は, 生物統計学, 疫学, 計量学などの応用研究者にとって実用的な学習アルゴリズムのクラスを構築し, 不完全に観察された情報から学ぶ必要性がユビキタスである。
本稿では,その影響関数(IF)に依存するため,統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題やモデルに依存しないものであり、応用統計学に関心のある幅広いターゲットパラメータを推定するのに使うことができる: 人口平均バージョンのifが解析形式で存在する任意のターゲット関数を考えることができる。
全体としては,ランダム/二重ロバストな問題における,いわゆる粗大化に注目した。
これには、治療効果の推定や、欠落した結果データの存在による推測などの問題が含まれる。
このフレームワークでは,ifsを用いた非パラメトリックプラグインバイアス除去の考え方に基づく2つの一般的な学習アルゴリズムを提案する。大きなサンプルにおける回帰のための非中心型ifによって動機づけられた擬似アウトカムを使用する'if-learner'と,粗粒化機構に関する十分な情報があれば信頼度評価を行う'group-if-learner'である。
どちらも治療効果を推測するシミュレーション研究に応用する。
関連論文リスト
- Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:04:39Z) - Probabilities-Informed Machine Learning [0.0]
本研究では,出力関数の構造に関するドメイン知識から着想を得たMLパラダイムを提案する。
提案手法は,対象変数の確率的構造を学習プロセスに統合する。
モデル精度を高め、過度な適合と不適合のリスクを軽減する。
論文 参考訳(メタデータ) (2024-12-16T08:01:22Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - A Versatile Influence Function for Data Attribution with Non-Decomposable Loss [3.1615846013409925]
本稿では,非分解不能な損失を学習した機械学習モデルに対して,直接適用可能なVersatile Influence Function (VIF)を提案する。
VIFはデータ属性の大幅な進歩を表しており、幅広い機械学習パラダイムにまたがる効率的な影響関数ベースの属性を可能にする。
論文 参考訳(メタデータ) (2024-12-02T09:59:01Z) - Towards Better Modeling with Missing Data: A Contrastive Learning-based
Visual Analytics Perspective [7.577040836988683]
データ不足は機械学習(ML)モデリングの課題となる可能性がある。
現在のアプローチは、特徴計算とラベル予測に分類される。
本研究は、観測データに欠落した値でモデル化するコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T13:16:24Z) - On the Efficacy of Generalization Error Prediction Scoring Functions [33.24980750651318]
一般化誤差予測器(GEP)は,サンプルレベルのスコアからデータセットレベルの誤差推定を導出することにより,未知分布のモデル性能を予測することを目的としている。
機構選択に依存しない一般的なスコアリング関数(自信,局所多様体の滑らかさ,モデル適合性)の有効性を厳密に研究する。
論文 参考訳(メタデータ) (2023-03-23T18:08:44Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - On the Estimation of Complex Circuits Functional Failure Rate by Machine
Learning Techniques [0.16311150636417257]
デレーティング(De-Rating)あるいは脆弱性要因(Vulnerability Factors)は、今日の機能的安全要件によって管理される障害分析の最大の特徴である。
機械学習を用いて個々のフリップフロップの関数的デレートを推定する新しい手法が提案されている。
論文 参考訳(メタデータ) (2020-02-18T15:18:31Z) - Localized Debiased Machine Learning: Efficient Inference on Quantile
Treatment Effects and Beyond [69.83813153444115]
因果推論における(局所)量子化処理効果((L)QTE)の効率的な推定式を検討する。
Debiased Machine Learning (DML)は、高次元のニュアンスを推定するデータ分割手法である。
本稿では、この負担のかかるステップを避けるために、局所的脱バイアス機械学習(LDML)を提案する。
論文 参考訳(メタデータ) (2019-12-30T14:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。