Fugu-MT 論文翻訳(概要): Estimating Structural Target Functions using Machine Learning and Influence Functions

論文の概要: Estimating Structural Target Functions using Machine Learning and Influence Functions

arxiv url: http://arxiv.org/abs/2008.06461v3
Date: Mon, 8 Feb 2021 13:15:52 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-30 17:48:12.598192
Title: Estimating Structural Target Functions using Machine Learning and Influence Functions
Title（参考訳）: 機械学習と影響関数を用いた構造目標関数の推定
Authors: Alicia Curth and Ahmed M. Alaa and Mihaela van der Schaar
Abstract要約: 統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
参考スコア（独自算出の注目度）: 103.47897241856603
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We aim to construct a class of learning algorithms that are of practical value to applied researchers in fields such as biostatistics, epidemiology and econometrics, where the need to learn from incompletely observed information is ubiquitous. We propose a new framework for statistical machine learning of target functions arising as identifiable functionals from statistical models, which we call `IF-learning' due to its reliance on influence functions (IFs). This framework is problem- and model-agnostic and can be used to estimate a broad variety of target parameters of interest in applied statistics: we can consider any target function for which an IF of a population-averaged version exists in analytic form. Throughout, we put particular focus on so-called coarsening at random/doubly robust problems with partially unobserved information. This includes problems such as treatment effect estimation and inference in the presence of missing outcome data. Within this framework, we propose two general learning algorithms that build on the idea of nonparametric plug-in bias removal via IFs: the 'IF-learner' which uses pseudo-outcomes motivated by uncentered IFs for regression in large samples and outputs entire target functions without confidence bands, and the 'Group-IF-learner', which outputs only approximations to a function but can give confidence estimates if sufficient information on coarsening mechanisms is available. We apply both in a simulation study on inferring treatment effects.
Abstract（参考訳）: 我々は, 生物統計学, 疫学, 計量学などの応用研究者にとって実用的な学習アルゴリズムのクラスを構築し, 不完全に観察された情報から学ぶ必要性がユビキタスである。本稿では,その影響関数(IF)に依存するため,統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。このフレームワークは問題やモデルに依存しないものであり、応用統計学に関心のある幅広いターゲットパラメータを推定するのに使うことができる: 人口平均バージョンのifが解析形式で存在する任意のターゲット関数を考えることができる。全体としては,ランダム/二重ロバストな問題における,いわゆる粗大化に注目した。これには、治療効果の推定や、欠落した結果データの存在による推測などの問題が含まれる。このフレームワークでは,ifsを用いた非パラメトリックプラグインバイアス除去の考え方に基づく2つの一般的な学習アルゴリズムを提案する。大きなサンプルにおける回帰のための非中心型ifによって動機づけられた擬似アウトカムを使用する'if-learner'と,粗粒化機構に関する十分な情報があれば信頼度評価を行う'group-if-learner'である。どちらも治療効果を推測するシミュレーション研究に応用する。

関連論文リスト

A Doubly Robust Machine Learning Approach for Disentangling Treatment Effect Heterogeneity with Functional Outcomes [0.7646713951724009]
FOCaL(Functional Outcome Causal Learning)は機能的不均一処理効果(F-CATE)を推定するために開発された2重頑健なメタラーである。 FOCaLは,F-CATEの直接的かつロバストな推定を可能にする。 FOCaLは、複雑なデータからニュアンス付き個別化された因果効果を推測するために、マシンインテリジェンスの能力を向上させる。
論文参考訳（メタデータ） (2026-02-11T18:31:59Z)
Data-Driven Information-Theoretic Causal Bounds under Unmeasured Confounding [10.590231532335691]
本研究では,データ駆動型情報理論フレームワークを開発し,条件付き因果関係の同定を行う。我々の重要な理論的貢献は、観測分布 P(Y | A = a, X = x) と干渉分布 P(Y | do(A = a), X = x) の間の f-分割が、確率スコアのみの関数によって上界であることが示している。この結果により、外部感度パラメータ、補助変数、完全な構造仕様、結果境界性仮定を必要とせず、観測データから直接条件因果効果を鋭く同定することができる。
論文参考訳（メタデータ） (2026-01-23T20:47:48Z)
AICO: Feature Significance Tests for Supervised Learning [0.5142666700569699]
本稿では,任意の回帰アルゴリズムや分類アルゴリズムにおける入力特徴の影響を評価するために,モデルおよび分布に依存しない重要度テストを開発する。我々は、この中央値に対して一様に強力でランダムな符号テストを構築し、特徴量と信頼区間を評価するための正確なp値を得る。合成タスクの実験は、その統計的および計算上の利点を検証し、実世界のデータへの適用は、その実用性を示している。
論文参考訳（メタデータ） (2025-06-29T21:15:40Z)
Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文参考訳（メタデータ） (2025-02-17T18:04:39Z)
Probabilities-Informed Machine Learning [0.0]
本研究では,出力関数の構造に関するドメイン知識から着想を得たMLパラダイムを提案する。提案手法は,対象変数の確率的構造を学習プロセスに統合する。モデル精度を高め、過度な適合と不適合のリスクを軽減する。
論文参考訳（メタデータ） (2024-12-16T08:01:22Z)
A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。工業画像から抽出した55個の特徴を統計的手法を用いて解析した。これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文参考訳（メタデータ） (2024-12-11T22:12:21Z)
A Versatile Influence Function for Data Attribution with Non-Decomposable Loss [3.1615846013409925]
本稿では,非分解不能な損失を学習した機械学習モデルに対して,直接適用可能なVersatile Influence Function (VIF)を提案する。 VIFはデータ属性の大幅な進歩を表しており、幅広い機械学習パラダイムにまたがる効率的な影響関数ベースの属性を可能にする。
論文参考訳（メタデータ） (2024-12-02T09:59:01Z)
Exploiting the Data Gap: Utilizing Non-ignorable Missingness to Manipulate Model Learning [13.797822374912773]
敵対的ミススティングネス(AM)攻撃は、悪意ある無知の欠陥メカニズムによって動機づけられる。本研究は,AM攻撃の文脈における連帯学習に焦点を当てる。両レベルの最適化として,対向的欠落メカニズムの学習を定式化する。
論文参考訳（メタデータ） (2024-09-06T17:10:28Z)
Towards Better Modeling with Missing Data: A Contrastive Learning-based Visual Analytics Perspective [7.577040836988683]
データ不足は機械学習(ML)モデリングの課題となる可能性がある。現在のアプローチは、特徴計算とラベル予測に分類される。本研究は、観測データに欠落した値でモデル化するコントラスト学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-09-18T13:16:24Z)
FAStEN: An Efficient Adaptive Method for Feature Selection and Estimation in High-Dimensional Functional Regressions [7.674715791336311]
本稿では,スパース関数オン・ファンクション回帰問題において特徴選択を行うための,新しい,柔軟な,超効率的なアプローチを提案する。我々はそれをスカラー・オン・ファンクション・フレームワークに拡張する方法を示す。 AOMIC PIOP1による脳MRIデータへの応用について述べる。
論文参考訳（メタデータ） (2023-03-26T19:41:17Z)
On the Efficacy of Generalization Error Prediction Scoring Functions [33.24980750651318]
一般化誤差予測器(GEP)は,サンプルレベルのスコアからデータセットレベルの誤差推定を導出することにより,未知分布のモデル性能を予測することを目的としている。機構選択に依存しない一般的なスコアリング関数(自信,局所多様体の滑らかさ,モデル適合性)の有効性を厳密に研究する。
論文参考訳（メタデータ） (2023-03-23T18:08:44Z)
Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文参考訳（メタデータ） (2022-03-11T02:37:35Z)
Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文参考訳（メタデータ） (2022-01-11T23:01:12Z)
MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms [82.90843777097606]
欠落データに対する因果認識型計算アルゴリズム(MIRACLE)を提案する。 MIRACLEは、欠落発生機構を同時にモデル化することにより、ベースラインの計算を反復的に洗練する。我々は、MIRACLEが一貫してイミューテーションを改善することができることを示すために、合成および様々な公開データセットに関する広範な実験を行う。
論文参考訳（メタデータ） (2021-11-04T22:38:18Z)
Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文参考訳（メタデータ） (2020-06-10T20:20:10Z)
On the Estimation of Complex Circuits Functional Failure Rate by Machine Learning Techniques [0.16311150636417257]
デレーティング(De-Rating)あるいは脆弱性要因(Vulnerability Factors)は、今日の機能的安全要件によって管理される障害分析の最大の特徴である。機械学習を用いて個々のフリップフロップの関数的デレートを推定する新しい手法が提案されている。
論文参考訳（メタデータ） (2020-02-18T15:18:31Z)
Localized Debiased Machine Learning: Efficient Inference on Quantile Treatment Effects and Beyond [69.83813153444115]
因果推論における(局所)量子化処理効果((L)QTE)の効率的な推定式を検討する。 Debiased Machine Learning (DML)は、高次元のニュアンスを推定するデータ分割手法である。本稿では、この負担のかかるステップを避けるために、局所的脱バイアス機械学習(LDML)を提案する。
論文参考訳（メタデータ） (2019-12-30T14:42:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。