論文の概要: Task-Agnostic Machine-Learning-Assisted Inference
- arxiv url: http://arxiv.org/abs/2405.20039v3
- Date: Thu, 31 Oct 2024 03:24:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-01 09:54:48.188837
- Title: Task-Agnostic Machine-Learning-Assisted Inference
- Title(参考訳): タスク非依存型機械学習支援推論
- Authors: Jiacheng Miao, Qiongshi Lu,
- Abstract要約: タスクに依存しないML支援推論のためのPSPSという新しい統計フレームワークを提案する。
PSPSは、ほぼすべての確立したデータ分析ルーチンに簡単にプラグインできる予測後推論ソリューションを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Machine learning (ML) is playing an increasingly important role in scientific research. In conjunction with classical statistical approaches, ML-assisted analytical strategies have shown great promise in accelerating research findings. This has also opened a whole field of methodological research focusing on integrative approaches that leverage both ML and statistics to tackle data science challenges. One type of study that has quickly gained popularity employs ML to predict unobserved outcomes in massive samples, and then uses predicted outcomes in downstream statistical inference. However, existing methods designed to ensure the validity of this type of post-prediction inference are limited to very basic tasks such as linear regression analysis. This is because any extension of these approaches to new, more sophisticated statistical tasks requires task-specific algebraic derivations and software implementations, which ignores the massive library of existing software tools already developed for the same scientific problem given observed data. This severely constrains the scope of application for post-prediction inference. To address this challenge, we introduce a novel statistical framework named PSPS for task-agnostic ML-assisted inference. It provides a post-prediction inference solution that can be easily plugged into almost any established data analysis routines. It delivers valid and efficient inference that is robust to arbitrary choice of ML model, allowing nearly all existing statistical frameworks to be incorporated into the analysis of ML-predicted data. Through extensive experiments, we showcase our method's validity, versatility, and superiority compared to existing approaches. Our software is available at https://github.com/qlu-lab/psps.
- Abstract(参考訳): 機械学習(ML)は、科学研究においてますます重要な役割を担っている。
古典的な統計的アプローチと合わせて、ML支援分析戦略は、研究成果の加速に大きな可能性を示唆している。
これはまた、データサイエンスの課題に取り組むためにMLと統計の両方を活用する統合的アプローチに焦点を当てた方法論研究の分野全体を開いた。
人気を急速に高めた研究の1つは、大量のサンプルで観測されていない結果を予測するためにMLを使用し、下流の統計的推測で予測結果を使用する。
しかし、この種の予測後の推論の有効性を保証するために設計された既存の手法は、線形回帰解析のような非常に基本的なタスクに限られている。
これは、新しいより洗練された統計タスクへのこれらのアプローチの拡張には、タスク固有の代数的導出とソフトウェア実装が必要であるためであり、観測されたデータと同じ科学的問題のために既に開発された既存のソフトウェアツールの膨大なライブラリを無視している。
これは、予測後推論の適用範囲を厳しく制限する。
この課題に対処するために,タスクに依存しないML支援推論のためのPSPSという新しい統計フレームワークを導入する。
これは、ほぼすべての確立したデータ分析ルーチンに簡単にプラグインできる、予測後推論ソリューションを提供する。
MLモデルの任意の選択に対して堅牢な有効かつ効率的な推論を提供し、ほぼすべての既存の統計フレームワークをML予測データの解析に組み込むことができる。
実験により,提案手法の妥当性,汎用性,既存手法と比較して優越性を実証した。
私たちのソフトウェアはhttps://github.com/qlu-lab/psps.comから入手可能です。
関連論文リスト
- Leveraging Machine Learning for Official Statistics: A Statistical Manifesto [0.0]
統計的厳密な機械学習を適用することは、公式統計生産にとって重要である。
The Total Machine Learning Error (TMLE)は、調査手法で使用されるTotal Survey Error Modelに類似したフレームワークとして提示される。
論文 参考訳(メタデータ) (2024-09-06T15:57:25Z) - Measuring Variable Importance in Individual Treatment Effect Estimation with High Dimensional Data [35.104681814241104]
因果機械学習(ML)は、個々の治療効果を推定するための強力なツールを提供する。
ML手法は、医療応用にとって重要な解釈可能性の重要な課題に直面している。
統計的に厳密な変数重要度評価のための条件置換重要度(CPI)法に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-23T11:44:07Z) - Statistical Agnostic Regression: a machine learning method to validate regression models [0.0]
本稿では,機械学習に基づく線形回帰モデルの統計的意義を評価するために,統計的回帰(Agnostic Regression, SAR)を導入する。
我々は、説明的(機能)変数と反応(ラベル)変数の間の集団における線形関係の存在を結論付けるために、少なくとも1-eta$の確率で十分な証拠が存在することを保証するしきい値を定義する。
論文 参考訳(メタデータ) (2024-02-23T09:19:26Z) - Assumption-Lean and Data-Adaptive Post-Prediction Inference [1.5050365268347254]
本稿では,ML予測データに基づく有効かつ強力な推論を可能にするPoSt-Prediction Adaptive Inference (PSPA)を提案する。
シミュレーションと実データによる手法の統計的優位性と適用性を示す。
論文 参考訳(メタデータ) (2023-11-23T22:41:30Z) - Statistical inference using machine learning and classical techniques
based on accumulated local effects (ALE) [0.0]
Accumulated Local Effects (ALE) は、機械学習アルゴリズムのグローバルな説明のためのモデルに依存しないアプローチである。
ALEに基づく統計的推論を行うには,少なくとも3つの課題がある。
ALEを用いた統計的推論のための革新的なツールと技術を紹介する。
論文 参考訳(メタデータ) (2023-10-15T16:17:21Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Hessian-based toolbox for reliable and interpretable machine learning in
physics [58.720142291102135]
本稿では,モデルアーキテクチャの解釈可能性と信頼性,外挿を行うためのツールボックスを提案する。
与えられたテストポイントでの予測に対する入力データの影響、モデル予測の不確実性の推定、およびモデル予測の不可知スコアを提供する。
我々の研究は、物理学やより一般的には科学に適用されたMLにおける解釈可能性と信頼性の方法の体系的利用への道を開く。
論文 参考訳(メタデータ) (2021-08-04T16:32:59Z) - MAML is a Noisy Contrastive Learner [72.04430033118426]
モデルに依存しないメタラーニング(MAML)は、今日では最も人気があり広く採用されているメタラーニングアルゴリズムの1つである。
我々は、MAMLの動作メカニズムに対する新たな視点を提供し、以下に示すように、MAMLは、教師付きコントラスト目的関数を用いたメタラーナーに類似している。
このような干渉を軽減するため, 単純だが効果的な手法であるゼロ化手法を提案する。
論文 参考訳(メタデータ) (2021-06-29T12:52:26Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Estimating Structural Target Functions using Machine Learning and
Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文 参考訳(メタデータ) (2020-08-14T16:48:29Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。