論文の概要: Boosted Control Functions
- arxiv url: http://arxiv.org/abs/2310.05805v1
- Date: Mon, 9 Oct 2023 15:43:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-11 06:37:24.637489
- Title: Boosted Control Functions
- Title(参考訳): ブースト制御機能
- Authors: Nicola Gnecco, Jonas Peters, Sebastian Engelke, and Niklas Pfister
- Abstract要約: 本研究の目的は,因果効果推定と予測タスクのギャップを埋めることである。
我々は,機械学習の分布場と同時方程式モデル,およびエコノメティクスの制御関数との新たな接続を確立する。
このフレームワーク内では、予測モデルに対する不変性の強い概念を提案し、それを既存の(ウィーカー)バージョンと比較する。
- 参考スコア(独自算出の注目度): 10.503777692702952
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern machine learning methods and the availability of large-scale data
opened the door to accurately predict target quantities from large sets of
covariates. However, existing prediction methods can perform poorly when the
training and testing data are different, especially in the presence of hidden
confounding. While hidden confounding is well studied for causal effect
estimation (e.g., instrumental variables), this is not the case for prediction
tasks. This work aims to bridge this gap by addressing predictions under
different training and testing distributions in the presence of unobserved
confounding. In particular, we establish a novel connection between the field
of distribution generalization from machine learning, and simultaneous equation
models and control function from econometrics. Central to our contribution are
simultaneous equation models for distribution generalization (SIMDGs) which
describe the data-generating process under a set of distributional shifts.
Within this framework, we propose a strong notion of invariance for a
predictive model and compare it with existing (weaker) versions. Building on
the control function approach from instrumental variable regression, we propose
the boosted control function (BCF) as a target of inference and prove its
ability to successfully predict even in intervened versions of the underlying
SIMDG. We provide necessary and sufficient conditions for identifying the BCF
and show that it is worst-case optimal. We introduce the ControlTwicing
algorithm to estimate the BCF and analyze its predictive performance on
simulated and real world data.
- Abstract(参考訳): 現代の機械学習手法と大規模データの利用可能性は、大量の共変量からターゲット量を正確に予測するための扉を開いた。
しかしながら、既存の予測手法は、トレーニングやテストデータが異なる場合、特に隠れたコンファウンドが存在する場合、うまくいかない可能性がある。
隠れコンバウンディングは因果効果推定(例えば器用変数)のためによく研究されているが、予測タスクではそうではない。
この研究は、異なるトレーニングの下での予測に対処することで、このギャップを埋めることを目的としている。
特に,機械学習からの分布一般化の分野と,econometrics からの同時方程式モデルと制御関数との新たな関係性を確立する。
我々の貢献の中心は、分散一般化(SIMDG)のための同時方程式モデルであり、分散シフトの集合の下でデータ生成過程を記述する。
このフレームワーク内では、予測モデルに対する不変性の強い概念を提案し、既存の(ウィーカー)バージョンと比較する。
インスツルメンタル変数回帰からの制御関数アプローチに基づいて,推測対象として強化制御関数(BCF)を提案し,基礎となるSIMDGのインターベンションバージョンにおいても,その予測に成功していることを示す。
我々は,BCFの同定に必要かつ十分な条件を提供し,最悪の場合,最適であることを示す。
シミュレーションおよび実世界のデータに基づいて,BCFを推定し,予測性能を解析する制御Twicingアルゴリズムを提案する。
関連論文リスト
- On conditional diffusion models for PDE simulations [53.01911265639582]
スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-10-21T18:31:04Z) - Structured Radial Basis Function Network: Modelling Diversity for
Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。
構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。
この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文 参考訳(メタデータ) (2023-09-02T01:27:53Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Probabilistic electric load forecasting through Bayesian Mixture Density
Networks [70.50488907591463]
確率的負荷予測(PLF)は、スマートエネルギーグリッドの効率的な管理に必要な拡張ツールチェーンの重要なコンポーネントです。
ベイジアン混合密度ネットワークを枠とした新しいPLFアプローチを提案する。
後方分布の信頼性と計算にスケーラブルな推定を行うため,平均場変動推定と深層アンサンブルを統合した。
論文 参考訳(メタデータ) (2020-12-23T16:21:34Z) - Robust Validation: Confident Predictions Even When Distributions Shift [19.327409270934474]
本稿では,モデルが点予測ではなく,その予測に対して不確実な推定を行うような,頑健な予測推論の手順について述べる。
本稿では, トレーニング集団の周囲に$f$-divergence のボールを用いて, 任意のテスト分布に対して適切なカバレッジレベルを与える予測セットを生成する手法を提案する。
私たちの方法論の重要な構成要素は、将来のデータシフトの量を見積り、それに対する堅牢性を構築することです。
論文 参考訳(メタデータ) (2020-08-10T17:09:16Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - A comprehensive study on the prediction reliability of graph neural
networks for virtual screening [0.0]
本稿では,モデルアーキテクチャ,正規化手法,損失関数が分類結果の予測性能および信頼性に与える影響について検討する。
その結果,高い成功率を達成するためには,正則化と推論手法の正しい選択が重要であることが明らかとなった。
論文 参考訳(メタデータ) (2020-03-17T10:13:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。