論文の概要: Robust Correction of Sampling Bias Using Cumulative Distribution
Functions
- arxiv url: http://arxiv.org/abs/2010.12687v1
- Date: Fri, 23 Oct 2020 22:13:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 22:15:45.445514
- Title: Robust Correction of Sampling Bias Using Cumulative Distribution
Functions
- Title(参考訳): 累積分布関数を用いたサンプリングバイアスのロバスト補正
- Authors: Bijan Mazaheri, Siddharth Jain, Jehoshua Bruck
- Abstract要約: 変数ドメインとバイアス付きデータセットは、トレーニングとターゲット分布の違いにつながる可能性がある。
これを緩和するための現在のアプローチは、しばしばトレーニングとターゲット確率密度関数の比率を推定することに依存する。
- 参考スコア(独自算出の注目度): 19.551668880584973
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Varying domains and biased datasets can lead to differences between the
training and the target distributions, known as covariate shift. Current
approaches for alleviating this often rely on estimating the ratio of training
and target probability density functions. These techniques require parameter
tuning and can be unstable across different datasets. We present a new method
for handling covariate shift using the empirical cumulative distribution
function estimates of the target distribution by a rigorous generalization of a
recent idea proposed by Vapnik and Izmailov. Further, we show experimentally
that our method is more robust in its predictions, is not reliant on parameter
tuning and shows similar classification performance compared to the current
state-of-the-art techniques on synthetic and real datasets.
- Abstract(参考訳): 変数ドメインとバイアス付きデータセットは、コバリアントシフト(covariate shift)として知られる、トレーニングとターゲット分布の違いにつながる可能性がある。
これを緩和するための現在のアプローチは、しばしばトレーニングとターゲット確率密度関数の比率を推定することに依存する。
これらのテクニックはパラメータチューニングを必要とし、異なるデータセット間で不安定になる可能性がある。
本稿では,vapnik とizmailov が提唱した最近のアイデアの厳密な一般化による目標分布の累積分布関数推定を用いた共変量シフトの処理法を提案する。
さらに,本手法は予測においてより堅牢であり,パラメータチューニングに依存しないことを示すとともに,合成および実データセットの最先端技術と類似した分類性能を示す。
関連論文リスト
- Diffusion Model With Optimal Covariance Matching [27.2761325416843]
我々は,最近提案された完全共分散モーメントマッチング手法を活用し,共分散を学習するための新しい手法を提案する。
本手法は,非マルコフ拡散モデルファミリと非マルコフ拡散モデルファミリのサンプリング効率を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2024-06-16T05:47:12Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Uncertainty Quantification via Stable Distribution Propagation [60.065272548502]
本稿では,ニューラルネットワークによる安定確率分布の伝播手法を提案する。
提案手法は局所線形化に基づいており,ReLU非線型性に対する全変動距離の近似値として最適であることを示す。
論文 参考訳(メタデータ) (2024-02-13T09:40:19Z) - Supervised Contrastive Learning with Heterogeneous Similarity for
Distribution Shifts [3.7819322027528113]
本稿では,教師付きコントラスト学習を用いた新たな正規化手法を提案する。
サブポピュレーションシフトや領域一般化などの分布シフトをエミュレートするベンチマークデータセットの実験は,提案手法の利点を実証している。
論文 参考訳(メタデータ) (2023-04-07T01:45:09Z) - Adaptive Dimension Reduction and Variational Inference for Transductive
Few-Shot Classification [2.922007656878633]
適応次元の削減によりさらに改善された変分ベイズ推定に基づく新しいクラスタリング法を提案する。
提案手法は,Few-Shotベンチマークにおける現実的非バランスなトランスダクティブ設定の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2022-09-18T10:29:02Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Predicting with Confidence on Unseen Distributions [90.68414180153897]
ドメイン適応と予測不確実性文学を結びつけて、挑戦的な未知分布のモデル精度を予測する。
分類器の予測における信頼度(DoC)の差は,様々な変化に対して,分類器の性能変化を推定することに成功した。
具体的には, 合成分布と自然分布の区別について検討し, その単純さにもかかわらず, DoCは分布差の定量化に優れることを示した。
論文 参考訳(メタデータ) (2021-07-07T15:50:18Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z) - Beyond the Mean-Field: Structured Deep Gaussian Processes Improve the
Predictive Uncertainties [12.068153197381575]
高速収束を達成しつつ、潜在過程間の共分散を維持できる新しい変分族を提案する。
新しいアプローチの効率的な実装を提供し、それをいくつかのベンチマークデータセットに適用します。
優れた結果をもたらし、最先端の代替品よりも精度とキャリブレーションされた不確実性推定とのバランスが良くなる。
論文 参考訳(メタデータ) (2020-05-22T11:10:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。