論文の概要: Reweighting samples under covariate shift using a Wasserstein distance
criterion
- arxiv url: http://arxiv.org/abs/2010.09267v2
- Date: Tue, 7 Jun 2022 08:09:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 23:10:43.085774
- Title: Reweighting samples under covariate shift using a Wasserstein distance
criterion
- Title(参考訳): ワッサーシュタイン距離基準を用いた共変量シフト下の再加重試料
- Authors: Julien Reygner (CERMICS, GdR MASCOT-NUM), Adrien Touboul (CERMICS, IRT
SystemX)
- Abstract要約: 両試料の実験的測度間のワッサーシュタイン距離を最小化する最適再重み付けについて検討した。
期待されるワッサーシュタイン距離の一貫性とある程度の収束速度が導出される。
これらの結果は、不確実性定量化を非結合推定に適用し、最近近傍回帰に対する一般化誤差の有界化に適用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Considering two random variables with different laws to which we only have
access through finite size iid samples, we address how to reweight the first
sample so that its empirical distribution converges towards the true law of the
second sample as the size of both samples goes to infinity. We study an optimal
reweighting that minimizes the Wasserstein distance between the empirical
measures of the two samples, and leads to an expression of the weights in terms
of Nearest Neighbors. The consistency and some asymptotic convergence rates in
terms of expected Wasserstein distance are derived, and do not need the
assumption of absolute continuity of one random variable with respect to the
other. These results have some application in Uncertainty Quantification for
decoupled estimation and in the bound of the generalization error for the
Nearest Neighbor Regression under covariate shift.
- Abstract(参考訳): 有限サイズの iid サンプルを通してのみアクセス可能な異なる 2 つの確率変数を考えると、その経験的分布が 2 つのサンプルのサイズが無限になるにつれて 2 番目のサンプルの真の法則に収束するように、最初のサンプルを再重み付けする方法を考える。
本研究では,2つの試料の実験的測定値間のwasserstein距離を最小化する最適重み付け法について検討し,最寄りの近傍における重みの表現を導出する。
期待されるワッサーシュタイン距離の点における一貫性と漸近収束速度は導出され、一方の確率変数の絶対連続性の仮定を他方に対して必要としない。
これらの結果は,共変量シフト下での非結合推定と最近傍回帰の一般化誤差の境界に対する不確実性定量化に応用できる。
関連論文リスト
- Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - TIC-TAC: A Framework for Improved Covariance Estimation in Deep Heteroscedastic Regression [109.69084997173196]
奥行き回帰は、予測分布の平均と共分散を負の対数類似度を用いて共同最適化する。
近年の研究では, 共分散推定に伴う課題により, 準最適収束が生じる可能性が示唆されている。
1)予測共分散は予測平均のランダム性を真に捉えているか?
その結果, TICは共分散を正確に学習するだけでなく, 負の対数類似性の収束性の向上も促進することがわかった。
論文 参考訳(メタデータ) (2023-10-29T09:54:03Z) - Restoration-Degradation Beyond Linear Diffusions: A Non-Asymptotic
Analysis For DDIM-Type Samplers [90.45898746733397]
本研究では拡散生成モデルに用いる決定論的サンプリング器の非漸近解析のためのフレームワークを開発する。
確率フローODEに沿った1ステップは,1) 条件付き対数線上を無限に先行して上昇する回復ステップ,2) 雑音を現在の勾配に向けて前向きに進行する劣化ステップの2段階で表すことができる。
論文 参考訳(メタデータ) (2023-03-06T18:59:19Z) - Mean-Square Analysis of Discretized It\^o Diffusions for Heavy-tailed
Sampling [17.415391025051434]
重み付きポインカーの不等式に関連する伊藤拡散の自然クラスを離散化することにより、重み付き分布のクラスからのサンプリングの複雑さを分析する。
平均二乗解析に基づいて、ワッサーシュタイン2計量のターゲット分布に近い分布が$epsilon$のサンプルを得るための反復複雑性を確立する。
論文 参考訳(メタデータ) (2023-03-01T15:16:03Z) - Optimal 1-Wasserstein Distance for WGANs [2.1174215880331775]
有限標本とレジームの両方において、WGAN(Wasserstein GANs)を徹底的に解析する。
半離散状態における最適輸送理論の新たな結果を導出する。
論文 参考訳(メタデータ) (2022-01-08T13:04:03Z) - Nearest neighbor empirical processes [7.034466417392574]
近辺から所与の点$x$への応答に基づく実証測度を導入し、中央統計量として研究する。
均一な非漸近境界は、一様エントロピー数上でよく知られた条件の下で成立し、しばしばVapnik-Chervonenkis (Vapnik-Chervonenkis) と呼ばれる。
これは、標準公式を用いて、全データの代わりに最も近い隣人だけを用いて分散を推定できる可能性を示唆している。
論文 参考訳(メタデータ) (2021-10-27T08:15:20Z) - Continuous Wasserstein-2 Barycenter Estimation without Minimax
Optimization [94.18714844247766]
ワッサーシュタイン・バリセンターは、最適輸送に基づく確率測度の重み付き平均の幾何学的概念を提供する。
本稿では,Wasserstein-2 バリセンタのサンプルアクセスを演算するスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-02T21:01:13Z) - Minimax Optimal Estimation of KL Divergence for Continuous Distributions [56.29748742084386]
Kullback-Leibler の同一および独立に分布するサンプルからの発散は、様々な領域において重要な問題である。
単純で効果的な推定器の1つは、これらのサンプル間の近辺 k に基づいている。
論文 参考訳(メタデータ) (2020-02-26T16:37:37Z) - Posterior Ratio Estimation of Latent Variables [14.619879849533662]
いくつかのアプリケーションでは、観測から無視される確率変数の分布を比較したい。
潜在変数の2つの後続確率密度関数の比を推定する問題について検討する。
論文 参考訳(メタデータ) (2020-02-15T16:46:42Z) - Estimating Gradients for Discrete Random Variables by Sampling without
Replacement [93.09326095997336]
我々は、置換のないサンプリングに基づいて、離散確率変数に対する期待値の偏りのない推定器を導出する。
推定器は3つの異なる推定器のラオ・ブラックウェル化として導出可能であることを示す。
論文 参考訳(メタデータ) (2020-02-14T14:15:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。