論文の概要: Label Shift Quantification with Robustness Guarantees via Distribution
Feature Matching
- arxiv url: http://arxiv.org/abs/2306.04376v1
- Date: Wed, 7 Jun 2023 12:17:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-08 14:41:26.006925
- Title: Label Shift Quantification with Robustness Guarantees via Distribution
Feature Matching
- Title(参考訳): 分布特徴マッチングによるロバスト性保証によるラベルシフト定量化
- Authors: Bastien Dussap, Gilles Blanchard, Badr-Eddine Ch\'erief-Abdellatif
- Abstract要約: 筆者らはまず,従来の文献で導入された様々な推定器の特定の例として回復する分散特徴マッチング(DFM)の統一フレームワークを提案する。
次に、この解析を拡張し、正確なラベルシフト仮説から逸脱した不特定条件下でのDFM手順の堅牢性について検討する。
これらの理論的発見は、シミュレーションおよび実世界のデータセットに関する詳細な数値的研究によって確認される。
- 参考スコア(独自算出の注目度): 3.2013172123155615
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Quantification learning deals with the task of estimating the target label
distribution under label shift. In this paper, we first present a unifying
framework, distribution feature matching (DFM), that recovers as particular
instances various estimators introduced in previous literature. We derive a
general performance bound for DFM procedures, improving in several key aspects
upon previous bounds derived in particular cases. We then extend this analysis
to study robustness of DFM procedures in the misspecified setting under
departure from the exact label shift hypothesis, in particular in the case of
contamination of the target by an unknown distribution. These theoretical
findings are confirmed by a detailed numerical study on simulated and
real-world datasets. We also introduce an efficient, scalable and robust
version of kernel-based DFM using the Random Fourier Feature principle.
- Abstract(参考訳): 定量化学習は、ラベルシフト下の目標ラベル分布を推定するタスクを扱う。
本稿では,まず,従来の文献で導入された様々な推定器の特定の例として回復する分散特徴マッチング(DFM)について述べる。
dfmプロシージャの一般的な性能バウンドを導出し、特定のケースで導かれる以前の境界においていくつかの重要な側面を改善した。
次に、この分析を拡張して、正確なラベルシフト仮説から外れた不特定設定におけるDFM手順の堅牢性、特に未知の分布によるターゲットの汚染の場合について検討する。
これらの理論的な知見は、シミュレーションおよび実世界のデータセットに関する詳細な数値研究によって確認される。
また、Random Fourier Featureの原理を用いて、カーネルベースのDFMの効率的でスケーラブルで堅牢なバージョンも導入する。
関連論文リスト
- Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Beyond Discrepancy: A Closer Look at the Theory of Distribution Shift [27.99789694038377]
この研究は、ソースからターゲット分布への分類器の分布シフトの理論を詳しく調べる。
対象からラベル付けされていないデータだけで十分である場合と,ラベル付けされたターゲットデータが必要な場合を示す。
いずれの場合も、我々は大規模なサンプル状態において厳密な理論的保証を提供する。
論文 参考訳(メタデータ) (2024-05-29T15:00:19Z) - Continual-MAE: Adaptive Distribution Masked Autoencoders for Continual Test-Time Adaptation [49.827306773992376]
連続的テスト時間適応(CTTA)は、ソース事前学習モデルから目標分布の連続的な変化に移行するために提案される。
提案手法は,CTTAタスクの分類とセグメンテーションの両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T15:34:52Z) - MMD-based Variable Importance for Distributional Random Forest [5.0459880125089]
分布ランダムフォレスト(DRF)における変数重要度アルゴリズムを提案する。
導入された重要度尺度は一貫性があり、実データと模擬データの両方で高い経験的性能を示し、競合より優れていることを示す。
論文 参考訳(メタデータ) (2023-10-18T17:12:29Z) - Dr. FERMI: A Stochastic Distributionally Robust Fair Empirical Risk
Minimization Framework [12.734559823650887]
分散シフトが存在する場合、公正な機械学習モデルはテストデータに対して不公平に振る舞うことがある。
既存のアルゴリズムはデータへの完全なアクセスを必要とし、小さなバッチを使用する場合には使用できない。
本稿では,因果グラフの知識を必要としない収束保証付き分布安定度フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-20T23:25:28Z) - Partial sequence labeling with structured Gaussian Processes [8.239028141030621]
部分列ラベリングのための構造付きガウス過程を提案する。
予測の不確実性を符号化し、モデル選択やハイパーパラメータ学習に余分な労力を要しない。
いくつかのシーケンスラベリングタスクで評価を行い,実験結果から提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-09-20T00:56:49Z) - Robust Calibration with Multi-domain Temperature Scaling [86.07299013396059]
我々は,複数の領域からのデータを活用することで,分散シフトを処理するシステムキャリブレーションモデルを開発した。
提案手法は,分布シフト時のキャリブレーションを改善するために,領域内のロバスト性を利用する。
論文 参考訳(メタデータ) (2022-06-06T17:32:12Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Instrumental Variable-Driven Domain Generalization with Unobserved
Confounders [53.735614014067394]
ドメイン一般化(Domain Generalization, DG)は、複数のソースドメインから、目に見えないターゲットドメインをうまく一般化できるモデルを学ぶことを目的としている。
観測不能な共同創設者のバイアスを2段階学習で除去し,インストゥルメンタル変数駆動型DG法(IV-DG)を提案する。
第1段階では、あるドメインの入力特徴の条件分布を他のドメインの入力特徴の条件分布として学習する。
第2段階では,ラベルと学習条件分布の関係を推定する。
論文 参考訳(メタデータ) (2021-10-04T13:32:57Z) - A Framework for Supervised Heterogeneous Transfer Learning using Dynamic
Distribution Adaptation and Manifold Regularization [3.476077954140922]
我々は、ラベル付きトレーニングレコードがほとんどないターゲットドメインの分類器を構築する TLF というフレームワークを提案する。
我々は、構造リスク関数、領域間の結合分布、および境界分布に基づく多様体の整合性を同時に最適化することにより、分布のばらつきを処理する。
TLFを利用可能な7つの自然データセット上で評価し、TLFの性能と11の最先端技術の性能を比較した。
論文 参考訳(メタデータ) (2021-08-27T14:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。