Fugu-MT 論文翻訳(概要): Class prior estimation for positive-unlabeled learning when label shift occurs

論文の概要: Class prior estimation for positive-unlabeled learning when label shift occurs

arxiv url: http://arxiv.org/abs/2502.21194v1
Date: Fri, 28 Feb 2025 16:12:53 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-03 16:38:46.035869
Title: Class prior estimation for positive-unlabeled learning when label shift occurs
Title（参考訳）: ラベルシフトが生じたときの正の未ラベル学習のクラス事前推定
Authors: Jan Mielniczuk, Wojciech Rejchel, Paweł Teisseyre,
Abstract要約: 本稿では,後部確率の推定を回避した,クラス前の新しい直接推定手法を提案する。これはカーネル埋め込みと共に分布マッチング技術に基づいており、最適化タスクの明示的な解として得られる。合成データおよび実データに対する有限サンプルの挙動について検討し,提案手法が提案手法と相まって,提案手法を比較検討した。
参考スコア（独自算出の注目度）: 1.0514231683620516
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study estimation of class prior for unlabeled target samples which is possibly different from that of source population. It is assumed that for the source data only samples from positive class and from the whole population are available (PU learning scenario). We introduce a novel direct estimator of class prior which avoids estimation of posterior probabilities and has a simple geometric interpretation. It is based on a distribution matching technique together with kernel embedding and is obtained as an explicit solution to an optimisation task. We establish its asymptotic consistency as well as a non-asymptotic bound on its deviation from the unknown prior, which is calculable in practice. We study finite sample behaviour for synthetic and real data and show that the proposal, together with a suitably modified version for large values of source prior, works on par or better than its competitors.
Abstract（参考訳）: 本研究は, 原産地と異なる可能性のある未ラベル対象試料のクラス先行推定について検討した。情報源データについては,正のクラスからのサンプルと全人口からのサンプルのみが利用可能であると仮定した(PU学習シナリオ)。本稿では, 後続確率の推定を回避し, 簡単な幾何学的解釈を有する, クラス前の新しい直接推定手法を提案する。これはカーネル埋め込みと共に分布マッチング技術に基づいており、最適化タスクの明示的な解として得られる。我々は、その漸近的一貫性と、その未知の先行から逸脱した非漸近的境界を確立し、実際は計算可能である。合成データおよび実データに対する有限サンプルの挙動を調べた結果,提案手法は,提案手法と組み合わせて,提案手法が競合相手と同等かそれ以上の精度で動作することを示す。

関連論文リスト

Quantifying Uncertainty in the Presence of Distribution Shifts [18.273290530700567]
ニューラルネットワークは正確な予測を行うが、しばしば信頼できる不確実性推定を提供することができない。我々は不確実性推定のためのベイズ的枠組みを提案する。本手法は,合成データと実世界のデータの両方で評価する。
論文参考訳（メタデータ） (2025-06-23T04:30:36Z)
Active Data Sampling and Generation for Bias Remediation [0.0]
トレーニング済みのクラスを微調整する際、不公平な分類を補うために、サンプリングとデータ生成の混合戦略が提案されている。視覚的セマンティック・ロール・ラベリングのためのDeep Modelsのケーススタディとして、提案手法は90/10の不均衡から始まるシミュレートされたジェンダーバイアスを完全に解決することができる。
論文参考訳（メタデータ） (2025-03-26T10:42:15Z)
Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文参考訳（メタデータ） (2024-04-24T09:04:36Z)
Probabilistic Contrastive Learning for Long-Tailed Visual Recognition [78.70453964041718]
細長い分布は、少数の少数派が限られた数のサンプルを含む実世界のデータにしばしば現れる。近年の研究では、教師付きコントラスト学習がデータ不均衡を緩和する有望な可能性を示していることが明らかになっている。本稿では,特徴空間の各クラスからのサンプルデータ分布を推定する確率論的コントラスト学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-03-11T13:44:49Z)
SimPro: A Simple Probabilistic Framework Towards Realistic Long-Tailed Semi-Supervised Learning [49.94607673097326]
ラベルなしデータの分散に関する前提を前提としない、高度に適応可能なフレームワークをSimProとして提案する。我々のフレームワークは確率モデルに基づいており、期待最大化アルゴリズムを革新的に洗練する。本手法は,様々なベンチマークやデータ分散シナリオにまたがる一貫した最先端性能を示す。
論文参考訳（メタデータ） (2024-02-21T03:39:04Z)
Joint empirical risk minimization for instance-dependent positive-unlabeled data [4.112909937203119]
正とラベルなしのデータ(PU学習)からの学習は、機械学習のタスクとして積極的に研究されている。目標は、ラベル付きインスタンスとラベルなしインスタンスの一部を含むデータセットに基づいて、バイナリ分類モデルをトレーニングすることだ。ラベルなし集合は、残りの部分の正と全ての負の観察を含む。
論文参考訳（メタデータ） (2023-12-27T12:45:12Z)
On diffusion-based generative models and their error bounds: The log-concave case with full convergence estimates [5.13323375365494]
我々は,強い対数対数データの下での拡散に基づく生成モデルの収束挙動を理論的に保証する。スコア推定に使用される関数のクラスは、スコア関数上のリプシッツネスの仮定を避けるために、リプシッツ連続関数からなる。この手法はサンプリングアルゴリズムにおいて最もよく知られた収束率をもたらす。
論文参考訳（メタデータ） (2023-11-22T18:40:45Z)
Learning Correspondence Uncertainty via Differentiable Nonlinear Least Squares [47.83169780113135]
特徴対応から相対ポーズ推定を行う際の不確実性を考慮した,微分可能な非線形最小二乗フレームワークを提案する。我々は、KITTIおよびEuRoC実世界のデータセットと同様に、我々の合成に対するアプローチを評価する。
論文参考訳（メタデータ） (2023-05-16T15:21:09Z)
Data thinning for convolution-closed distributions [2.299914829977005]
本稿では,観測を2つ以上の独立した部分に分割する手法であるデータ薄型化を提案する。教師なし学習手法の結果の検証には,データの薄化が有効であることを示す。
論文参考訳（メタデータ） (2023-01-18T02:47:41Z)
Learning versus Refutation in Noninteractive Local Differential Privacy [133.80204506727526]
非対話的局所差分プライバシー(LDP)における2つの基本的な統計課題について検討する。本研究の主な成果は,非対話型LDPプロトコルにおけるPAC学習の複雑さの完全な評価である。
論文参考訳（メタデータ） (2022-10-26T03:19:24Z)
Coefficient-based Regularized Distribution Regression [4.21768682940933]
我々は、確率測度から実数値応答への回帰を目的とした係数に基づく正規化分布回帰を、Hilbert空間(RKHS)上で考える。回帰関数の正則範囲が異なるアルゴリズムの漸近挙動を包括的に研究した。最適速度は、いくつかの穏やかな条件下で得られるが、これは1段のサンプル化された最小値の最適速度と一致する。
論文参考訳（メタデータ） (2022-08-26T03:46:14Z)
Open-Sampling: Exploring Out-of-Distribution data for Re-balancing Long-tailed datasets [24.551465814633325]
深層ニューラルネットワークは通常、トレーニングデータセットが極端なクラス不均衡に苦しむ場合、パフォーマンスが良くない。近年の研究では、半教師付き方式でアウト・オブ・ディストリビューションデータによる直接トレーニングが一般化性能を損なうことが報告されている。そこで我々は,オープンセットノイズラベルを用いて学習データセットのクラス前のバランスを再調整する,オープンサンプリングと呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (2022-06-17T14:29:52Z)
Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文参考訳（メタデータ） (2022-01-11T23:01:12Z)
A Stochastic Newton Algorithm for Distributed Convex Optimization [62.20732134991661]
均質な分散凸最適化のためのNewtonアルゴリズムを解析し、各マシンが同じ人口目標の勾配を計算する。提案手法は,既存の手法と比較して,性能を損なうことなく,必要な通信ラウンドの数,頻度を低減できることを示す。
論文参考訳（メタデータ） (2021-10-07T17:51:10Z)
Scalable Marginal Likelihood Estimation for Model Selection in Deep Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文参考訳（メタデータ） (2021-04-11T09:50:24Z)
Meta-Learning Conjugate Priors for Few-Shot Bayesian Optimization [0.0]
メタラーニングを用いて情報共役の事前分布の推定を自動化する新しい手法を提案する。このプロセスから、元のデータ分布の形状パラメータを推定するために、わずかなデータしか必要としない先行データを生成する。
論文参考訳（メタデータ） (2021-01-03T23:58:32Z)
Performance-Agnostic Fusion of Probabilistic Classifier Outputs [2.4206828137867107]
本稿では,1つのコンセンサスクラス予測を行うために,分類器の確率的出力を組み合わせる手法を提案する。提案手法は,精度が性能指標である状況において有効である。キャリブレーションされた確率を出力しないので、そのような確率がさらなる処理に必要となる状況には適さない。
論文参考訳（メタデータ） (2020-09-01T16:53:29Z)
Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文参考訳（メタデータ） (2020-06-22T21:12:31Z)
Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文参考訳（メタデータ） (2020-05-20T15:01:03Z)
Asymptotic Analysis of an Ensemble of Randomly Projected Linear Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文参考訳（メタデータ） (2020-04-17T12:47:04Z)
Bayesian Semi-supervised Multi-category Classification under Nonparanormality [2.307581190124002]
セミ教師付き学習はラベル付きデータとラベルなしデータの両方を使用するモデルトレーニング手法である。本稿では,任意のカテゴリ分類問題に適用可能なベイズ半教師付き学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-01-11T21:31:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。