論文の概要: Enhancing naive classifier for positive unlabeled data based on logistic
regression approach
- arxiv url: http://arxiv.org/abs/2306.02798v1
- Date: Mon, 5 Jun 2023 11:51:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-06 15:32:17.502194
- Title: Enhancing naive classifier for positive unlabeled data based on logistic
regression approach
- Title(参考訳): ロジスティック回帰アプローチに基づく正のラベルなしデータに対するナイーブ分類器の強化
- Authors: Mateusz P{\l}atek and Jan Mielniczuk
- Abstract要約: 我々は、Selected Completely At Random (SCAR) 仮定の下での正の未ラベルデータの解析において、問題をデータに対する不特定モデルの適合とみなすことは有益であると主張している。
このモデルに従わない観測可能なPUデータにロジスティック回帰を適合させて、応答の後続確率がロジスティック回帰によってモデル化された場合、推定されたパラメータのベクトルがパラメータの真のベクトルとほぼ同値であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We argue that for analysis of Positive Unlabeled (PU) data under Selected
Completely At Random (SCAR) assumption it is fruitful to view the problem as
fitting of misspecified model to the data. Namely, we show that the results on
misspecified fit imply that in the case when posterior probability of the
response is modelled by logistic regression, fitting the logistic regression to
the observable PU data which {\it does not} follow this model, still yields the
vector of estimated parameters approximately colinear with the true vector of
parameters. This observation together with choosing the intercept of the
classifier based on optimisation of analogue of F1 measure yields a classifier
which performs on par or better than its competitors on several real data sets
considered.
- Abstract(参考訳): 我々は、Selected Completely At Random (SCAR) 仮定の下での正の未ラベルデータの解析において、問題をデータに対する不特定モデルの適合とみなすことは有益であると主張している。
すなわち、不特定化の結果は、応答の後方確率がロジスティック回帰によってモデル化された場合、このモデルに従わない観測可能なpuデータにロジスティック回帰が当てはまる場合、パラメータの真のベクトルとほぼ同線形な推定パラメータのベクトルが得られることを示している。
この観察と、f1測度の類似の最適化に基づく分類器のインターセプトの選択は、いくつかの実データ集合において競合よりも同等以上の性能を持つ分類器を得る。
関連論文リスト
- Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Adaptive Optimization for Prediction with Missing Data [6.800113478497425]
適応線形回帰モデルの中には,命令規則と下流線形回帰モデルを同時に学習するのと等価なものもある。
ランダムにデータの欠落が強くない環境では,本手法はサンプル外精度を2~10%向上させる。
論文 参考訳(メタデータ) (2024-02-02T16:35:51Z) - On semi-supervised estimation using exponential tilt mixture models [12.347498345854715]
バイナリ応答と予測器のラベル付きデータセットと、予測器のみのラベル付きデータセットによる半教師付き設定を考えてみましょう。
半教師付き推定のために,指数傾斜混合(ETM)モデルを用いた統計的アプローチのさらなる解析と理解を開発する。
論文 参考訳(メタデータ) (2023-11-14T19:53:26Z) - TRIAGE: Characterizing and auditing training data for improved
regression [80.11415390605215]
TRIAGEは回帰タスクに適した新しいデータキャラクタリゼーションフレームワークで、広範囲の回帰器と互換性がある。
TRIAGEは、共形予測分布を利用して、モデルに依存しないスコアリング方法、TRIAGEスコアを提供する。
TRIAGEの特徴は一貫性があり、複数の回帰設定においてデータの彫刻/フィルタリングによるパフォーマンス向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-10-29T10:31:59Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Empirical Analysis of Model Selection for Heterogeneous Causal Effect Estimation [24.65301562548798]
本研究では,因果推論におけるモデル選択の問題,特に条件付き平均処理効果(CATE)の推定について検討する。
本研究では,本研究で導入されたサロゲートモデル選択指標と,本研究で導入された新しい指標のベンチマークを行う。
論文 参考訳(メタデータ) (2022-11-03T16:26:06Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - Performance of Bayesian linear regression in a model with mismatch [8.60118148262922]
本研究では,ガウス先行の対数対数対のベイズ分布の平均値から得られる推定器の性能を解析した。
この推論モデルは、スピングラスにおけるガードナーモデルのバージョンとして記述することができる。
論文 参考訳(メタデータ) (2021-07-14T18:50:13Z) - Learning from missing data with the Latent Block Model [0.5735035463793007]
本研究では、ランダムなデータに欠かせないデータを活用することを目的としたLatent Block Modelに基づくクラスタリングモデルを提案する。
予測最大化アルゴリズムを導出して推論を行い、モデル選択基準を示す。
論文 参考訳(メタデータ) (2020-10-23T08:11:43Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。