論文の概要: Continuous Sweep for Binary Quantification Learning
- arxiv url: http://arxiv.org/abs/2308.08387v2
- Date: Fri, 11 Oct 2024 14:27:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-14 13:29:55.499816
- Title: Continuous Sweep for Binary Quantification Learning
- Title(参考訳): バイナリ量子化学習のための連続スウィープ
- Authors: Kevin Kloos, Julian D. Karch, Quinten A. Meertens, Mark de Rooij,
- Abstract要約: Continuous SweepはMedian Sweepにインスパイアされた新しいパラメトリックバイナリ量子化器である。
本研究は,連続スウィープが分類群,数群,正則群の量化器より優れていることを示す3つのシミュレーション研究である。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: A quantifier is a supervised machine learning algorithm, focused on estimating the class prevalence in a dataset rather than labeling its individual observations. We introduce Continuous Sweep, a new parametric binary quantifier inspired by the well-performing Median Sweep, which is an ensemble method based on Adjusted Count estimators. We modified two aspects of Median Sweep: 1) using parametric class distributions instead of empirical distributions for the true and false positive rate; 2) using the mean instead of the median of a set of Adjusted Count estimates. These two modifications allow for a theoretical analysis of the bias and variance of Continuous Sweep. Furthermore, the expressions of bias and variance can be used to define optimal decision boundaries of the set of Adjusted count estimates to be used in the ensemble. We show in three simulation studies that Continuous Sweep outperforms the quantifiers in the group Classify, Count, and Correct, including Median Sweep, and is competitive with the two best quantifiers from the group Distribution Matchers. Also an empirical data set is analysed with these quantifiers showing similar performances.
- Abstract(参考訳): 量化器は教師付き機械学習アルゴリズムであり、個々の観測をラベル付けするのではなく、データセット内のクラス頻度を推定することに焦点を当てている。
調整数推定器をベースとしたアンサンブル手法であるContinuous Sweepを導入する。
私たちはMedian Sweepの2つの側面を修正した。
1) 真偽陽性率の実証的分布の代わりにパラメトリッククラス分布を用いる。
2) 調整された数の推定値の中央値の代わりに平均を使用する。
これらの2つの修正は、連続したスウィープのバイアスと分散の理論的な分析を可能にする。
さらに、バイアスと分散の表現は、アンサンブルで使用される調整されたカウント推定のセットの最適決定境界を定義するために使用することができる。
本研究は, グループ分類, カウント, 正解の定量化に優れ, グループ分布整合器の2つの最適な定量化器と競合することを示す。
また、同様の性能を示すこれらの量化器を用いて経験的データセットを分析する。
関連論文リスト
- Transductive conformal inference with adaptive scores [3.591224588041813]
トランスダクティブな設定では、テストのサンプルとして$m$の新たなポイントが決定されます。
本研究はP'olya urnモデルに従い, 実験分布関数の濃度不等式を確立することを目的とする。
本研究では,2つの機械学習タスクに対して一様かつ不確率な保証を行うことにより,これらの理論的結果の有用性を示す。
論文 参考訳(メタデータ) (2023-10-27T12:48:30Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Regularized Vector Quantization for Tokenized Image Synthesis [126.96880843754066]
画像の離散表現への量子化は、統合生成モデリングにおける根本的な問題である。
決定論的量子化は、厳しいコードブックの崩壊と推論段階の誤調整に悩まされ、一方、量子化は、コードブックの利用率の低下と再構築の目的に悩まされる。
本稿では、2つの視点から正規化を適用することにより、上記の問題を効果的に緩和できる正規化ベクトル量子化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-11T15:20:54Z) - Bayesian Quantification with Black-Box Estimators [1.599072005190786]
調整された分類と数、ブラックボックスシフト推定器、不変比推定器などのアプローチでは、クラス分布を推定し、弱い仮定の下で保証を得る補助的(および潜在的に偏りのある)ブラックボックス分類器を用いる。
これら全てのアルゴリズムが特定のベイズ連鎖モデルにおける推論と密接に関連していることを示し、仮定された基底構造生成過程を近似する。
次に,導入モデルに対する効率的なマルコフ・モンテカルロサンプリング手法について検討し,大容量データ限界における一貫性の保証を示す。
論文 参考訳(メタデータ) (2023-02-17T22:10:04Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - Minimising quantifier variance under prior probability shift [2.1320960069210475]
テストデータセットの分布における特徴に対して,クラスラベルの回帰に対するブライアスコアの関数であることが判明した。
この観察結果から,学習データセット上での基底分類器の精度の最適化は,テストデータセット上での関連量化器のばらつきを低減するのに役立つことが示唆された。
論文 参考訳(メタデータ) (2021-07-17T09:28:06Z) - Large Non-Stationary Noisy Covariance Matrices: A Cross-Validation
Approach [1.90365714903665]
金融時系列のヘテロシデスティックな性質を利用する新しい共分散推定器を提案する。
断面次元と時系列次元の両方のノイズを減衰させることにより、我々は、競合する推定器に対する推定器の優位性を実証的に実証する。
論文 参考訳(メタデータ) (2020-12-10T15:41:17Z) - Coupled regularized sample covariance matrix estimator for multiple
classes [14.41703014203756]
正規化のための2つの異なるターゲット行列を結合した多クラス問題に対する正規化SCM (RSCM) 推定器を検討する。
推定器のMSE最適チューニングパラメータを導出し,その推定法を提案する。
提案した結合RSCMのMSE性能をシミュレーションおよび実データに基づく正規化判別分析(RDA)分類で評価する。
論文 参考訳(メタデータ) (2020-11-09T10:39:53Z) - Distribution-free binary classification: prediction sets, confidence
intervals and calibration [106.50279469344937]
分布自由条件における二項分類のための不確実性定量化(キャリブレーション、信頼区間、予測セット)の3つの概念について検討する。
固定幅と一様質量の両双対の双対確率に対する信頼区間を導出する。
我々の「三脚」定理の結果として、双有理確率に対するこれらの信頼区間は分布自由キャリブレーションに繋がる。
論文 参考訳(メタデータ) (2020-06-18T14:17:29Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。