論文の概要: Continuous Sweep: an improved, binary quantifier
- arxiv url: http://arxiv.org/abs/2308.08387v1
- Date: Wed, 16 Aug 2023 14:18:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-17 13:16:54.741090
- Title: Continuous Sweep: an improved, binary quantifier
- Title(参考訳): Continuous Sweep: 改善されたバイナリ量化器
- Authors: Kevin Kloos, Julian D. Karch, Quinten A. Meertens, Mark de Rooij
- Abstract要約: Continuous SweepはMedian Sweepにインスパイアされた新しいパラメトリックバイナリ量子化器である。
一般的なモデル仮定の下で連続スウィープのバイアスと分散に関する解析式を導出する。
シミュレーション研究により, 連続スウィープは幅広い状況でメディアスウィープより優れていたことが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quantification is a supervised machine learning task, focused on estimating
the class prevalence of a dataset rather than labeling its individual
observations. We introduce Continuous Sweep, a new parametric binary quantifier
inspired by the well-performing Median Sweep. Median Sweep is currently one of
the best binary quantifiers, but we have changed this quantifier on three
points, namely 1) using parametric class distributions instead of empirical
distributions, 2) optimizing decision boundaries instead of applying discrete
decision rules, and 3) calculating the mean instead of the median. We derive
analytic expressions for the bias and variance of Continuous Sweep under
general model assumptions. This is one of the first theoretical contributions
in the field of quantification learning. Moreover, these derivations enable us
to find the optimal decision boundaries. Finally, our simulation study shows
that Continuous Sweep outperforms Median Sweep in a wide range of situations.
- Abstract(参考訳): 量子化は教師付き機械学習タスクであり、個々の観察をラベル付けするのではなく、データセットのクラス有病率を推定することに焦点を当てている。
本研究では,メディアスウィープに触発された新しいパラメトリックバイナリ量子化器であるContinuous Sweepを紹介する。
Median Sweepは現在、最高のバイナリ量子化器の1つですが、この量化器を3つの点で変更しました。
1) 経験分布の代わりにパラメトリック類分布を用いる。
2)個別決定ルールを適用せず、決定境界を最適化すること。
3)中央値の代わりに平均を計算する。
一般モデル仮定の下で連続スイープのバイアスと分散に対する解析式を導出する。
これは量子化学習の分野における最初の理論的貢献の1つである。
さらに、これらの導出により最適な決定境界を見つけることができる。
最後に、シミュレーション研究により、Continuous Sweepは幅広い状況でMedian Sweepより優れていることが示された。
関連論文リスト
- Transductive conformal inference with adaptive scores [3.591224588041813]
トランスダクティブな設定では、テストのサンプルとして$m$の新たなポイントが決定されます。
本研究はP'olya urnモデルに従い, 実験分布関数の濃度不等式を確立することを目的とする。
本研究では,2つの機械学習タスクに対して一様かつ不確率な保証を行うことにより,これらの理論的結果の有用性を示す。
論文 参考訳(メタデータ) (2023-10-27T12:48:30Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Regularized Vector Quantization for Tokenized Image Synthesis [126.96880843754066]
画像の離散表現への量子化は、統合生成モデリングにおける根本的な問題である。
決定論的量子化は、厳しいコードブックの崩壊と推論段階の誤調整に悩まされ、一方、量子化は、コードブックの利用率の低下と再構築の目的に悩まされる。
本稿では、2つの視点から正規化を適用することにより、上記の問題を効果的に緩和できる正規化ベクトル量子化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-11T15:20:54Z) - Bayesian Quantification with Black-Box Estimators [1.599072005190786]
調整された分類と数、ブラックボックスシフト推定器、不変比推定器などのアプローチでは、クラス分布を推定し、弱い仮定の下で保証を得る補助的(および潜在的に偏りのある)ブラックボックス分類器を用いる。
これら全てのアルゴリズムが特定のベイズ連鎖モデルにおける推論と密接に関連していることを示し、仮定された基底構造生成過程を近似する。
次に,導入モデルに対する効率的なマルコフ・モンテカルロサンプリング手法について検討し,大容量データ限界における一貫性の保証を示す。
論文 参考訳(メタデータ) (2023-02-17T22:10:04Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - Minimising quantifier variance under prior probability shift [2.1320960069210475]
テストデータセットの分布における特徴に対して,クラスラベルの回帰に対するブライアスコアの関数であることが判明した。
この観察結果から,学習データセット上での基底分類器の精度の最適化は,テストデータセット上での関連量化器のばらつきを低減するのに役立つことが示唆された。
論文 参考訳(メタデータ) (2021-07-17T09:28:06Z) - Large Non-Stationary Noisy Covariance Matrices: A Cross-Validation
Approach [1.90365714903665]
金融時系列のヘテロシデスティックな性質を利用する新しい共分散推定器を提案する。
断面次元と時系列次元の両方のノイズを減衰させることにより、我々は、競合する推定器に対する推定器の優位性を実証的に実証する。
論文 参考訳(メタデータ) (2020-12-10T15:41:17Z) - Coupled regularized sample covariance matrix estimator for multiple
classes [14.41703014203756]
正規化のための2つの異なるターゲット行列を結合した多クラス問題に対する正規化SCM (RSCM) 推定器を検討する。
推定器のMSE最適チューニングパラメータを導出し,その推定法を提案する。
提案した結合RSCMのMSE性能をシミュレーションおよび実データに基づく正規化判別分析(RDA)分類で評価する。
論文 参考訳(メタデータ) (2020-11-09T10:39:53Z) - Distribution-free binary classification: prediction sets, confidence
intervals and calibration [106.50279469344937]
分布自由条件における二項分類のための不確実性定量化(キャリブレーション、信頼区間、予測セット)の3つの概念について検討する。
固定幅と一様質量の両双対の双対確率に対する信頼区間を導出する。
我々の「三脚」定理の結果として、双有理確率に対するこれらの信頼区間は分布自由キャリブレーションに繋がる。
論文 参考訳(メタデータ) (2020-06-18T14:17:29Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。