論文の概要: Error rate control for classification rules in multiclass mixture models
- arxiv url: http://arxiv.org/abs/2109.14235v1
- Date: Wed, 29 Sep 2021 07:18:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-30 14:56:32.928878
- Title: Error rate control for classification rules in multiclass mixture models
- Title(参考訳): 多クラス混合モデルにおける分類規則の誤り率制御
- Authors: Tristan Mary-Huard (GQE-Le Moulon, MIA-Paris), Vittorio Perduca (MAP5
- UMR 8145), Gilles Blanchard (LMO, DATASHAPE), Martin-Magniette Marie-Laure
(IPS2 (UMR\_9213 / UMR\_1403), MIA-Paris)
- Abstract要約: 最適な分類規則の発見は、観測空間の最適領域を探索することにつながる。
シミュレーションと実データの両方において、FDRのような最適規則は、しきい値のMAP規則よりもはるかに保守的でない可能性があることが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the context of finite mixture models one considers the problem of
classifying as many observations as possible in the classes of interest while
controlling the classification error rate in these same classes. Similar to
what is done in the framework of statistical test theory, different type I and
type II-like classification error rates can be defined, along with their
associated optimal rules, where optimality is defined as minimizing type II
error rate while controlling type I error rate at some nominal level. It is
first shown that finding an optimal classification rule boils down to searching
an optimal region in the observation space where to apply the classical Maximum
A Posteriori (MAP) rule. Depending on the misclassification rate to be
controlled, the shape of the optimal region is provided, along with a heuristic
to compute the optimal classification rule in practice. In particular, a
multiclass FDR-like optimal rule is defined and compared to the thresholded MAP
rules that is used in most applications. It is shown on both simulated and real
datasets that the FDR-like optimal rule may be significantly less conservative
than the thresholded MAP rule.
- Abstract(参考訳): 有限混合モデルの文脈では、同じクラスにおける分類誤差率を制御しながら、興味のあるクラスにおいてできるだけ多くの観測を分類する問題を考える。
統計的テスト理論の枠組みで行われていることと同様に、異なるタイプiとタイプiiのような分類エラー率を、それらの関連する最適規則と共に定義することができ、最適性は、いくつかの名目レベルでタイプiエラー率を制御する一方で、タイプiiエラー率を最小化するものとして定義される。
まず, 最適分類規則の探索は, 古典的最大 a posteriori (map) 規則を適用する観測空間内の最適領域を探索することに帰着することを示した。
制御すべき誤分類率に応じて、最適領域の形状と、実際に最適な分類規則を計算するためのヒューリスティックが提供される。
特に、マルチクラスFDRのような最適規則が定義され、ほとんどのアプリケーションで使用される閾値付きMAP規則と比較される。
シミュレーションデータと実データの両方において、fdrのような最適規則はしきい値付きマップ規則よりも保守的でないことが示されている。
関連論文リスト
- Rule-based Data Selection for Large Language Models [9.886837013587124]
トレーニングデータの質は、大規模言語モデル(LLM)の性能に大きく影響する。
複数の人為的指標(ルール)に基づいてデータを評価・選択するためにLLMを用いた研究が増えている。
従来のルールベースのアプローチは、しばしば人間のベクトルに強く依存し、ルールを評価するための効果的な指標が欠如し、新しいタスクへの適応性が制限されている。
論文 参考訳(メタデータ) (2024-10-07T03:13:06Z) - Preference Learning Algorithms Do Not Learn Preference Rankings [62.335733662381884]
選好学習は、好ましくない出力よりも、好ましくない出力により高い確率を割り当てるようにモデルを訓練する、という従来の知恵を考察する。
多くの最先端の選好調整モデルでは、一般的な選好データセットでは60%未満のランキング精度が得られている。
論文 参考訳(メタデータ) (2024-05-29T21:29:44Z) - Post-hoc Bias Scoring Is Optimal For Fair Classification [12.897626117694317]
バイアススコアと呼ばれる新しいインスタンスレベルのバイアス尺度を導入し、修正規則は有限量のバイアススコアの上に単純な線形ルールである。
DPとEOpの制約の場合、修正規則は1つのバイアススコアをしきい値にし、EOの制約の場合、線形修正規則を2つのパラメータに適合させることが要求される。
論文 参考訳(メタデータ) (2023-10-09T13:54:08Z) - Efficient learning of large sets of locally optimal classification rules [0.0]
従来のルール学習アルゴリズムは、単純なルールの集合を見つけることを目的としており、各ルールは可能な限り多くの例をカバーする。
本稿では、この方法で発見されたルールは、それらがカバーする例のそれぞれに対して最適な説明ではないかもしれないと論じる。
本稿では,1つの特殊化ループと1つの一般化ループからなるグリーディ最適化において,各トレーニング例をカバーする最良のルールを見つけることを目的とした,効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-24T11:40:28Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Optimizing Partial Area Under the Top-k Curve: Theory and Practice [151.5072746015253]
トップk曲線下部分領域(AUTKC)と呼ばれる新しい計量法を開発した。
AUTKCはより優れた識別能力を持ち、ベイズ最適スコア関数は条件付き確率に対して正しいトップKランクを与えることができる。
提案手法を最適化するために,実証的なサロゲートリスク最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-03T11:09:13Z) - Interpretable and Fair Boolean Rule Sets via Column Generation [18.08486863429421]
整数プログラムは、規則単純性のために最適に分類精度を交換するように定式化される。
公平性の設定を考慮し、分類パリティの2つの異なる尺度に関する明示的な制約を含むように定式化を拡張した。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-11-16T13:40:28Z) - When in Doubt: Improving Classification Performance with Alternating
Normalization [57.39356691967766]
分類のための非パラメトリック後処理ステップである交互正規化(CAN)を用いた分類を導入する。
CANは、予測されたクラス確率分布を再調整することで、挑戦的な例の分類精度を向上させる。
多様な分類課題にまたがってその効果を実証的に示す。
論文 参考訳(メタデータ) (2021-09-28T02:55:42Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z) - Self-Weighted Robust LDA for Multiclass Classification with Edge Classes [111.5515086563592]
SWRLDAと呼ばれる,l21ノルムを基準とした新しい自己重み付き頑健なLDAを提案する。
提案するSWRLDAは実装が容易で,実際に高速に収束する。
論文 参考訳(メタデータ) (2020-09-24T12:32:55Z) - Multiclass Classification via Class-Weighted Nearest Neighbors [10.509405690286176]
マルチクラス分類のためのk-アネレスト近傍アルゴリズムの統計特性について検討する。
我々は, 精度, クラス重み付きリスク, 均一誤差に基づいて, 上限値と最小値の下位境界を導出する。
論文 参考訳(メタデータ) (2020-04-09T17:50:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。