論文の概要: LxCIM: a new rank-based binary classifier performance metric invariant to local exchange of classes
- arxiv url: http://arxiv.org/abs/2512.10053v1
- Date: Wed, 10 Dec 2025 20:18:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.047858
- Title: LxCIM: a new rank-based binary classifier performance metric invariant to local exchange of classes
- Title(参考訳): LxCIM:クラス局所交換に不変な新しいランクベースのバイナリ分類器性能指標
- Authors: Tiago Brogueira, Mário A. T. Figueiredo,
- Abstract要約: 本稿では,LxCIMを用いてバイナリ分類問題を評価する方法について述べる。
ランクベースであり、クラスを局所的に交換する際に不変である。
LxCIMはAUROC、精度、精度決定率曲線(AUDRC)の領域と明確な理論的関係を示す
- 参考スコア(独自算出の注目度): 2.1986675261317163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Binary classification is one of the oldest, most prevalent, and studied problems in machine learning. However, the metrics used to evaluate model performance have received comparatively little attention. The area under the receiver operating characteristic curve (AUROC) has long been a standard choice for model comparison. Despite its advantages, AUROC is not always ideal, particularly for problems that are invariant to local exchange of classes (LxC), a new form of metric invariance introduced in this work. To address this limitation, we propose LxCIM (LxC-invariant metric), which is not only rank-based and invariant under local exchange of classes, but also intuitive, logically consistent, and always computable, while enabling more detailed analysis through the cumulative accuracy-decision rate curve. Moreover, LxCIM exhibits clear theoretical connections to AUROC, accuracy, and the area under the accuracy-decision rate curve (AUDRC). These relationships allow for multiple complementary interpretations: as a symmetric form of AUROC, a rank-based analogue of accuracy, or a more representative and more interpretable variant of AUDRC. Finally, we demonstrate the direct applicability of LxCIM to the bivariate causal discovery problem (which exhibits invariance to local exchange of classes) and show how it addresses the acknowledged limitations of existing metrics used in this field. All code and implementation details are publicly available at github.com/tiagobrogueira/Causal-Discovery-In-Exchangeable-Data.
- Abstract(参考訳): バイナリ分類は、機械学習における最も古く、最も広く使われ、研究されている問題の1つである。
しかし、モデル性能を評価するために使われる指標は、比較的ほとんど注目されていない。
受信機動作特性曲線(AUROC)の下の領域は、長い間モデル比較の標準選択であった。
その利点にもかかわらず、AUROCは必ずしも理想的ではない、特にこの研究で導入された新しい計量不変量であるクラス(LxC)の局所交換に不変な問題に対して。
この制限に対処するために、LxCIM (LxC-invariant metric) を提案し、これはクラスを局所的に交換する上でランクベースで不変であるだけでなく、直感的で論理的に一貫性があり、常に計算可能であるとともに、累積精度-決定率曲線によるより詳細な解析を可能にする。
さらに、LxCIMはAUROC、精度、精度決定率曲線(AUDRC)の領域との明確な理論的関係を示す。
これらの関係は複数の相補的な解釈を可能にする: AUROC の対称形式として、精度のランクベースの類似体として、またはより代表的でより解釈可能な AUDRC の変種である。
最後に,LxCIMの2変量因果発見問題への直接的な適用性(クラス間の局所的な交換に不変性を示す)を示し,この分野で使用されている既存のメトリクスの許容限界にどう対処するかを示す。
すべてのコードと実装の詳細はgithub.com/tiagobrogueira/Causal-Discovery-In-Exchangeable-Dataで公開されている。
関連論文リスト
- ResAD++: Towards Class Agnostic Anomaly Detection via Residual Feature Learning [52.11294707895649]
本稿では,クラス非依存型異常検出(AD)の問題点について検討する。
目的は、ターゲットデータの再トレーニングや微調整をせずに、異なるドメインから様々な新しいクラスの異常を一般化して検出できる、クラスに依存しないADモデルをトレーニングすることである。
8つの実世界のADデータセットに関する総合的な実験は、ResAD++が新しいクラスで直接使用されると、素晴らしいAD結果が得られることを示した。
論文 参考訳(メタデータ) (2025-09-28T08:41:05Z) - A Distance Metric for Mixed Integer Programming Instances [0.0]
Mixed-integer linear programming (MILP)は、様々な現実世界の問題に対処するための強力なツールである。
既存の類似度メトリクスは、しばしばインスタンスクラスを識別する精度を欠いているか、ラベル付きデータに大きく依存している。
本稿では,その数学的定式化から直接導出したMILPインスタンスに対する最初の数学的距離測定について紹介する。
論文 参考訳(メタデータ) (2025-07-15T07:55:09Z) - On the Geometry of Receiver Operating Characteristic and Precision-Recall Curves [1.6790915329706384]
二項分類問題における受信者動作特性(ROC)と高精度リコール曲線(PR)の幾何学について検討する。
鍵となる発見は、最もよく使われるバイナリ分類のメトリクスの多くは、単に合成関数 $G := F_p circ F_n-1$ の関数であるということである。
論文 参考訳(メタデータ) (2025-04-02T23:04:28Z) - Rethinking Few-shot Class-incremental Learning: Learning from Yourself [31.268559330366404]
FSCIL (Few-shot class-incremental Learning) は、限られたサンプルを持つシーケンシャルクラスを数ショットで学習することを目的としている。
FSCILの一般的なベンチマークは、古典的なクラス増分学習設定を継承し、評価指標として平均精度(aAcc)と最終タスク平均精度(lAcc)を用いる。
我々は、さらに公平な評価を提供するために設計された一般化平均精度(gAcc)と呼ばれる新しい指標を提供する。
論文 参考訳(メタデータ) (2024-07-10T08:52:56Z) - Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。
本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-05T16:35:30Z) - Diagnosing and Rectifying Fake OOD Invariance: A Restructured Causal
Approach [51.012396632595554]
不変表現学習(IRL)は、不変因果的特徴から環境から切り離されたラベルへの予測を促進する。
最近の理論的結果は、IRLによって回復されたいくつかの因果的特徴は、訓練環境ではドメイン不変のふりをするが、目に見えない領域では失敗する。
本研究では,RS-SCMに関する条件付き相互情報に基づく手法を開発し,その効果を巧みに補正する。
論文 参考訳(メタデータ) (2023-12-15T12:58:05Z) - A Targeted Accuracy Diagnostic for Variational Approximations [8.969208467611896]
変分推論(VI)はマルコフ・チェイン・モンテカルロ(MCMC)の魅力的な代替品である
既存の方法は、全変分分布の品質を特徴付ける。
配電近似精度(TADDAA)のためのTArgeted診断法を提案する。
論文 参考訳(メタデータ) (2023-02-24T02:50:18Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Improving Out-of-Distribution Robustness via Selective Augmentation [61.147630193060856]
機械学習アルゴリズムは、トレーニングとテスト例が同じ分布から引き出されると仮定する。
分散シフトは現実世界のアプリケーションでは一般的な問題であり、テスト時にモデルが劇的に悪化する可能性がある。
LISAと呼ばれる選択的な拡張によって不変関数を学習するミックスアップ方式を提案する。
論文 参考訳(メタデータ) (2022-01-02T05:58:33Z) - Label-Imbalanced and Group-Sensitive Classification under
Overparameterization [32.923780772605596]
ラベルの不均衡でグループに敏感な分類は、関連するメトリクスを最適化するための標準トレーニングアルゴリズムを適切に修正することを目指す。
標準実証的リスク最小化に対するロジット調整による損失修正は,一般的には効果がない可能性がある。
本研究では, 2つの共通する不均衡(ラベル/グループ)を統一的に処理し, 敏感群の二値分類に自然に適用できることを示した。
論文 参考訳(メタデータ) (2021-03-02T08:09:43Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。