論文の概要: The Art of Misclassification: Too Many Classes, Not Enough Points
- arxiv url: http://arxiv.org/abs/2502.08041v1
- Date: Wed, 12 Feb 2025 00:57:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-13 13:44:30.145315
- Title: The Art of Misclassification: Too Many Classes, Not Enough Points
- Title(参考訳): 誤分類の芸術: クラスが多すぎる、ポイントが足りない
- Authors: Mario Franco, Gerardo Febres, Nelson Fernández, Carlos Gershenson,
- Abstract要約: 本稿では,分類問題の本質的難易度を定量化する,形式的エントロピーに基づく分類可能性尺度を提案する。
この尺度は、クラスオーバーラップの度合いを捉え、人間の直感と整合し、分類性能の上限として機能する。
- 参考スコア(独自算出の注目度): 0.46873264197900916
- License:
- Abstract: Classification is a ubiquitous and fundamental problem in artificial intelligence and machine learning, with extensive efforts dedicated to developing more powerful classifiers and larger datasets. However, the classification task is ultimately constrained by the intrinsic properties of datasets, independently of computational power or model complexity. In this work, we introduce a formal entropy-based measure of classificability, which quantifies the inherent difficulty of a classification problem by assessing the uncertainty in class assignments given feature representations. This measure captures the degree of class overlap and aligns with human intuition, serving as an upper bound on classification performance for classification problems. Our results establish a theoretical limit beyond which no classifier can improve the classification accuracy, regardless of the architecture or amount of data, in a given problem. Our approach provides a principled framework for understanding when classification is inherently fallible and fundamentally ambiguous.
- Abstract(参考訳): 分類は人工知能と機械学習においてユビキタスで基本的な問題であり、より強力な分類器とより大きなデータセットの開発に重点を置いている。
しかし、分類タスクは究極的には、計算力やモデルの複雑さとは無関係に、データセットの本質的な性質によって制約される。
本研究では,特徴表現のクラス割り当ての不確実性を評価することによって,分類問題の本質的難しさを定量化する,形式的エントロピーに基づく分類可能性尺度を提案する。
この尺度は、クラスオーバーラップの度合いを捉え、人間の直感と整合し、分類問題に対する分類性能の上限として機能する。
この結果から, アーキテクチャやデータ量に関わらず, 分類器が分類精度を向上できないという理論的限界が得られた。
我々のアプローチは、分類が本質的に失敗し、根本的に曖昧であるときの理解のための原則化された枠組みを提供する。
関連論文リスト
- Harnessing Superclasses for Learning from Hierarchical Databases [1.835004446596942]
多くの大規模分類問題において、クラスは既知の階層に整理され、通常木として表される。
この種の教師付き階層分類の損失について紹介する。
提案手法では,クロスエントロピーの損失に比較して,計算コストの大幅な増大は伴わない。
論文 参考訳(メタデータ) (2024-11-25T14:39:52Z) - Fine-Grained ImageNet Classification in the Wild [0.0]
ロバストネステストは、典型的なモデル評価段階で気づかないいくつかの脆弱性やバイアスを明らかにすることができる。
本研究では,階層的知識の助けを借りて,密接に関連するカテゴリのきめ細かい分類を行う。
論文 参考訳(メタデータ) (2023-03-04T12:25:07Z) - Anomaly Detection using Ensemble Classification and Evidence Theory [62.997667081978825]
本稿では,アンサンブル分類とエビデンス理論を用いた新しい検出手法を提案する。
固体アンサンブル分類器を構築するためのプール選択戦略が提示される。
我々は異常検出手法の不確実性を利用する。
論文 参考訳(メタデータ) (2022-12-23T00:50:41Z) - Multi-class Classification with Fuzzy-feature Observations: Theory and
Algorithms [36.810603503167755]
我々は,MCIMO(Multi-class classification with Imprecise Observation)と呼ばれる新しい現実的問題に対処する新しい枠組みを提案する。
まず,ファジィラデマッハの複雑性に基づくMCIMO問題の理論的解析を行う。
そこで,提案した課題を解決するために,サポートベクタマシンとニューラルネットワークに基づく2つの実用的なアルゴリズムを構築した。
論文 参考訳(メタデータ) (2022-06-09T07:14:00Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Learning Debiased and Disentangled Representations for Semantic
Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。
各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。
提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文 参考訳(メタデータ) (2021-10-31T16:15:09Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Evaluating Nonlinear Decision Trees for Binary Classification Tasks with
Other Existing Methods [8.870380386952993]
データセットを2つ以上の異なるクラスに分類することは、機械学習の重要なタスクである。
多くのメソッドは、テストデータに対して非常に高い精度でバイナリ分類タスクを分類することができるが、容易に解釈可能な説明を提供することはできない。
我々は、最近提案された非線形決定木アプローチを、多くのデータセットでよく使われている分類手法で強調し、評価する。
論文 参考訳(メタデータ) (2020-08-25T00:00:23Z) - Revisiting Data Complexity Metrics Based on Morphology for Overlap and
Imbalance: Snapshot, New Overlap Number of Balls Metrics and Singular
Problems Prospect [9.666866159867444]
本研究は,データ形態に基づく複雑性メトリクスの再検討に焦点をあてる。
クラスによるボールのカバレッジに基づいており、オーバーラップ・ナンバー・オブ・ボールにちなんで名付けられている。
論文 参考訳(メタデータ) (2020-07-15T18:21:13Z) - A Systematic Evaluation: Fine-Grained CNN vs. Traditional CNN
Classifiers [54.996358399108566]
本稿では,大規模分類データセット上でトップノーチ結果を示すランドマーク一般的なCNN分類器の性能について検討する。
最先端のきめ細かい分類器と比較する。
実験において, 粒度の細かい分類器がベースラインを高められるかどうかを判定するために, 6つのデータセットについて広範囲に評価する。
論文 参考訳(メタデータ) (2020-03-24T23:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。