論文の概要: Classes are not Clusters: Improving Label-based Evaluation of
Dimensionality Reduction
- arxiv url: http://arxiv.org/abs/2308.00278v2
- Date: Fri, 11 Aug 2023 04:35:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 16:23:35.054896
- Title: Classes are not Clusters: Improving Label-based Evaluation of
Dimensionality Reduction
- Title(参考訳): クラスはクラスタではない:次元削減のラベルベース評価の改善
- Authors: Hyeon Jeon, Yun-Hsin Kuo, Micha\"el Aupetit, Kwan-Liu Ma, and Jinwook
Seo
- Abstract要約: ラベル・トラストネスとラベル・連続性(ラベル・T&C)という2つの新しい品質対策を導入する。
クラスが元の空間で十分にクラスタ化されていると仮定する代わりに、 Label-T&C はクラスが元の空間と埋め込み空間のクラスタを形成する範囲を推定する。
- 参考スコア(独自算出の注目度): 24.241399059405666
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: A common way to evaluate the reliability of dimensionality reduction (DR)
embeddings is to quantify how well labeled classes form compact, mutually
separated clusters in the embeddings. This approach is based on the assumption
that the classes stay as clear clusters in the original high-dimensional space.
However, in reality, this assumption can be violated; a single class can be
fragmented into multiple separated clusters, and multiple classes can be merged
into a single cluster. We thus cannot always assure the credibility of the
evaluation using class labels. In this paper, we introduce two novel quality
measures -- Label-Trustworthiness and Label-Continuity (Label-T&C) -- advancing
the process of DR evaluation based on class labels. Instead of assuming that
classes are well-clustered in the original space, Label-T&C work by (1)
estimating the extent to which classes form clusters in the original and
embedded spaces and (2) evaluating the difference between the two. A
quantitative evaluation showed that Label-T&C outperform widely used DR
evaluation measures (e.g., Trustworthiness and Continuity, Kullback-Leibler
divergence) in terms of the accuracy in assessing how well DR embeddings
preserve the cluster structure, and are also scalable. Moreover, we present
case studies demonstrating that Label-T&C can be successfully used for
revealing the intrinsic characteristics of DR techniques and their
hyperparameters.
- Abstract(参考訳): 次元還元(dr)埋め込みの信頼性を評価する一般的な方法は、ラベル付きクラスがどのようにコンパクトで互いに分離されたクラスタを形成するかを定量化することである。
このアプローチは、クラスが元の高次元空間のクリアクラスタとして残るという仮定に基づいている。
しかし実際には、この仮定に違反する可能性がある。単一のクラスを複数のクラスタに分割することができ、複数のクラスをひとつのクラスタにマージすることができる。
したがって、クラスラベルを用いた評価の信頼性を常に保証することはできない。
本稿では,ラベル信頼性とラベル連続性(label-t&c)という2つの新しい品質指標を提案する。
クラスが元の空間で十分にクラスタ化されていると仮定する代わりに、ラベル・T&Cは(1)元の空間と埋め込み空間においてクラスがクラスタを形成する程度を推定し、(2)両者の違いを評価する。
定量的評価により, DRの埋込みがクラスタ構造をどれだけよく保存するかを評価する上で, DR評価尺度(例えば, 信頼性と継続性, Kullback-Leibler の偏差など)が広く用いられている。
さらに, DR法とそのハイパーパラメータの内在特性を明らかにするために, Label-T&C が有効であることを示す事例研究を行った。
関連論文リスト
- Label Cluster Chains for Multi-Label Classification [2.072831155509228]
マルチラベル分類は、複数のラベルをインスタンスに同時に割り当てることができる教師付き機械学習の一種である。
そこで本稿では,ラベル空間に分割法を適用して得られた解離相関ラベルクラスタをチェーンする手法を提案する。
提案手法は,学習と連鎖が相関するラベルクラスタをよりよく探索し,ラベル相関を学習できることを示唆する。
論文 参考訳(メタデータ) (2024-11-01T11:16:37Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Learning Label Hierarchy with Supervised Contrastive Learning [8.488965459026678]
教師付きコントラスト学習(SCL)フレームワークは、各クラスを独立したものとして扱うため、すべてのクラスが等しく重要であるとみなす。
本稿では,クラス間の類似性を利用して階層情報をSCLに組み込んだラベル認識型SCL手法(LASCL)のファミリーを紹介する。
3つのデータセットに対する実験により、提案したLASCLは、複数ラベルの1つのラベルを区別するテキスト分類にうまく機能することが示された。
論文 参考訳(メタデータ) (2024-01-31T23:21:40Z) - Knowledge Distillation from Single to Multi Labels: an Empirical Study [14.12487391004319]
クラス活性化マップ(CAM)に基づく新しい蒸留法を提案する。
以上の結果から,ロジット法はマルチラベル分類に適していないことが示唆された。
そこで本研究では,適切な暗黒知識にクラス情報を導入し,最終分類結果と高い相関性を持たせることを提案する。
論文 参考訳(メタデータ) (2023-03-15T04:39:01Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Transductive CLIP with Class-Conditional Contrastive Learning [68.51078382124331]
雑音ラベル付き分類ネットワークをスクラッチから学習するための新しいフレームワークであるTransductive CLIPを提案する。
擬似ラベルへの依存を軽減するために,クラス条件のコントラスト学習機構を提案する。
アンサンブルラベルは、ノイズラベル付きディープニューラルネットワークのトレーニングを安定化するための擬似ラベル更新戦略として採用されている。
論文 参考訳(メタデータ) (2022-06-13T14:04:57Z) - Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced
Semi-Supervised Learning [80.05441565830726]
本稿では,疑似ラベルの重み付けがモデル性能に悪影響を及ぼすような,不均衡な半教師付き学習に対処する。
本稿では,この観測の動機となるバイアスに対処する,一般的な擬似ラベルフレームワークを提案する。
不均衡SSLのための新しい擬似ラベルフレームワークを、DASO(Distributed-Aware Semantics-Oriented Pseudo-label)と呼ぶ。
論文 参考訳(メタデータ) (2021-06-10T11:58:25Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z) - Cooperative Bi-path Metric for Few-shot Learning [50.98891758059389]
数発の分類問題の調査に2つの貢献をしている。
本稿では,従来の教師あり学習法において,ベースクラスで訓練されたシンプルで効果的なベースラインについて報告する。
本稿では, 基礎クラスと新しいクラス間の相関を利用して, 精度の向上を図る, 分類のための協調的二経路計量を提案する。
論文 参考訳(メタデータ) (2020-08-10T11:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。