論文の概要: Novel Categories Discovery from probability matrix perspective
- arxiv url: http://arxiv.org/abs/2307.03856v1
- Date: Fri, 7 Jul 2023 22:30:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-11 17:08:04.663566
- Title: Novel Categories Discovery from probability matrix perspective
- Title(参考訳): 確率行列から見た新しいカテゴリ発見
- Authors: Zahid Hasan, Abu Zaher Md Faridee, Masud Ahmed, Sanjay Purushotham,
Heesung Kwon, Hyungtae Lee, Nirmalya Roy
- Abstract要約: 新たなカテゴリ発見(NCD)は、クラスセマンティクスに基づいて、既知のカテゴリとクラスタリングの新しいカテゴリを分類するオープンワールドの問題に取り組む。
我々は,NCDの新しいデータサンプリングと,新しいクラスであるMultinoulli(カテゴリー)分布の関連性を活用している。
我々の単純なアプローチは、ラベルなしクラス間のセマンティックな類似性を提供し、セマンティックベースの新しいデータクラスタリングを実現するのに成功しました。
- 参考スコア(独自算出の注目度): 23.17093125627668
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Novel Categories Discovery (NCD) tackles the open-world problem of
classifying known and clustering novel categories based on the class semantics
using partial class space annotated data. Unlike traditional pseudo-label and
retraining, we investigate NCD from the novel data probability matrix
perspective. We leverage the connection between NCD novel data sampling with
provided novel class Multinoulli (categorical) distribution and hypothesize to
implicitly achieve semantic-based novel data clustering by learning their class
distribution. We propose novel constraints on first-order (mean) and
second-order (covariance) statistics of probability matrix features while
applying instance-wise information constraints. In particular, we align the
neuron distribution (activation patterns) under a large batch of Monte-Carlo
novel data sampling by matching their empirical features mean and covariance
with the provided Multinoulli-distribution. Simultaneously, we minimize entropy
and enforce prediction consistency for each instance. Our simple approach
successfully realizes semantic-based novel data clustering provided the
semantic similarity between label-unlabeled classes. We demonstrate the
discriminative capacity of our approaches in image and video modalities.
Moreover, we perform extensive ablation studies regarding data, networks, and
our framework components to provide better insights. Our approach maintains
~94%, ~93%, and ~85%, classification accuracy in labeled data while achieving
~90%, ~84%, and ~72% clustering accuracy for novel categories for Cifar10,
UCF101, and MPSC-ARL datasets that matches state-of-the-art approaches without
any external clustering.
- Abstract(参考訳): New Categories Discovery (NCD) は、クラスセマンティクスに基づく既知のカテゴリとクラスタリングの新しいカテゴリを、部分クラスアノテートデータを用いて分類するオープンワールド問題に取り組む。
従来の擬似ラベルやリトレーニングとは異なり,新しいデータ確率行列の観点から ncd を調べる。
ncd 新規データサンプリングと新しいクラスマルチヌーリ分布(カテゴリー的)の関係を利用して,クラス分布を学習することで暗黙的に意味に基づく新しいデータクラスタリングを実現する。
本稿では,確率行列の特徴量の一階 (mean) と二階 (covariance) 統計量に関する新しい制約を提案する。
特に,ニューロン分布(活性化パターン)をモンテカルロ新奇データサンプリングの大規模なバッチで調整し,その経験的特徴を平均値と共分散値と一致させることで一致させた。
同時にエントロピーを最小化し、各インスタンスの予測一貫性を強制する。
提案手法は,ラベルなしクラス間の意味的類似性を提供し,セマンティクスに基づく新しいデータクラスタリングを実現する。
画像と映像のモダリティにおける我々のアプローチの判別能力を示す。
さらに、データ、ネットワーク、およびフレームワークコンポーネントに関する広範なアブレーション研究を行い、より良い洞察を提供する。
提案手法は,Cifar10, UCF101, MPSC-ARLの新たなカテゴリの分類精度を90%, UCF101, MPSC-ARLの順に向上させながら,ラベル付きデータの分類精度を約94%, ~93%, ~85%維持する。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - Towards Realistic Long-tailed Semi-supervised Learning in an Open World [0.0]
我々は、既知のカテゴリと新規カテゴリの分布関係を前提としない、よりエフェリアティックなオープンワールドLong-tailed Semi-supervised Learning(textbfROLSSL)を構築する。
提案したROOSSL設定では、二重ステージロジット調整と呼ばれる、シンプルで効果的な解を提案する。
CIFAR100やImageNet100のようなデータセットの実験では、最大50.1%のパフォーマンス改善が示されている。
論文 参考訳(メタデータ) (2024-05-23T12:53:50Z) - SimPro: A Simple Probabilistic Framework Towards Realistic Long-Tailed Semi-Supervised Learning [49.94607673097326]
ラベルなしデータの分散に関する前提を前提としない、高度に適応可能なフレームワークをSimProとして提案する。
我々のフレームワークは確率モデルに基づいており、期待最大化アルゴリズムを革新的に洗練する。
本手法は,様々なベンチマークやデータ分散シナリオにまたがる一貫した最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-21T03:39:04Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Bridging the Gap: Learning Pace Synchronization for Open-World Semi-Supervised Learning [44.91863420044712]
オープンワールドの半教師付き学習において、機械学習モデルはラベルなしのデータから新しいカテゴリを明らかにすることを任務とする。
本稿では,(1)モデル偏差を軽減するためにクラス固有の負のマージンを課するアダプティブ・コミュニケート・ラミナル・ロス,(2)モデルによって予測される擬似ラベルを利用した擬似ラベル・コントラッシブ・クラスタリングについて紹介する。
本手法は,授業の学習速度のバランスを保ち,画像Netデータセットの平均精度を3%向上させる。
論文 参考訳(メタデータ) (2023-09-21T09:44:39Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Re-distributing Biased Pseudo Labels for Semi-supervised Semantic
Segmentation: A Baseline Investigation [30.688753736660725]
疑似ラベルを生成するために,DARS法とDARS法を提案する。
我々の手法は最先端の手法と比較して好適に機能する。
論文 参考訳(メタデータ) (2021-07-23T14:45:14Z) - Joint Representation Learning and Novel Category Discovery on Single-
and Multi-modal Data [16.138075558585516]
信頼性の高い表現を共同学習し、ラベルなしのデータにクラスタを割り当てる汎用的なエンドツーエンドフレームワークを提案する。
我々は共有表現空間にウィナーテイクオール(wta)ハッシュアルゴリズムを採用し,ラベルなしデータに対してペアワイズ擬似ラベルを生成する。
大規模マルチモーダルビデオベンチマークKinetics-400およびVGG-Sound、および画像ベンチマークCIFAR10、CIFAR100およびImageNetに関するフレームワークを徹底的に評価します。
論文 参考訳(メタデータ) (2021-04-26T15:56:16Z) - Open-World Semi-Supervised Learning [66.90703597468377]
本稿では,従来のクラスを認識するためにモデルを必要とする,新しいオープンワールド半教師付き学習環境を提案する。
データの分類とクラスタ化を同時に行うアプローチであるORCAを提案する。
我々は,ORCAが新しいクラスを正確に発見し,ベンチマーク画像分類データセット上で以前に見られたクラスにサンプルを割り当てることを示した。
論文 参考訳(メタデータ) (2021-02-06T07:11:07Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。