論文の概要: Novel Categories Discovery Via Constraints on Empirical Prediction
Statistics
- arxiv url: http://arxiv.org/abs/2307.03856v2
- Date: Sun, 17 Dec 2023 04:49:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 20:31:54.681468
- Title: Novel Categories Discovery Via Constraints on Empirical Prediction
Statistics
- Title(参考訳): 経験的予測統計の制約による新しいカテゴリー発見
- Authors: Zahid Hasan, Abu Zaher Md Faridee, Masud Ahmed, Sanjay Purushotham,
Heesung Kwon, Hyungtae Lee, Nirmalya Roy
- Abstract要約: New Categories Discovery (NCD) は、既知のクラスのクラスセマンティクスに基づいて、新しいデータをクラスタリングすることを目的としている。
そこで本研究では,データサンプリングと新規クラスの多極的(カテゴリー的)分布の関連性を利用する。
画像, ビデオ, 時系列モダリティにおける新しいサンプルのセマンティッククラスタリングを実現するための, 提案手法の識別能力を示す。
- 参考スコア(独自算出の注目度): 21.946305113748696
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Novel Categories Discovery (NCD) aims to cluster novel data based on the
class semantics of known classes using the open-world partial class space
annotated dataset. As an alternative to the traditional pseudo-labeling-based
approaches, we leverage the connection between the data sampling and the
provided multinoulli (categorical) distribution of novel classes. We introduce
constraints on individual and collective statistics of predicted novel class
probabilities to implicitly achieve semantic-based clustering. More
specifically, we align the class neuron activation distributions under
Monte-Carlo sampling of novel classes in large batches by matching their
empirical first-order (mean) and second-order (covariance) statistics with the
multinoulli distribution of the labels while applying instance information
constraints and prediction consistency under label-preserving augmentations. We
then explore a directional statistics-based probability formation that learns
the mixture of Von Mises-Fisher distribution of class labels in a unit
hypersphere. We demonstrate the discriminative ability of our approach to
realize semantic clustering of novel samples in image, video, and time-series
modalities. We perform extensive ablation studies regarding data, networks, and
framework components to provide better insights. Our approach maintains 94%,
93%, 85%, and 93% (approx.) classification accuracy in labeled data while
achieving 90%, 84%, 72%, and 75% (approx.) clustering accuracy for novel
categories in Cifar10, UCF101, MPSC-ARL, and SHAR datasets that match
state-of-the-art approaches without any external clustering.
- Abstract(参考訳): novel categories discovery (ncd) はopen-world partial class space annotated datasetを使用して、既知のクラスのクラスセマンティクスに基づいて新しいデータをクラスタすることを目的としている。
従来の擬似ラベルベースアプローチの代替として,データサンプリングと新規クラスの多元的(カテゴリー的)分布との関係を活用した。
予測される新しいクラス確率の個人統計と集団統計の制約を導入し,暗黙的に意味ベースのクラスタリングを実現する。
具体的には,実験的一階 (mean) と二階 (covariance) の統計量とラベルのマルチヌーリ分布を一致させ, ラベル保存によるインスタンス情報制約と予測一貫性を適用して, 大規模バッチにおける新規クラスのモンテカルロサンプリング下でのクラスニューロン活性化分布を調整した。
次に、単位超球面におけるクラスラベルのvon mises-fisher分布の混合を学習する方向統計に基づく確率形成について検討する。
画像, ビデオ, 時系列モダリティにおける新しいサンプルのセマンティッククラスタリングを実現するための, 提案手法の識別能力を示す。
データ、ネットワーク、フレームワークコンポーネントに関する広範なアブレーション研究を行い、より良い洞察を与えます。
ラベル付きデータでは94%,93%,85%,93% (ほぼ) の分類精度を維持しつつ,cifar10, ucf101, mpsc-arl, sharの新たなカテゴリでは,外部クラスタリングを伴わずに90%, 84%, 72%, 75% (約75%) のクラスタリング精度を達成している。
関連論文リスト
- Class Balance Matters to Active Class-Incremental Learning [61.11786214164405]
まず、大規模な未ラベルデータのプールから始めて、インクリメンタルな学習のための最も情報に富んだサンプルを注釈付けします。
そこで我々は,クラスバランスと情報提供性を両立させるため,クラスバランス選択(CBS)戦略を提案する。
我々のCBSは、プリトレーニング済みモデルとプロンプトチューニング技術に基づいて、これらのCILメソッドに接続し、再生することができる。
論文 参考訳(メタデータ) (2024-12-09T16:37:27Z) - Categorical Data Clustering via Value Order Estimated Distance Metric Learning [31.851890008893847]
本稿では,属性値間の順序関係がクラスタリング精度の決定的要因であることを示す。
本稿では,クラスタと注文の協調学習を可能にする新しい学習パラダイムを提案する。
このアルゴリズムは収束保証によりより優れたクラスタリング精度を実現する。
論文 参考訳(メタデータ) (2024-11-19T08:23:25Z) - Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - Towards Realistic Long-tailed Semi-supervised Learning in an Open World [0.0]
我々は、既知のカテゴリと新規カテゴリの分布関係を前提としない、よりエフェリアティックなオープンワールドLong-tailed Semi-supervised Learning(textbfROLSSL)を構築する。
提案したROOSSL設定では、二重ステージロジット調整と呼ばれる、シンプルで効果的な解を提案する。
CIFAR100やImageNet100のようなデータセットの実験では、最大50.1%のパフォーマンス改善が示されている。
論文 参考訳(メタデータ) (2024-05-23T12:53:50Z) - SimPro: A Simple Probabilistic Framework Towards Realistic Long-Tailed Semi-Supervised Learning [49.94607673097326]
ラベルなしデータの分散に関する前提を前提としない、高度に適応可能なフレームワークをSimProとして提案する。
我々のフレームワークは確率モデルに基づいており、期待最大化アルゴリズムを革新的に洗練する。
本手法は,様々なベンチマークやデータ分散シナリオにまたがる一貫した最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-21T03:39:04Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Bridging the Gap: Learning Pace Synchronization for Open-World Semi-Supervised Learning [44.91863420044712]
オープンワールドの半教師付き学習において、機械学習モデルはラベルなしのデータから新しいカテゴリを明らかにすることを任務とする。
本稿では,(1)モデル偏差を軽減するためにクラス固有の負のマージンを課するアダプティブ・コミュニケート・ラミナル・ロス,(2)モデルによって予測される擬似ラベルを利用した擬似ラベル・コントラッシブ・クラスタリングについて紹介する。
本手法は,授業の学習速度のバランスを保ち,画像Netデータセットの平均精度を3%向上させる。
論文 参考訳(メタデータ) (2023-09-21T09:44:39Z) - Joint Representation Learning and Novel Category Discovery on Single-
and Multi-modal Data [16.138075558585516]
信頼性の高い表現を共同学習し、ラベルなしのデータにクラスタを割り当てる汎用的なエンドツーエンドフレームワークを提案する。
我々は共有表現空間にウィナーテイクオール(wta)ハッシュアルゴリズムを採用し,ラベルなしデータに対してペアワイズ擬似ラベルを生成する。
大規模マルチモーダルビデオベンチマークKinetics-400およびVGG-Sound、および画像ベンチマークCIFAR10、CIFAR100およびImageNetに関するフレームワークを徹底的に評価します。
論文 参考訳(メタデータ) (2021-04-26T15:56:16Z) - Open-World Semi-Supervised Learning [66.90703597468377]
本稿では,従来のクラスを認識するためにモデルを必要とする,新しいオープンワールド半教師付き学習環境を提案する。
データの分類とクラスタ化を同時に行うアプローチであるORCAを提案する。
我々は,ORCAが新しいクラスを正確に発見し,ベンチマーク画像分類データセット上で以前に見られたクラスにサンプルを割り当てることを示した。
論文 参考訳(メタデータ) (2021-02-06T07:11:07Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。