Fugu-MT 論文翻訳(概要): Long-Tailed Learning for Generalized Category Discovery

論文の概要: Long-Tailed Learning for Generalized Category Discovery

arxiv url: http://arxiv.org/abs/2506.06965v1
Date: Sun, 08 Jun 2025 02:01:49 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-10 16:33:10.588655
Title: Long-Tailed Learning for Generalized Category Discovery
Title（参考訳）: 一般化カテゴリー発見のための長期学習
Authors: Cuong Manh Hoang,
Abstract要約: 本稿では,長期分布における一般化されたカテゴリ発見を行う新しいフレームワークを提案する。まず,学習可能な分布を用いて擬似ラベルを生成する自己誘導ラベリング手法を提案する。次に、識別的表現を導出する表現バランスプロセスを導入する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generalized Category Discovery (GCD) utilizes labeled samples of known classes to discover novel classes in unlabeled samples. Existing methods show effective performance on artificial datasets with balanced distributions. However, real-world datasets are always imbalanced, significantly affecting the effectiveness of these methods. To solve this problem, we propose a novel framework that performs generalized category discovery in long-tailed distributions. We first present a self-guided labeling technique that uses a learnable distribution to generate pseudo-labels, resulting in less biased classifiers. We then introduce a representation balancing process to derive discriminative representations. By mining sample neighborhoods, this process encourages the model to focus more on tail classes. We conduct experiments on public datasets to demonstrate the effectiveness of the proposed framework. The results show that our model exceeds previous state-of-the-art methods.
Abstract（参考訳）: Generalized Category Discovery (GCD) は、既知のクラスのラベル付きサンプルを使用して、ラベルなしのサンプルで新しいクラスを発見する。既存の手法は、バランスの取れた分布を持つ人工データセットに効果的な性能を示す。しかし、実世界のデータセットは常に不均衡であり、これらの手法の有効性に大きな影響を及ぼす。そこで本研究では,長期分布において一般化されたカテゴリ発見を行う新しいフレームワークを提案する。まず,学習可能な分布を用いて擬似ラベルを生成する自己誘導ラベリング手法を提案する。次に、識別的表現を導出する表現バランスプロセスを導入する。サンプル地区を採掘することで、このプロセスはモデルがテールクラスにもっと焦点を合わせるように促す。提案手法の有効性を実証するために,公開データセットの実験を行った。その結果,本モデルが従来の最先端手法を超越していることが判明した。

関連論文リスト

CVOCSemRPL: Class-Variance Optimized Clustering, Semantic Information Injection and Restricted Pseudo Labeling based Improved Semi-Supervised Few-Shot Learning [4.3149314441871205]
半教師付き数発の学習環境では、かなりの量のラベルなしサンプルが利用可能である。このようなラベルのないサンプルは一般に入手しやすく、モデルの数発の学習性能を向上させるために使用できる。本稿では,クラスタリングを改善するためにモデルが学習した表現の改善に焦点をあて,その結果,モデル性能について述べる。
論文参考訳（メタデータ） (2025-01-24T11:14:35Z)
Data Pruning in Generative Diffusion Models [2.0111637969968]
生成モデルは、データの基盤となる分布を推定することを目的としている。大規模データセットにおける冗長データやノイズデータの排除は,特に戦略的に行う場合,特に有益であることを示す。
論文参考訳（メタデータ） (2024-11-19T14:13:25Z)
Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文参考訳（メタデータ） (2024-10-08T15:06:10Z)
Exploring Beyond Logits: Hierarchical Dynamic Labeling Based on Embeddings for Semi-Supervised Classification [49.09505771145326]
モデル予測に依存しない階層型動的ラベル付け(HDL)アルゴリズムを提案し,画像埋め込みを用いてサンプルラベルを生成する。本手法は,半教師付き学習における擬似ラベル生成のパラダイムを変える可能性がある。
論文参考訳（メタデータ） (2024-04-26T06:00:27Z)
Class-Balancing Diffusion Models [57.38599989220613]
クラスバランシング拡散モデル(CBDM)は、分散調整正規化器をソリューションとして訓練する。提案手法は,CIFAR100/CIFAR100LTデータセットで生成結果をベンチマークし,下流認識タスクにおいて優れた性能を示す。
論文参考訳（メタデータ） (2023-04-30T20:00:14Z)
Diffusing Gaussian Mixtures for Generating Categorical Data [21.43283907118157]
本稿では,高品質なサンプル生成に着目した拡散モデルに基づく分類データの生成モデルを提案する。評価手法は、分類データを生成するための異なる生成モデルの能力と限界を強調した。
論文参考訳（メタデータ） (2023-03-08T14:55:32Z)
Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文参考訳（メタデータ） (2023-03-06T14:49:59Z)
Combining Self-labeling with Selective Sampling [2.0305676256390934]
この研究は、選択的サンプリングシナリオにおける自己ラベル技術とアクティブラーニングを組み合わせたものである。選択したクラスに対してバイアスを課すことにより,自己ラベルの適用がパフォーマンスに悪影響を及ぼすことを示す。提案手法は,現在の選択的サンプリング手法と一致し,より良い結果が得られる。
論文参考訳（メタデータ） (2023-01-11T11:58:45Z)
Parametric Classification for Generalized Category Discovery: A Baseline Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文参考訳（メタデータ） (2022-11-21T18:47:11Z)
Open-Sampling: Exploring Out-of-Distribution data for Re-balancing Long-tailed datasets [24.551465814633325]
深層ニューラルネットワークは通常、トレーニングデータセットが極端なクラス不均衡に苦しむ場合、パフォーマンスが良くない。近年の研究では、半教師付き方式でアウト・オブ・ディストリビューションデータによる直接トレーニングが一般化性能を損なうことが報告されている。そこで我々は,オープンセットノイズラベルを用いて学習データセットのクラス前のバランスを再調整する,オープンサンプリングと呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (2022-06-17T14:29:52Z)
Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文参考訳（メタデータ） (2020-06-22T21:12:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。