論文の概要: Dissecting Generalized Category Discovery: Multiplex Consensus under Self-Deconstruction
- arxiv url: http://arxiv.org/abs/2508.10731v1
- Date: Thu, 14 Aug 2025 15:11:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.375303
- Title: Dissecting Generalized Category Discovery: Multiplex Consensus under Self-Deconstruction
- Title(参考訳): 一般化カテゴリー発見の分離:自己破壊下での多重化合意
- Authors: Luyao Tang, Kunze Huang, Chaoqi Chen, Yuxuan Yuan, Chenxin Li, Xiaotong Tu, Xinghao Ding, Yue Huang,
- Abstract要約: 人間の認知プロセスにインスパイアされた、新しい物体理解のためのソリューションを提案する。
提案するConGCDは,高レベルなセマンティック再構築により,プリミティブ指向の表現を確立する。
我々は、クラス識別パターンをキャプチャするために、支配的かつ文脈的コンセンサスユニットを実装している。
- 参考スコア(独自算出の注目度): 36.73147151458588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human perceptual systems excel at inducing and recognizing objects across both known and novel categories, a capability far beyond current machine learning frameworks. While generalized category discovery (GCD) aims to bridge this gap, existing methods predominantly focus on optimizing objective functions. We present an orthogonal solution, inspired by the human cognitive process for novel object understanding: decomposing objects into visual primitives and establishing cross-knowledge comparisons. We propose ConGCD, which establishes primitive-oriented representations through high-level semantic reconstruction, binding intra-class shared attributes via deconstruction. Mirroring human preference diversity in visual processing, where distinct individuals leverage dominant or contextual cues, we implement dominant and contextual consensus units to capture class-discriminative patterns and inherent distributional invariants, respectively. A consensus scheduler dynamically optimizes activation pathways, with final predictions emerging through multiplex consensus integration. Extensive evaluations across coarse- and fine-grained benchmarks demonstrate ConGCD's effectiveness as a consensus-aware paradigm. Code is available at github.com/lytang63/ConGCD.
- Abstract(参考訳): 人間の知覚システムは、既知のカテゴリと新しいカテゴリの両方でオブジェクトを誘導し、認識することに長けている。
一般化圏発見(GCD)はこのギャップを埋めることを目的としているが、既存の手法は主に目的関数の最適化に焦点を当てている。
我々は,物体を視覚的プリミティブに分解し,クロス知識比較を確立するという,新しい物体理解のための人間の認知プロセスに触発された直交的解を提案する。
本稿では,高レベルなセマンティック再構築によってプリミティブ指向の表現を確立し,デコンストラクションによりクラス内共有属性を結合するConGCDを提案する。
視覚処理における人間の嗜好の多様性を反映し、個々の個人が支配的・文脈的な手がかりを生かし、支配的・文脈的なコンセンサス・ユニットを実装して、クラス識別パターンと固有の分布不変量をそれぞれキャプチャする。
コンセンサススケジューラはアクティベーションパスを動的に最適化し、多重コンセンサス統合を通じて最終的な予測が現れる。
粗いベンチマークときめ細かいベンチマークによる広範囲な評価は、コンセンサスを意識したパラダイムとしてのConGCDの有効性を示している。
コードはgithub.com/lytang63/ConGCDで入手できる。
関連論文リスト
- HAMLET-FFD: Hierarchical Adaptive Multi-modal Learning Embeddings Transformation for Face Forgery Detection [6.060036926093259]
HAMLET-FFDは顔偽造検出のためのクロスドメイン一般化フレームワークである。
視覚的証拠と概念的手がかりを統合し、専門家の法医学的分析をエミュレートする。
HAMLET-FFDは設計上、外部プラグインとして機能する全ての事前訓練されたパラメータを凍結する。
論文 参考訳(メタデータ) (2025-07-28T15:09:52Z) - Imputation-free and Alignment-free: Incomplete Multi-view Clustering Driven by Consensus Semantic Learning [65.75756724642932]
不完全なマルチビュークラスタリングでは、欠落したデータがビュー内のプロトタイプシフトとビュー間のセマンティック不整合を誘導する。
コンセンサスセマンティクス学習(FreeCSL)のためのIMVCフレームワークを提案する。
FreeCSLは、最先端の競合他社と比較して、IMVCタスクの信頼性と堅牢な割り当てを実現している。
論文 参考訳(メタデータ) (2025-05-16T12:37:10Z) - From Visual Explanations to Counterfactual Explanations with Latent Diffusion [11.433402357922414]
本稿では,近年の顕著な研究における2つの課題に対処するための新しいアプローチを提案する。
まず、ターゲットクラスの"概念"と元のクラスを区別するために、どの特定の反事実的特徴が重要かを決定する。
第二に、非ロバスト分類器に対して、対向的に堅牢なモデルのサポートに頼ることなく、重要な説明を提供する。
論文 参考訳(メタデータ) (2025-04-12T13:04:00Z) - Concept Guided Co-salient Object Detection [22.82243087156918]
ConceptCoSODは、高レベルのセマンティック知識を導入し、コ・サリエンシ検出を強化するコンセプトガイドフレームワークである。
入力画像グループから共有テキストベースの概念を抽出することにより、ConceptCoSODは検出プロセスをアンロックするセマンティックガイダンスを提供する。
論文 参考訳(メタデータ) (2024-12-21T12:47:12Z) - Generalizable Sensor-Based Activity Recognition via Categorical Concept Invariant Learning [5.920971285288677]
HAR(Human Activity Recognition)は、大規模センサデータに基づくモデルトレーニングにより、活動を認識することを目的としている。
HARの重要な側面の1つは、テストセットがトレーニングセットとは異なる分布を持つ可能性があることである。
一般化可能なアクティビティ認識のためのカテゴリー概念不変学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-18T08:18:03Z) - Enhancing Graph Contrastive Learning with Reliable and Informative Augmentation for Recommendation [84.45144851024257]
離散コードによるより強力な協調情報を用いて、コントラスト的なビューを構築することにより、グラフのコントラスト学習を強化することを目的とした、新しいフレームワークを提案する。
中心となる考え方は、ユーザとアイテムを協調情報に富んだ離散コードにマッピングし、信頼性と情報に富んだコントラッシブなビュー生成を可能にすることである。
論文 参考訳(メタデータ) (2024-09-09T14:04:17Z) - Learning the Precise Feature for Cluster Assignment [39.320210567860485]
表現学習とクラスタリングを1つのパイプラインに初めて統合するフレームワークを提案する。
提案フレームワークは,近年開発された生成モデルを用いて,本質的な特徴を学習する能力を活用している。
実験の結果,提案手法の性能は,最先端の手法よりも優れているか,少なくとも同等であることがわかった。
論文 参考訳(メタデータ) (2021-06-11T04:08:54Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。
本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。
本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。