論文の概要: NeurNCD: Novel Class Discovery via Implicit Neural Representation
- arxiv url: http://arxiv.org/abs/2506.06412v1
- Date: Fri, 06 Jun 2025 16:43:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.269517
- Title: NeurNCD: Novel Class Discovery via Implicit Neural Representation
- Title(参考訳): NeurNCD: 暗黙の神経表現による新しいクラス発見
- Authors: Junming Wang, Yi Shi,
- Abstract要約: NeurNCDは、新しいクラス発見のための汎用的でデータ効率のよいフレームワークである。
本フレームワークはオープン・クローズド・ワールド・セッティングの両方において優れたセグメンテーション性能を実現する。
提案手法は,NYUv2 と Replica のデータセットにおける最先端のアプローチを著しく上回っている。
- 参考スコア(独自算出の注目度): 4.498082064000176
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discovering novel classes in open-world settings is crucial for real-world applications. Traditional explicit representations, such as object descriptors or 3D segmentation maps, are constrained by their discrete, hole-prone, and noisy nature, which hinders accurate novel class discovery. To address these challenges, we introduce NeurNCD, the first versatile and data-efficient framework for novel class discovery that employs the meticulously designed Embedding-NeRF model combined with KL divergence as a substitute for traditional explicit 3D segmentation maps to aggregate semantic embedding and entropy in visual embedding space. NeurNCD also integrates several key components, including feature query, feature modulation and clustering, facilitating efficient feature augmentation and information exchange between the pre-trained semantic segmentation network and implicit neural representations. As a result, our framework achieves superior segmentation performance in both open and closed-world settings without relying on densely labelled datasets for supervised training or human interaction to generate sparse label supervision. Extensive experiments demonstrate that our method significantly outperforms state-of-the-art approaches on the NYUv2 and Replica datasets.
- Abstract(参考訳): オープンワールド設定で新しいクラスを発見することは、現実世界のアプリケーションにとって非常に重要です。
オブジェクト記述子や3Dセグメンテーションマップのような伝統的な明示的な表現は、その離散的で穴が開いていてノイズの多い性質によって制約され、これは正確な新しいクラス発見を妨げる。
これらの課題に対処するために,我々は,視覚埋め込み空間における意味的埋め込みとエントロピーを集約する,従来の明示的な3次元分割マップの代用として,KLの発散と巧妙に設計したEmbeding-NeRFモデルを用いた,新しいクラス発見のための汎用的でデータ効率の高いフレームワークNeurNCDを紹介した。
NeurNCDはまた、機能クエリ、機能変調、クラスタリングなどいくつかの重要なコンポーネントを統合し、事前訓練されたセマンティックセグメンテーションネットワークと暗黙の神経表現との間の効率的な機能拡張と情報交換を容易にする。
その結果,本フレームワークは,厳密なラベル付きデータセットを教師付きトレーニングや人間とのインタラクションに頼らずに,オープンワールドとクローズドワールドの両方でのセグメンテーション性能に優れることがわかった。
大規模な実験により,本手法はNYUv2とReplicaのデータセットにおける最先端のアプローチを著しく上回っていることが示された。
関連論文リスト
- Improving Open-Set Semantic Segmentation in 3D Point Clouds by Conditional Channel Capacity Maximization: Preliminary Results [1.1328543389752008]
オープンセットセマンティック(O3S)のためのプラグアンドプレイフレームワークを提案する。
セグメンテーションパイプラインを条件付きマルコフ連鎖としてモデル化することにより、条件付きチャネル容量最大化(3CM)と呼ばれる新しい正規化器項を導出する。
3CMは,エンコーダがよりリッチでラベルに依存した機能を維持することを奨励し,従来見つからなかったカテゴリを識別・分割するネットワークの能力を向上することを示す。
論文 参考訳(メタデータ) (2025-05-09T04:12:26Z) - Exclusive Style Removal for Cross Domain Novel Class Discovery [15.868889486516306]
新たなクラスディスカバリ(NCD)は,オープンワールド学習において有望な分野である。
本稿では,基本特徴と異なるスタイル情報を抽出するための排他的スタイル除去モジュールを提案する。
このモジュールは他のNCDメソッドと簡単に統合でき、異なるディストリビューションを持つ新しいクラスのパフォーマンスを向上させるプラグインとして機能する。
論文 参考訳(メタデータ) (2024-06-26T07:44:27Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - GSMFlow: Generation Shifts Mitigating Flow for Generalized Zero-Shot
Learning [55.79997930181418]
Generalized Zero-Shot Learningは、目に見えないクラスから見えないクラスに意味的な知識を移すことで、目に見えないクラスと見えないクラスの両方から画像を認識することを目的としている。
生成モデルの利点を生かして、見学したクラスから学んだ知識に基づいて、現実的な見知らぬサンプルを幻覚させることは、有望な解決策である。
本研究では,複数の条件付きアフィン結合層からなるフローベース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:04:37Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。