論文の概要: Late-decoupled 3D Hierarchical Semantic Segmentation with Semantic Prototype Discrimination based Bi-branch Supervision
- arxiv url: http://arxiv.org/abs/2511.16650v1
- Date: Thu, 20 Nov 2025 18:54:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.796435
- Title: Late-decoupled 3D Hierarchical Semantic Segmentation with Semantic Prototype Discrimination based Bi-branch Supervision
- Title(参考訳): 意味的原型判別に基づく後期分離型3次元階層的セマンティックセマンティックセマンティックセグメンテーション
- Authors: Shuyu Cao, Chongshou Li, Jie Xu, Tianrui Li, Na Zhao,
- Abstract要約: 3次元階層的セマンティックセマンティックセマンティクスは、インテリジェンス応用に不可欠である。
I)パラメータ共有モデルによるマルチラベル学習は、クロス階層最適化において、多階層的な競合を引き起こす可能性がある。
本稿では,一次3DHS分枝と補助的識別分枝を有する新しい枠組みを提案する。
- 参考スコア(独自算出の注目度): 12.549493479238015
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D hierarchical semantic segmentation (3DHS) is crucial for embodied intelligence applications that demand a multi-grained and multi-hierarchy understanding of 3D scenes. Despite the progress, previous 3DHS methods have overlooked following two challenges: I) multi-label learning with a parameter-sharing model can lead to multi-hierarchy conflicts in cross-hierarchy optimization, and II) the class imbalance issue is inevitable across multiple hierarchies of 3D scenes, which makes the model performance become dominated by major classes. To address these issues, we propose a novel framework with a primary 3DHS branch and an auxiliary discrimination branch. Specifically, to alleviate the multi-hierarchy conflicts, we propose a late-decoupled 3DHS framework which employs multiple decoders with the coarse-to-fine hierarchical guidance and consistency. The late-decoupled architecture can mitigate the underfitting and overfitting conflicts among multiple hierarchies and can also constrain the class imbalance problem in each individual hierarchy. Moreover, we introduce a 3DHS-oriented semantic prototype based bi-branch supervision mechanism, which additionally learns class-wise discriminative point cloud features and performs mutual supervision between the auxiliary and 3DHS branches, to enhance the class-imbalance segmentation. Extensive experiments on multiple datasets and backbones demonstrate that our approach achieves state-of-the-art 3DHS performance, and its core components can also be used as a plug-and-play enhancement to improve previous methods.
- Abstract(参考訳): 3D階層的セマンティックセマンティックセマンティクス(3DHS)は、3Dシーンの多義的で多義的な理解を必要とするインテリジェンスアプリケーションに不可欠である。
I)パラメータ共有モデルによるマルチラベル学習は、階層間最適化において多階層的な競合を引き起こす可能性があるし、II) クラス不均衡問題は、3Dシーンの複数の階層間で不可避であり、モデルのパフォーマンスが主要なクラスに支配される。
これらの課題に対処するため,本研究では,プライマリ3DHSブランチと補助識別ブランチを備えた新しいフレームワークを提案する。
具体的には,複数階層間の衝突を軽減するために,大まかな階層化誘導と整合性を備えた複数デコーダを用いた遅延デカップリング3DHSフレームワークを提案する。
遅延分離アーキテクチャは、複数の階層間の対立を緩和し、過度に適合させ、また各階層におけるクラス不均衡問題を抑えることができる。
さらに,3DHS型セマンティックプロトタイプをベースとしたバイブランチ監視機構を導入し,クラス単位での識別点雲の特徴を学習し,補助枝と3DHS枝の相互監督を行い,クラス不均衡のセグメンテーションを強化する。
複数のデータセットとバックボーンに関する大規模な実験により、我々のアプローチは最先端の3DHS性能を実現し、そのコアコンポーネントは、以前の手法を改善するためにプラグイン・アンド・プレイの強化としても使用できることを示した。
関連論文リスト
- H3Former: Hypergraph-based Semantic-Aware Aggregation via Hyperbolic Hierarchical Contrastive Loss for Fine-Grained Visual Classification [17.431440244641585]
H3Formerは、きめ細かい視覚分類のための新しいトークン・ツー・リージョンフレームワークである。
SAAMは、トークン間で重み付けされたハイパーグラフを動的に構築するために、マルチスケールのコンテキストキューを利用する。
HHCLは非ユークリッド埋め込み空間において階層的意味制約を強制する。
論文 参考訳(メタデータ) (2025-11-13T12:49:10Z) - A Semantics-Aware Hierarchical Self-Supervised Approach to Classification of Remote Sensing Images [12.282079123411947]
本稿では,階層的特徴と関係を学習するためのセマンティックス・アウェア・ヒエラルキー・コンセンサス(SAHC)手法を提案する。
SAHC法は、階層的な複雑さの異なる3つのベンチマークデータセットで評価される。
実験により,ネットワーク学習の指導における提案手法の有効性と,リモートセンシング画像分類タスクにおける階層的コンセンサスの有効性が示された。
論文 参考訳(メタデータ) (2025-10-06T15:30:39Z) - Feature Identification for Hierarchical Contrastive Learning [7.655211354400059]
本稿では,2つの新しい階層型コントラスト学習法を提案する。
提案手法は,階層レベルのクラス間関係と不均衡なクラス分布を明示的にモデル化する。
提案手法は,線形評価における最先端性能を実現し,既存の階層的コントラスト学習法を精度で2ポイント向上させる。
論文 参考訳(メタデータ) (2025-10-01T12:46:47Z) - CCL-LGS: Contrastive Codebook Learning for 3D Language Gaussian Splatting [53.15827818829865]
2Dプリンシパルに依存しているメソッドは、横断的なセマンティクスの不整合という重要な課題に陥る。
CCL-LGSは、多視点セマンティックキューを統合することで、ビューに一貫性のあるセマンティック監視を実現する新しいフレームワークである。
我々の枠組みは、カテゴリー識別性を維持しながら意味的対立を明示的に解決する。
論文 参考訳(メタデータ) (2025-05-26T19:09:33Z) - Proto-FG3D: Prototype-based Interpretable Fine-Grained 3D Shape Classification [59.68055837500357]
本稿では,3次元形状のきめ細かい分類のためのプロトタイプベースフレームワークProto-FG3Dを提案する。
Proto-FG3Dは、Prototype Associationを介して、共同でマルチビューとマルチカテゴリ表現学習を確立する。
Proto-FG3Dは、精度、透明な予測、そして視覚化によるアドホックな解釈可能性において最先端の手法を超越している。
論文 参考訳(メタデータ) (2025-05-23T09:31:02Z) - Multi-task Learning with 3D-Aware Regularization [55.97507478913053]
本稿では,画像エンコーダから抽出した特徴を共有3D特徴空間に投影することで,複数のタスクをインタフェースする構造化3D認識正規化器を提案する。
提案手法はアーキテクチャ非依存であり,従来のマルチタスクバックボーンにプラグインすることで,性能を向上できることを示す。
論文 参考訳(メタデータ) (2023-10-02T08:49:56Z) - HKNAS: Classification of Hyperspectral Imagery Based on Hyper Kernel
Neural Architecture Search [104.45426861115972]
設計したハイパーカーネルを利用して,構造パラメータを直接生成することを提案する。
我々は1次元または3次元の畳み込みを伴う画素レベルの分類と画像レベルの分類を別々に行う3種類のネットワークを得る。
6つの公開データセットに関する一連の実験は、提案手法が最先端の結果を得ることを示した。
論文 参考訳(メタデータ) (2023-04-23T17:27:40Z) - HS3: Learning with Proper Task Complexity in Hierarchically Supervised
Semantic Segmentation [81.87943324048756]
本稿では,タスクの複雑さによって意味のある表現を学習するためのセグメンテーションネットワークの中間層を監督するトレーニングスキームである階層的意味論(Hierarchically Supervised Semantic,HS3)を提案する。
提案するHS3-Fuseフレームワークはセグメンテーション予測をさらに改善し、2つの大きなセグメンテーションベンチマークであるNYUD-v2とCityscapesで最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-03T16:33:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。