論文の概要: PointAD+: Learning Hierarchical Representations for Zero-shot 3D Anomaly Detection
- arxiv url: http://arxiv.org/abs/2509.03277v1
- Date: Wed, 03 Sep 2025 12:53:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.518554
- Title: PointAD+: Learning Hierarchical Representations for Zero-shot 3D Anomaly Detection
- Title(参考訳): PointAD+: ゼロショット3次元異常検出のための階層的表現学習
- Authors: Qihang Zhou, Shibo He, Jiangtao Yan, Wenchao Meng, Jiming Chen,
- Abstract要約: 私たちはCLIPの堅牢な2D一般化機能を、非常に多様なクラスセマンティクスの未確認オブジェクト間で3D異常を特定するために転送する。
点レベルの情報と画素レベルの情報を活用することにより,3次元異常を包括的に検出し,セグメンテーションする統合フレームワークを提案する。
- 参考スコア(独自算出の注目度): 33.92549630504532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we aim to transfer CLIP's robust 2D generalization capabilities to identify 3D anomalies across unseen objects of highly diverse class semantics. To this end, we propose a unified framework to comprehensively detect and segment 3D anomalies by leveraging both point- and pixel-level information. We first design PointAD, which leverages point-pixel correspondence to represent 3D anomalies through their associated rendering pixel representations. This approach is referred to as implicit 3D representation, as it focuses solely on rendering pixel anomalies but neglects the inherent spatial relationships within point clouds. Then, we propose PointAD+ to further broaden the interpretation of 3D anomalies by introducing explicit 3D representation, emphasizing spatial abnormality to uncover abnormal spatial relationships. Hence, we propose G-aggregation to involve geometry information to enable the aggregated point representations spatially aware. To simultaneously capture rendering and spatial abnormality, PointAD+ proposes hierarchical representation learning, incorporating implicit and explicit anomaly semantics into hierarchical text prompts: rendering prompts for the rendering layer and geometry prompts for the geometry layer. A cross-hierarchy contrastive alignment is further introduced to promote the interaction between the rendering and geometry layers, facilitating mutual anomaly learning. Finally, PointAD+ integrates anomaly semantics from both layers to capture the generalized anomaly semantics. During the test, PointAD+ can integrate RGB information in a plug-and-play manner and further improve its detection performance. Extensive experiments demonstrate the superiority of PointAD+ in ZS 3D anomaly detection across unseen objects with highly diverse class semantics, achieving a holistic understanding of abnormality.
- Abstract(参考訳): 本稿では,CLIPの頑健な2次元一般化機能を用いて,高度に多様なクラスセマンティクスを持つ未知のオブジェクト間で3次元異常を識別することを目的とする。
そこで本研究では,点レベルの情報と画素レベルの情報を活用することで,3D異常を包括的に検出し,セグメンテーションする統合フレームワークを提案する。
まず、点-画素対応を利用して3次元の異常を表現するポイントADを、関連するレンダリングピクセル表現により設計する。
このアプローチは暗黙の3D表現と呼ばれ、ピクセル異常のレンダリングにのみ焦点をあてるが、点雲内の空間的関係を無視する。
そこで我々は, 空間的異常を強調し, 異常な空間的関係を明らかにすることで, 3次元の異常の解釈をさらに広げるため, PointAD+を提案する。
そこで本研究では,Gアグリゲーション(G-aggregation)を提案し,幾何学情報を包含して,集約された点表現を空間的に認識できるようにする。
レンダリングと空間的異常を同時に捉えるために、PointAD+は階層的表現学習を提案し、暗黙的および明示的な異常意味論を階層的テキストプロンプトに組み込む。
さらに、レンダリング層と幾何学層との相互作用を促進するために、相互の異常学習を促進するために、階層間コントラストアライメントを導入する。
最後に、PointAD+は両方のレイヤの異常セマンティクスを統合し、一般化された異常セマンティクスをキャプチャする。
テスト中、PointAD+はRGB情報をプラグアンドプレイで統合し、さらに検出性能を向上させることができる。
大規模な実験により、ZS 3D異常検出におけるPointAD+の優位性が、非常に多様なクラスセマンティクスを持つ未確認物体にわたって示され、異常の全体的理解が達成された。
関連論文リスト
- Cross-Modal Geometric Hierarchy Fusion: An Implicit-Submap Driven Framework for Resilient 3D Place Recognition [9.411542547451193]
本稿では,密度に依存しない幾何学的推論により3次元位置認識を再定義するフレームワークを提案する。
具体的には、元のシーンポイント雲密度の干渉に免疫する弾性点に基づく暗黙の3次元表現を導入する。
これら2種類の情報を活用することで,鳥眼視と3Dセグメントの両視点から幾何学的情報を融合する記述子を得る。
論文 参考訳(メタデータ) (2025-06-17T07:04:07Z) - GREAT: Geometry-Intention Collaborative Inference for Open-Vocabulary 3D Object Affordance Grounding [53.42728468191711]
Open-Vocabulary 3D object affordance groundingは、任意の命令で3Dオブジェクト上のアクション可能性の領域を予測することを目的としている。
GREAT (GeometRy-intEntion collAboraTive Inference) を提案する。
論文 参考訳(メタデータ) (2024-11-29T11:23:15Z) - PointAD: Comprehending 3D Anomalies from Points and Pixels for Zero-shot 3D Anomaly Detection [13.60524473223155]
本稿では,未知の物体上の3次元異常を認識するために,CLIPの強力な一般化能力を伝達する新しい手法であるPointADを紹介する。
PointADは、複数の2Dレンダリングに3D異常をレンダリングし、それらを3D空間に投影する。
我々のモデルはRGB情報を直接統合することができ、プラグアンドプレイ方式で3D異常の理解をさらに強化することができる。
論文 参考訳(メタデータ) (2024-10-01T01:40:22Z) - OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation [67.56268991234371]
OV-Uni3DETRは、様々なシナリオにおける最先端のパフォーマンスを達成し、既存のメソッドを平均6%以上上回っている。
コードと事前訓練されたモデルは、後にリリースされる。
論文 参考訳(メタデータ) (2024-03-28T17:05:04Z) - OA-DET3D: Embedding Object Awareness as a General Plug-in for Multi-Camera 3D Object Detection [77.43427778037203]
我々は3Dオブジェクト検出を改善するプラグインモジュールであるOA-DET3Dを紹介する。
OA-DET3Dは、オブジェクト中心の深度情報と前景の擬似点を活用することにより、オブジェクトの表現を高める。
我々は、OA-DET3Dの有効性を検証するために、nuScenesデータセットとArgoverse 2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2023-01-13T06:02:31Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Fine-Grained 3D Shape Classification with Hierarchical Part-View
Attentions [70.0171362989609]
本稿では,FG3D-Netと呼ばれる新しい3次元形状分類手法を提案する。
詳細な3次元形状データセットに基づく結果から,本手法が他の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-05-26T06:53:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。