論文の概要: Back to Point: Exploring Point-Language Models for Zero-Shot 3D Anomaly Detection
- arxiv url: http://arxiv.org/abs/2603.21511v1
- Date: Mon, 23 Mar 2026 02:59:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.456912
- Title: Back to Point: Exploring Point-Language Models for Zero-Shot 3D Anomaly Detection
- Title(参考訳): バック・トゥ・ポイント:ゼロショット3次元異常検出のための点線モデル探索
- Authors: Kaiqiang Li, Gang Li, Mingle Zhou, Min Li, Delong Han, Jin Wan,
- Abstract要約: ゼロショット(ZS)3次元異常検出は信頼性の高い産業検査に不可欠である。
既存のアプローチでは、3Dポイントクラウドを2Dイメージにレンダリングし、異常検出のためにトレーニング済みのビジョンランゲージモデル(VLM)を活用する。
我々は、3Dポイントクラウドとテキスト埋め込みを効果的に整合させる新しいフレームワークであるBTPを提案する。
- 参考スコア(独自算出の注目度): 13.401003727539125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Zero-shot (ZS) 3D anomaly detection is crucial for reliable industrial inspection, as it enables detecting and localizing defects without requiring any target-category training data. Existing approaches render 3D point clouds into 2D images and leverage pre-trained Vision-Language Models (VLMs) for anomaly detection. However, such strategies inevitably discard geometric details and exhibit limited sensitivity to local anomalies. In this paper, we revisit intrinsic 3D representations and explore the potential of pre-trained Point-Language Models (PLMs) for ZS 3D anomaly detection. We propose BTP (Back To Point), a novel framework that effectively aligns 3D point cloud and textual embeddings. Specifically, BTP aligns multi-granularity patch features with textual representations for localized anomaly detection, while incorporating geometric descriptors to enhance sensitivity to structural anomalies. Furthermore, we introduce a joint representation learning strategy that leverages auxiliary point cloud data to improve robustness and enrich anomaly semantics. Extensive experiments on Real3D-AD and Anomaly-ShapeNet demonstrate that BTP achieves superior performance in ZS 3D anomaly detection. Code will be available at \href{https://github.com/wistful-8029/BTP-3DAD}{https://github.com/wistful-8029/BTP-3DAD}.
- Abstract(参考訳): ゼロショット(ZS)3D異常検出は、目標カテゴリのトレーニングデータを必要としない欠陥の検出と位置決めを可能にするため、信頼性の高い産業検査に不可欠である。
既存のアプローチでは、3Dポイントクラウドを2Dイメージにレンダリングし、異常検出のためにトレーニング済みのビジョンランゲージモデル(VLM)を活用する。
しかし、このような戦略は必然的に幾何学的詳細を捨て、局所的な異常に対して限定的な感度を示す。
本稿では,固有3次元表現を再検討し,ZS 3D異常検出のための事前学習されたポイント・ランゲージ・モデル(PLM)の可能性を探る。
我々は、3Dポイントクラウドとテキスト埋め込みを効果的に整合させる新しいフレームワークであるBTP(Back To Point)を提案する。
具体的には、BTPは、多粒度パッチの特徴を局所的な異常検出のためのテキスト表現と整合させ、幾何学的記述子を組み込んで構造的異常に対する感受性を高める。
さらに,補助点クラウドデータを活用する共同表現学習戦略を導入し,ロバスト性の向上と異常セマンティクスの充実を図る。
Real3D-ADとAnomaly-ShapeNetの大規模な実験により、BTPはZS 3D異常検出において優れた性能を発揮することが示された。
コードは \href{https://github.com/wistful-8029/BTP-3DAD}{https://github.com/wistful-8029/BTP-3DAD} で入手できる。
関連論文リスト
- PointAD: Comprehending 3D Anomalies from Points and Pixels for Zero-shot 3D Anomaly Detection [13.60524473223155]
本稿では,未知の物体上の3次元異常を認識するために,CLIPの強力な一般化能力を伝達する新しい手法であるPointADを紹介する。
PointADは、複数の2Dレンダリングに3D異常をレンダリングし、それらを3D空間に投影する。
我々のモデルはRGB情報を直接統合することができ、プラグアンドプレイ方式で3D異常の理解をさらに強化することができる。
論文 参考訳(メタデータ) (2024-10-01T01:40:22Z) - 3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。
拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。
さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-07T23:46:41Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。