論文の概要: DMP-3DAD: Cross-Category 3D Anomaly Detection via Realistic Depth Map Projection with Few Normal Samples
- arxiv url: http://arxiv.org/abs/2602.10806v1
- Date: Wed, 11 Feb 2026 12:47:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.89426
- Title: DMP-3DAD: Cross-Category 3D Anomaly Detection via Realistic Depth Map Projection with Few Normal Samples
- Title(参考訳): DMP-3DAD: 正規サンプルが少ない実写深度マップ投影によるクロスキャテゴリー3次元異常検出
- Authors: Zi Wang, Katsuya Hotta, Koichiro Kamide, Yawen Zou, Jianjian Qin, Chao Zhang, Jun Yu,
- Abstract要約: 3次元点雲のカテゴリ間異常検出は、見えない物体が対象カテゴリーに属するかどうかを判定することを目的としている。
既存のほとんどのメソッドはカテゴリ固有のトレーニングに依存しており、数ショットのシナリオでは柔軟性が制限される。
DMP-3DADは、マルチビューリアルな深度マップ投影に基づく3次元異常検出のための訓練不要フレームワークである。
- 参考スコア(独自算出の注目度): 15.21047221062711
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-category anomaly detection for 3D point clouds aims to determine whether an unseen object belongs to a target category using only a few normal examples. Most existing methods rely on category-specific training, which limits their flexibility in few-shot scenarios. In this paper, we propose DMP-3DAD, a training-free framework for cross-category 3D anomaly detection based on multi-view realistic depth map projection. Specifically, by converting point clouds into a fixed set of realistic depth images, our method leverages a frozen CLIP visual encoder to extract multi-view representations and performs anomaly detection via weighted feature similarity, which does not require any fine-tuning or category-dependent adaptation. Extensive experiments on the ShapeNetPart dataset demonstrate that DMP-3DAD achieves state-of-the-art performance under few-shot setting. The results show that the proposed approach provides a simple yet effective solution for practical cross-category 3D anomaly detection.
- Abstract(参考訳): 3次元点雲のクロスカテゴリ異常検出は、いくつかの通常の例を用いて、目に見えない物体が対象のカテゴリに属しているかどうかを判定することを目的としている。
既存のほとんどのメソッドはカテゴリ固有のトレーニングに依存しており、数ショットのシナリオでは柔軟性が制限される。
本稿では,DMP-3DADを提案する。DMP-3DADは,複数視点のリアルな深度マップ投影に基づくカテゴリ間3D異常検出のためのトレーニングフリーフレームワークである。
具体的には、点雲を現実的な深度画像の固定セットに変換することで、凍結したCLIPビジュアルエンコーダを利用してマルチビュー表現を抽出し、微調整やカテゴリ依存の適応を必要としない重み付き特徴類似性による異常検出を行う。
ShapeNetPartデータセットの大規模な実験は、DMP-3DADが数ショット設定で最先端のパフォーマンスを達成することを示した。
提案手法は, 実用的3次元異常検出のための簡易かつ効果的な解法であることを示す。
関連論文リスト
- CatFree3D: Category-agnostic 3D Object Detection with Diffusion [63.75470913278591]
本稿では,2次元検出と深度予測から3次元検出を分離するパイプラインを提案する。
また,3次元検出結果の正確な評価のために,正規化ハンガリー距離(NHD)指標も導入した。
論文 参考訳(メタデータ) (2024-08-22T22:05:57Z) - CLIP3D-AD: Extending CLIP for 3D Few-Shot Anomaly Detection with Multi-View Images Generation [22.850815902535988]
CLIP上に拡張された効率的な3D-FSAD法であるCLIP3D-ADを提案する。
正常画像上の異常画像をサンプルペアとして合成し,CLIPを3次元の異常分類とセグメンテーションに適応させる。
本手法は,MVTec-3D ADデータセット上での3次元ショット異常分類とセグメンテーションの競合性能を有する。
論文 参考訳(メタデータ) (2024-06-27T07:13:09Z) - SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection [18.796625355398252]
最先端のアルゴリズムは、ますます困難な設定やデータモダリティの欠陥を検出することができる。
本稿では,3次元ガウススプラッティングに基づくフレームワークSplatPoseを提案する。
競合手法に比べてトレーニングデータが少ない場合でも,トレーニング速度と推論速度,検出性能の両面で最先端の成果が得られている。
論文 参考訳(メタデータ) (2024-04-10T08:48:09Z) - Towards Unified 3D Object Detection via Algorithm and Data Unification [70.27631528933482]
我々は、最初の統一型マルチモーダル3Dオブジェクト検出ベンチマークMM-Omni3Dを構築し、上記のモノクロ検出器をマルチモーダルバージョンに拡張する。
設計した単分子・多モード検出器をそれぞれUniMODEとMM-UniMODEと命名した。
論文 参考訳(メタデータ) (2024-02-28T18:59:31Z) - S$^3$-MonoDETR: Supervised Shape&Scale-perceptive Deformable Transformer for Monocular 3D Object Detection [21.96072831561483]
本稿では,モノクロ3次元物体検出のためのSupervised Shape&Scale-perceptive Deformable Attention' (S$3$-DA) モジュールを提案する。
これにより、S$3$-DAは、任意のカテゴリに属するクエリポイントに対する受容的フィールドを効果的に推定し、堅牢なクエリ機能を生成することができる。
KITTIとOpenデータセットの実験では、S$3$-DAが検出精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-09-02T12:36:38Z) - MonoTDP: Twin Depth Perception for Monocular 3D Object Detection in
Adverse Scenes [49.21187418886508]
本論文は,モノTDP(MonoTDP)と呼ばれる悪シーンにおける2つの深度を知覚するモノクル3次元検出モデルを提案する。
まず、制御不能な気象条件を扱うモデルを支援するための適応学習戦略を導入し、様々な劣化要因による劣化を著しく抑制する。
そこで本研究では, シーン深度と物体深度を同時に推定する新たな2つの深度認識モジュールを提案する。
論文 参考訳(メタデータ) (2023-05-18T13:42:02Z) - Scatter Points in Space: 3D Detection from Multi-view Monocular Images [8.71944437852952]
単眼画像からの3次元物体検出は,コンピュータビジョンの課題であり,長年の課題である。
近年の手法では, 空間に密集した正規3次元格子をサンプリングすることにより, マルチビュー特性を集約する傾向にある。
そこで本研究では,データ空間に擬似曲面点を散布し,データの分散性を維持するための学習可能なキーポイントサンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-08-31T09:38:05Z) - Improving 3D Object Detection with Channel-wise Transformer [58.668922561622466]
我々は手作りの最小限の設計で2段階の3Dオブジェクト検出フレームワーク(CT3D)を提案する。
CT3Dは、提案対応の埋め込みとチャンネルワイドコンテキストアグリゲーションを同時に行う。
これはKITTIテスト3D検出ベンチマークで中等車カテゴリーで81.77%のAPを達成した。
論文 参考訳(メタデータ) (2021-08-23T02:03:40Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。