論文の概要: MC3D-AD: A Unified Geometry-aware Reconstruction Model for Multi-category 3D Anomaly Detection
- arxiv url: http://arxiv.org/abs/2505.01969v1
- Date: Sun, 04 May 2025 02:38:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.358593
- Title: MC3D-AD: A Unified Geometry-aware Reconstruction Model for Multi-category 3D Anomaly Detection
- Title(参考訳): MC3D-AD:多カテゴリー3次元異常検出のための統一幾何認識再構成モデル
- Authors: Jiayi Cheng, Can Gao, Jie Zhou, Jiajun Wen, Tao Dai, Jinbao Wang,
- Abstract要約: 本稿では,Multi-Category 3D Anomaly Detection (MC3D-AD) のための新しい統一モデルを提案する。
局所的およびグローバルな幾何認識情報を利用して、すべてのカテゴリの正規表現を再構築することを目的としている。
MC3D-ADは、公開されているReal3D-ADとAnomaly-ShapeNetデータセットで評価される。
- 参考スコア(独自算出の注目度): 33.46875410103838
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D Anomaly Detection (AD) is a promising means of controlling the quality of manufactured products. However, existing methods typically require carefully training a task-specific model for each category independently, leading to high cost, low efficiency, and weak generalization. Therefore, this paper presents a novel unified model for Multi-Category 3D Anomaly Detection (MC3D-AD) that aims to utilize both local and global geometry-aware information to reconstruct normal representations of all categories. First, to learn robust and generalized features of different categories, we propose an adaptive geometry-aware masked attention module that extracts geometry variation information to guide mask attention. Then, we introduce a local geometry-aware encoder reinforced by the improved mask attention to encode group-level feature tokens. Finally, we design a global query decoder that utilizes point cloud position embeddings to improve the decoding process and reconstruction ability. This leads to local and global geometry-aware reconstructed feature tokens for the AD task. MC3D-AD is evaluated on two publicly available Real3D-AD and Anomaly-ShapeNet datasets, and exhibits significant superiority over current state-of-the-art single-category methods, achieving 3.1\% and 9.3\% improvement in object-level AUROC over Real3D-AD and Anomaly-ShapeNet, respectively. The source code will be released upon acceptance.
- Abstract(参考訳): 3D異常検出(AD)は製造品の品質を制御できる有望な手段である。
しかし、既存の手法では、通常、各カテゴリのタスク固有のモデルを個別に訓練し、高いコスト、低い効率、弱い一般化をもたらす。
そこで本研究では,局所的およびグローバルな幾何認識情報を用いて,すべてのカテゴリの正規表現を再構築することを目的とした,MC3D-AD(Multi-Category 3D Anomaly Detection)の統一モデルを提案する。
まず,異なるカテゴリの頑健で一般化された特徴を学習するために,マスクの注意を導くために形状変化情報を抽出する適応型幾何対応マスキングモジュールを提案する。
次に,グループレベルの特徴トークンを符号化するために,マスクアテンションの改善により強化された局所幾何認識エンコーダを提案する。
最後に、ポイントクラウド位置埋め込みを利用したグローバルクエリデコーダを設計し、デコードプロセスと再構成能力を改善する。
これにより、ADタスクの局所的およびグローバルな幾何認識された特徴トークンが再構築される。
MC3D-ADは、公開されているReal3D-ADとAnomaly-ShapeNetの2つのデータセットで評価されており、現在の最先端の単一カテゴリ法よりも大幅に優れており、Real3D-ADとAnomaly-ShapeNetよりもオブジェクトレベルのAUROCが3.1\%と9.3\%改善されている。
ソースコードは受理時に公開される。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation [65.33726478659304]
GeoLRM(Geometry-Aware Large Restruction Model)は、512kガウスと21の入力画像で11GBのGPUメモリで高品質な資産を予測できる手法である。
従来の作品では、3D構造の本質的な空間性は無視されており、3D画像と2D画像の間の明示的な幾何学的関係は利用されていない。
GeoLRMは、3Dポイントを直接処理し、変形可能なクロスアテンション機構を使用する新しい3D対応トランスフォーマー構造を導入することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2024-06-21T17:49:31Z) - S$^3$-MonoDETR: Supervised Shape&Scale-perceptive Deformable Transformer for Monocular 3D Object Detection [21.96072831561483]
本稿では,モノクロ3次元物体検出のためのSupervised Shape&Scale-perceptive Deformable Attention' (S$3$-DA) モジュールを提案する。
これにより、S$3$-DAは、任意のカテゴリに属するクエリポイントに対する受容的フィールドを効果的に推定し、堅牢なクエリ機能を生成することができる。
KITTIとOpenデータセットの実験では、S$3$-DAが検出精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-09-02T12:36:38Z) - Hierarchical Point Attention for Indoor 3D Object Detection [111.04397308495618]
本研究は、点ベース変圧器検出器の汎用階層設計として、2つの新しい注意操作を提案する。
まず、よりきめ細かい特徴学習を可能にするために、シングルスケールの入力機能からマルチスケールトークンを構築するマルチスケール注意(MS-A)を提案する。
第2に,適応型アテンション領域を持つサイズ適応型ローカルアテンション(Local-A)を提案する。
論文 参考訳(メタデータ) (2023-01-06T18:52:12Z) - CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds [55.44204039410225]
本稿では,CAGroup3Dという新しい2段階完全スパース3Dオブジェクト検出フレームワークを提案する。
提案手法は,まず,オブジェクト表面のボクセル上でのクラス認識型局所群戦略を活用することによって,高品質な3D提案を生成する。
不正なボクセルワイドセグメンテーションにより欠落したボクセルの特徴を回復するために,完全にスパースな畳み込み型RoIプールモジュールを構築した。
論文 参考訳(メタデータ) (2022-10-09T13:38:48Z) - 3D Unsupervised Region-Aware Registration Transformer [13.137287695912633]
ディープニューラルネットワークによるロバストポイントクラウド登録モデルを学習することが、強力なパラダイムとして浮上した。
自己教師型3次元形状再構成損失を伴って入力形状を異なる領域に分割できる3次元領域分割モジュールの設計を提案する。
実験により,我々の3D-URRTは,様々なベンチマークデータセットよりも優れた登録性能が得られることが示された。
論文 参考訳(メタデータ) (2021-10-07T15:06:52Z) - I3DOL: Incremental 3D Object Learning without Catastrophic Forgetting [38.7610646073842]
i3dolはまず、3dオブジェクトの新しいクラスを継続的に学習する。
アダプティブジオメトリックセントロイドモジュールは、識別可能な局所幾何学構造を構築するように設計されています。
局所幾何学構造の寄与度を定量化する幾何学的注意メカニズムが開発された。
論文 参考訳(メタデータ) (2020-12-16T15:17:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。