論文の概要: Real-IAD MVN: A Multi-View Normal Vector Dataset and Benchmark for High-Fidelity Industrial Anomaly Detection
- arxiv url: http://arxiv.org/abs/2605.07149v1
- Date: Fri, 08 May 2026 02:34:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.752228
- Title: Real-IAD MVN: A Multi-View Normal Vector Dataset and Benchmark for High-Fidelity Industrial Anomaly Detection
- Title(参考訳): Real-IAD MVN:高密度産業異常検出のための多視点正規ベクトルデータセットとベンチマーク
- Authors: Wenbing Zhu, Jianing Liang, Linjie Cheng, Yurui Pan, Zhuhao Chen, Qingwang Yan, Yudong Cheng, Jianghui Zhang, Mingmin Chi, Bo Peng,
- Abstract要約: 本稿では,大規模産業データセットであるReal-IAD-MVN(Multi-View Normal)を紹介する。
取得システムのアップグレードにより、Real-IAD-MVNは5つの異なる視点から高忠実面正規写像をキャプチャする。
これにより、マイクロディテールレベルでの包括的な幾何学的表現が提供され、以前は見えないサイドウォールと隠蔽された欠陥を明示的に検出することができる。
- 参考スコア(独自算出の注目度): 13.79855998324516
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial Anomaly Detection (IAD) is critical for quality control, but existing methods struggle with subtle, geometric defects. Standard 2D (RGB) images are sensitive to texture and lighting but often miss fine geometric anomalies. While 3D point clouds capture macro-shape, they are typically too sparse to detect micro-defects like scratches or pits. We address this fundamental data limitation by introducing Real-IAD-MVN (Multi-View Normal), a large-scale industrial dataset. By upgrading our acquisition system, Real-IAD-MVN captures high-fidelity surface normal maps from five distinct viewpoints, replacing sparse 3D data entirely. This provides a comprehensive geometric representation at a micro-detail level, making previously invisible side-wall and occluded defects explicitly detectable. Our experiments, conducted on this new dataset, first provide evidence that incorporating dense, multi-view pseudo-3D (surface normals) yields significantly better detection performance than using sparse 3D point cloud data. To further validate the dataset and provide a strong benchmark, we introduce a baseline method based on reconstruction, which learns to extract cross-modal unified prototypes from the image and normal map streams. We demonstrate that this unified prototype approach surpasses existing state-of-the-art multimodal fusion methods, highlighting the rich potential of our new dataset for advancing geometric anomaly detection.
- Abstract(参考訳): 産業異常検出(IAD)は品質管理に重要であるが、既存の手法では微妙な幾何学的欠陥に悩まされている。
標準2D(RGB)画像はテクスチャや照明に敏感であるが、しばしば微妙な幾何学的異常を見逃す。
3Dポイントの雲はマクロな形状をとらえるが、スクラッチやピットのような微小な欠陥を検出するには小さすぎる。
本稿では,大規模産業データセットであるReal-IAD-MVN(Multi-View Normal)を導入することで,この基本的なデータ制限に対処する。
取得システムをアップグレードすることで、Real-IAD-MVNは5つの異なる視点から高忠実な表面正規写像をキャプチャし、スパース3Dデータを完全に置き換える。
これにより、マイクロディテールレベルでの包括的な幾何学的表現が提供され、以前は見えないサイドウォールと隠蔽された欠陥を明示的に検出することができる。
この新たなデータセットを用いて行った実験は、まず、密集した多視点の擬似3D(地上標準値)を組み込むことで、スパース3Dポイントクラウドデータよりもはるかに優れた検出性能が得られるという証拠を提供する。
データセットをさらに検証し、強力なベンチマークを提供するために、画像と通常の地図ストリームからクロスモーダルな統一プロトタイプを抽出することを学ぶ再構成に基づくベースライン手法を導入する。
この統一されたプロトタイプアプローチは、既存の最先端マルチモーダル融合法を超越し、幾何学的異常検出を推し進めるための新しいデータセットの豊富な可能性を強調した。
関連論文リスト
- Back to Point: Exploring Point-Language Models for Zero-Shot 3D Anomaly Detection [13.401003727539125]
ゼロショット(ZS)3次元異常検出は信頼性の高い産業検査に不可欠である。
既存のアプローチでは、3Dポイントクラウドを2Dイメージにレンダリングし、異常検出のためにトレーニング済みのビジョンランゲージモデル(VLM)を活用する。
我々は、3Dポイントクラウドとテキスト埋め込みを効果的に整合させる新しいフレームワークであるBTPを提案する。
論文 参考訳(メタデータ) (2026-03-23T02:59:00Z) - BridgeNet: A Unified Multimodal Framework for Bridging 2D and 3D Industrial Anomaly Detection [26.864423488101075]
本稿では,新しい統合型マルチモーダル異常検出フレームワークを提案する。
コントリビューションは3つの重要な側面で構成されています。
実験の結果,MVTec-3D ADおよびEyecandiesデータセット上でのSOTA(State-of-the-art)よりも優れていた。
論文 参考訳(メタデータ) (2025-07-25T13:27:25Z) - Real-IAD D3: A Real-World 2D/Pseudo-3D/3D Dataset for Industrial Anomaly Detection [53.2590751089607]
Real-IAD D3は高精度なマルチモーダルデータセットであり、フォトメトリックステレオによって生成された擬似3Dモダリティが組み込まれている。
本稿では,RGB,点雲,擬似3次元深度情報を統合し,各モードの相補的強度を活用する効果的な手法を提案する。
本実験は,検出の堅牢性向上とIAD全体の性能向上におけるこれらのモダリティの重要性を強調した。
論文 参考訳(メタデータ) (2025-04-19T08:05:47Z) - Towards Unified 3D Object Detection via Algorithm and Data Unification [70.27631528933482]
我々は、最初の統一型マルチモーダル3Dオブジェクト検出ベンチマークMM-Omni3Dを構築し、上記のモノクロ検出器をマルチモーダルバージョンに拡張する。
設計した単分子・多モード検出器をそれぞれUniMODEとMM-UniMODEと命名した。
論文 参考訳(メタデータ) (2024-02-28T18:59:31Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Normal Transformer: Extracting Surface Geometry from LiDAR Points Enhanced by Visual Semantics [7.507853813361308]
本稿では,LiDARとカメラセンサから得られた3次元点雲と2次元カラー画像を利用して表面正規化を行うマルチモーダル手法を提案する。
本稿では,視覚的意味論と3次元幾何学的情報を巧みに融合した,トランスフォーマーに基づくニューラルネットワークアーキテクチャを提案する。
交通シーンを模倣したシミュレーション3D環境から,提案モデルが学習可能であることが確認された。
論文 参考訳(メタデータ) (2022-11-19T03:55:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。