論文の概要: Real-IAD D3: A Real-World 2D/Pseudo-3D/3D Dataset for Industrial Anomaly Detection
- arxiv url: http://arxiv.org/abs/2504.14221v1
- Date: Sat, 19 Apr 2025 08:05:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 04:07:42.451144
- Title: Real-IAD D3: A Real-World 2D/Pseudo-3D/3D Dataset for Industrial Anomaly Detection
- Title(参考訳): Real-IAD D3:産業異常検出のための実世界2D/Pseudo-3D/3Dデータセット
- Authors: Wenbing Zhu, Lidong Wang, Ziqing Zhou, Chengjie Wang, Yurui Pan, Ruoyi Zhang, Zhuhao Chen, Linjie Cheng, Bin-Bin Gao, Jiangning Zhang, Zhenye Gan, Yuxie Wang, Yulong Chen, Shuguang Qian, Mingmin Chi, Bo Peng, Lizhuang Ma,
- Abstract要約: Real-IAD D3は高精度なマルチモーダルデータセットであり、フォトメトリックステレオによって生成された擬似3Dモダリティが組み込まれている。
本稿では,RGB,点雲,擬似3次元深度情報を統合し,各モードの相補的強度を活用する効果的な手法を提案する。
本実験は,検出の堅牢性向上とIAD全体の性能向上におけるこれらのモダリティの重要性を強調した。
- 参考スコア(独自算出の注目度): 53.2590751089607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The increasing complexity of industrial anomaly detection (IAD) has positioned multimodal detection methods as a focal area of machine vision research. However, dedicated multimodal datasets specifically tailored for IAD remain limited. Pioneering datasets like MVTec 3D have laid essential groundwork in multimodal IAD by incorporating RGB+3D data, but still face challenges in bridging the gap with real industrial environments due to limitations in scale and resolution. To address these challenges, we introduce Real-IAD D3, a high-precision multimodal dataset that uniquely incorporates an additional pseudo3D modality generated through photometric stereo, alongside high-resolution RGB images and micrometer-level 3D point clouds. Real-IAD D3 features finer defects, diverse anomalies, and greater scale across 20 categories, providing a challenging benchmark for multimodal IAD Additionally, we introduce an effective approach that integrates RGB, point cloud, and pseudo-3D depth information to leverage the complementary strengths of each modality, enhancing detection performance. Our experiments highlight the importance of these modalities in boosting detection robustness and overall IAD performance. The dataset and code are publicly accessible for research purposes at https://realiad4ad.github.io/Real-IAD D3
- Abstract(参考訳): 産業的異常検出(IAD)の複雑さの増大は、マシンビジョン研究の焦点領域としてマルチモーダル検出法を位置づけている。
しかし、IAD用に特別に調整された専用のマルチモーダルデータセットは依然として限られている。
MVTec 3Dのようなピアネリングデータセットは、RGB+3Dデータを組み込むことで、マルチモーダルIADに不可欠な基盤を築いたが、スケールと解像度の制限により、実際の産業環境とのギャップを埋めるという課題に直面している。
これらの課題に対処するために、高解像度のRGB画像とマイクロメートルレベルの3D点雲とともに、フォトメトリックステレオによって生成された追加の擬似3Dモダリティを独自に組み込んだ高精度マルチモーダルデータセットであるReal-IAD D3を導入する。
さらに、RGB、点雲、擬似3D深度情報を統合して各モードの相補的強度を活用し、検出性能を向上させる効果的なアプローチを導入する。
本実験は,検出の堅牢性向上とIAD全体の性能向上におけるこれらのモダリティの重要性を強調した。
データセットとコードは、https://realiad4ad.github.io/Real-IAD D3で研究目的で公開されている。
関連論文リスト
- Efficient Multimodal 3D Object Detector via Instance-Level Contrastive Distillation [17.634678949648208]
提案したICDフレームワークとCLFM(Cross Linear Attention Fusion Module)を組み込んだ高速かつ効果的なマルチモーダル3Dオブジェクト検出器を提案する。
我々の3Dオブジェクト検出器は、より優れた効率を実現しつつ、最先端(SOTA)手法より優れています。
論文 参考訳(メタデータ) (2025-03-17T08:26:11Z) - A Survey on RGB, 3D, and Multimodal Approaches for Unsupervised Industrial Image Anomaly Detection [24.634671653473397]
無監督産業画像異常検出技術は、異常サンプルの不足を効果的に克服する。
このアーティカルは、3つのモード設定でUIADタスクの包括的なレビューを提供する。
論文 参考訳(メタデータ) (2024-10-29T12:12:45Z) - What Matters in Range View 3D Object Detection [15.147558647138629]
ライダーベースの知覚パイプラインは複雑なシーンを解釈するために3Dオブジェクト検出モデルに依存している。
過去のレンジビュー文献に提案されている複数の手法を使わずに、レンジビュー3次元オブジェクト検出モデル間の最先端を実現する。
論文 参考訳(メタデータ) (2024-07-23T18:42:37Z) - OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation [67.56268991234371]
OV-Uni3DETRは、様々なシナリオにおける最先端のパフォーマンスを達成し、既存のメソッドを平均6%以上上回っている。
コードと事前訓練されたモデルは、後にリリースされる。
論文 参考訳(メタデータ) (2024-03-28T17:05:04Z) - Towards Unified 3D Object Detection via Algorithm and Data Unification [70.27631528933482]
我々は、最初の統一型マルチモーダル3Dオブジェクト検出ベンチマークMM-Omni3Dを構築し、上記のモノクロ検出器をマルチモーダルバージョンに拡張する。
設計した単分子・多モード検出器をそれぞれUniMODEとMM-UniMODEと命名した。
論文 参考訳(メタデータ) (2024-02-28T18:59:31Z) - Cheating Depth: Enhancing 3D Surface Anomaly Detection via Depth
Simulation [12.843938169660404]
RGBによる表面異常検出法は大幅に進歩している。
特定の表面異常は、RGBだけでは事実上見えず、3D情報の取り込みが必要である。
産業深度データセット上のRGBバックボーンの再トレーニングは、十分な大規模なデータセットの可用性の制限によって妨げられる。
本稿では,既存のMVTec3D異常検出ベンチマークよりも優れた3DSRによる表面異常検出手法を提案する。
論文 参考訳(メタデータ) (2023-11-02T09:44:21Z) - Real3D-AD: A Dataset of Point Cloud Anomaly Detection [75.56719157477661]
本稿では,高精度なクラウド異常検出データセットであるReal3D-ADを紹介する。
1,254個の高解像度の3Dアイテムが、各項目に4万から数百万のポイントがあり、Real3D-ADは高精度な3D産業異常検出のための最大のデータセットである。
本稿では,高精度点雲異常検出のためのベースライン手法が存在しないことを明らかにする,Real3D-ADの総合ベンチマークを提案する。
論文 参考訳(メタデータ) (2023-09-23T00:43:38Z) - Multimodal Industrial Anomaly Detection via Hybrid Fusion [59.16333340582885]
ハイブリッド核融合方式を用いた新しいマルチモーダル異常検出法を提案する。
本モデルでは,MVTecD-3 ADデータセットにおける検出精度とセグメンテーション精度の両面で,最先端(SOTA)手法より優れている。
論文 参考訳(メタデータ) (2023-03-01T15:48:27Z) - DMD: A Large-Scale Multi-Modal Driver Monitoring Dataset for Attention
and Alertness Analysis [54.198237164152786]
視覚は運転監視システム(DMS)の最も豊かで費用対効果の高い技術である
十分に大規模で包括的なデータセットの欠如は、DMS開発の進展のボトルネックとなっている。
本稿では,実運転シナリオとシミュレーション運転シナリオを含む広範囲なデータセットであるドライバモニタリングデータセット(DMD)を紹介する。
論文 参考訳(メタデータ) (2020-08-27T12:33:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。