論文の概要: Cheating Depth: Enhancing 3D Surface Anomaly Detection via Depth
Simulation
- arxiv url: http://arxiv.org/abs/2311.01117v1
- Date: Thu, 2 Nov 2023 09:44:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-03 14:01:19.625357
- Title: Cheating Depth: Enhancing 3D Surface Anomaly Detection via Depth
Simulation
- Title(参考訳): cheating depth: 深度シミュレーションによる3次元表面異常検出の強化
- Authors: Vitjan Zavrtanik, Matej Kristan, Danijel Sko\v{c}aj
- Abstract要約: RGBによる表面異常検出法は大幅に進歩している。
特定の表面異常は、RGBだけでは事実上見えず、3D情報の取り込みが必要である。
産業深度データセット上のRGBバックボーンの再トレーニングは、十分な大規模なデータセットの可用性の制限によって妨げられる。
本稿では,既存のMVTec3D異常検出ベンチマークよりも優れた3DSRによる表面異常検出手法を提案する。
- 参考スコア(独自算出の注目度): 12.843938169660404
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: RGB-based surface anomaly detection methods have advanced significantly.
However, certain surface anomalies remain practically invisible in RGB alone,
necessitating the incorporation of 3D information. Existing approaches that
employ point-cloud backbones suffer from suboptimal representations and reduced
applicability due to slow processing. Re-training RGB backbones, designed for
faster dense input processing, on industrial depth datasets is hindered by the
limited availability of sufficiently large datasets. We make several
contributions to address these challenges. (i) We propose a novel Depth-Aware
Discrete Autoencoder (DADA) architecture, that enables learning a general
discrete latent space that jointly models RGB and 3D data for 3D surface
anomaly detection. (ii) We tackle the lack of diverse industrial depth datasets
by introducing a simulation process for learning informative depth features in
the depth encoder. (iii) We propose a new surface anomaly detection method
3DSR, which outperforms all existing state-of-the-art on the challenging
MVTec3D anomaly detection benchmark, both in terms of accuracy and processing
speed. The experimental results validate the effectiveness and efficiency of
our approach, highlighting the potential of utilizing depth information for
improved surface anomaly detection.
- Abstract(参考訳): RGBによる表面異常検出法は大幅に進歩している。
しかし、特定の表面異常はrgb単独では事実上見えず、3d情報の取り込みが必要となる。
ポイントクラウドバックボーンを使用する既存のアプローチは、最適化下表現と、処理の遅さによる適用性の低下に悩まされている。
産業深度データセット上での高密度入力処理を高速化するために設計されたRGBバックボーンの再トレーニングは、十分な大規模なデータセットの可用性の制限によって妨げられる。
これらの課題に対処するために、私たちはいくつかの貢献をしています。
(i)3次元表面異常検出のためにrgbと3dデータを共同でモデル化する汎用離散潜在空間を学習できる新しい奥行き認識型離散オートエンコーダ(dada)アーキテクチャを提案する。
(2)深度エンコーダにおける情報深度特徴を学習するためのシミュレーションプロセスを導入することにより,多様な産業深度データセットの欠如に対処する。
3) 既存のMVTec3D異常検出ベンチマークにおいて, 精度と処理速度の両面において, 従来技術よりも優れた表面異常検出手法3DSRを提案する。
提案手法の有効性と有効性を検証し,表面異常検出の改善に深度情報を活用する可能性を強調した。
関連論文リスト
- 3D Harmonic Loss: Towards Task-consistent and Time-friendly 3D Object
Detection on Edge for Intelligent Transportation System [28.55894241049706]
本稿では,ポイントクラウドに基づく不整合予測を緩和する3次元高調波損失関数を提案する。
提案手法はベンチマークモデルよりも性能が大幅に向上する。
私たちのコードはオープンソースで公開されています。
論文 参考訳(メタデータ) (2022-11-07T10:11:48Z) - Depth Estimation Matters Most: Improving Per-Object Depth Estimation for
Monocular 3D Detection and Tracking [47.59619420444781]
検出・追跡を含む単眼的3D知覚へのアプローチは、LiDARベースの手法と比較して性能が劣ることが多い。
本稿では,オブジェクト(トラックレット)の複数のフレームに異なる表現(RGBと擬似LiDAR)と時間情報を組み合わせた多層融合手法を提案する。
論文 参考訳(メタデータ) (2022-06-08T03:37:59Z) - HiMODE: A Hybrid Monocular Omnidirectional Depth Estimation Model [3.5290359800552946]
HiMODE は CNN+ Transformer アーキテクチャに基づく新しい単分子全方位深度推定モデルである。
360deg単分子深度推定において,HiMODEは最先端の性能を実現することができることを示す。
論文 参考訳(メタデータ) (2022-04-11T11:11:43Z) - Joint Learning of Salient Object Detection, Depth Estimation and Contour
Extraction [91.43066633305662]
RGB-D Salient Object Detection (SOD) のための新しいマルチタスク・マルチモーダルフィルタトランス (MMFT) ネットワークを提案する。
具体的には、深度推定、健全な物体検出、輪郭推定の3つの相補的なタスクを統合する。マルチタスク機構は、タスク認識の特徴を補助タスクから学習するためのモデルを促進する。
実験の結果、複数のデータセット上での深度に基づくRGB-D SOD法をはるかに上回るだけでなく、高品質の深度マップと塩分濃度を同時に正確に予測できることがわかった。
論文 参考訳(メタデータ) (2022-03-09T17:20:18Z) - Consistent Depth Prediction under Various Illuminations using Dilated
Cross Attention [1.332560004325655]
我々は,インターネット3D屋内シーンを用いて照明を手動で調整し,写真リアルなRGB写真とその対応する深度とBRDFマップを作成することを提案する。
異なる照明条件下での深度予測の整合性を維持するため,これらの拡張された特徴に横断的な注意を払っている。
提案手法は,Variデータセットの最先端手法との比較により評価され,実験で有意な改善が見られた。
論文 参考訳(メタデータ) (2021-12-15T10:02:46Z) - Sparse Depth Completion with Semantic Mesh Deformation Optimization [4.03103540543081]
本稿では、RGB画像とスパース深度サンプルを入力とし、完全な深度マップを予測し、最適化後のニューラルネットワークを提案する。
評価結果は,屋内および屋外両方のデータセットにおいて,既存の成果を一貫して上回る結果となった。
論文 参考訳(メタデータ) (2021-12-10T13:01:06Z) - Virtual Normal: Enforcing Geometric Constraints for Accurate and Robust
Depth Prediction [87.08227378010874]
深度予測における高次3次元幾何学的制約の重要性を示す。
単純な幾何学的制約を強制する損失項を設計することにより、単眼深度推定の精度とロバスト性を大幅に改善する。
The-of-the-art results of learning metric depth on NYU Depth-V2 and KITTI。
論文 参考訳(メタデータ) (2021-03-07T00:08:21Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - 3D Dense Geometry-Guided Facial Expression Synthesis by Adversarial
Learning [54.24887282693925]
本稿では,3次元密度(深度,表面正規度)情報を表現操作に用いる新しいフレームワークを提案する。
既製の最先端3D再構成モデルを用いて深度を推定し,大規模RGB-Depthデータセットを作成する。
実験により,提案手法は競争ベースラインと既存の芸術を大きなマージンで上回ることを示した。
論文 参考訳(メタデータ) (2020-09-30T17:12:35Z) - Accurate RGB-D Salient Object Detection via Collaborative Learning [101.82654054191443]
RGB-Dサリエンシ検出は、いくつかの課題シナリオにおいて素晴らしい能力を示している。
本稿では,エッジ,深度,塩分濃度をより効率的に活用する新しい協調学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T04:33:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。