論文の概要: RAD: A Dataset and Benchmark for Real-Life Anomaly Detection with Robotic Observations
- arxiv url: http://arxiv.org/abs/2410.00713v1
- Date: Fri, 25 Oct 2024 03:42:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-05 04:15:24.470195
- Title: RAD: A Dataset and Benchmark for Real-Life Anomaly Detection with Robotic Observations
- Title(参考訳): RAD:ロボットによるリアルタイム異常検出のためのデータセットとベンチマーク
- Authors: Kaichen Zhou, Yang Cao, Teawhan Kim, Hao Zhao, Hao Dong, Kai Ming Ting, Ye Zhu,
- Abstract要約: Realistic Anomaly Detection データセット(RAD)は、実際のロボットアームを使用して特別に収集された最初のマルチビューRGBベースの異常検出データセットである。
RADは、13のカテゴリにわたる4765のイメージと、50以上の視点から収集された4つの欠陥タイプで構成されている。
ポーズ推定の精度を向上し、3次元点雲の再構成を容易にするためのデータ拡張手法を提案する。
- 参考スコア(独自算出の注目度): 18.23500204496233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in industrial anomaly detection have been hindered by the lack of realistic datasets that accurately represent real-world conditions. Existing algorithms are often developed and evaluated using idealized datasets, which deviate significantly from real-life scenarios characterized by environmental noise and data corruption such as fluctuating lighting conditions, variable object poses, and unstable camera positions. To address this gap, we introduce the Realistic Anomaly Detection (RAD) dataset, the first multi-view RGB-based anomaly detection dataset specifically collected using a real robot arm, providing unique and realistic data scenarios. RAD comprises 4765 images across 13 categories and 4 defect types, collected from more than 50 viewpoints, providing a comprehensive and realistic benchmark. This multi-viewpoint setup mirrors real-world conditions where anomalies may not be detectable from every perspective. Moreover, by sampling varying numbers of views, the algorithm's performance can be comprehensively evaluated across different viewpoints. This approach enhances the thoroughness of performance assessment and helps improve the algorithm's robustness. Besides, to support 3D multi-view reconstruction algorithms, we propose a data augmentation method to improve the accuracy of pose estimation and facilitate the reconstruction of 3D point clouds. We systematically evaluate state-of-the-art RGB-based and point cloud-based models using RAD, identifying limitations and future research directions. The code and dataset could found at https://github.com/kaichen-z/RAD
- Abstract(参考訳): 産業の異常検出の最近の進歩は、現実の条件を正確に表現する現実的なデータセットの欠如によって妨げられている。
既存のアルゴリズムは理想化されたデータセットを用いて開発・評価され、環境騒音や変動する照明条件、可変オブジェクトポーズ、不安定なカメラ位置などのデータ破損を特徴とする現実のシナリオから大きく逸脱する。
このギャップに対処するために、実ロボットアームを用いて特別に収集された、最初のマルチビューRGBベースの異常検出データセットであるRealistic Anomaly Detection (RAD)データセットを導入し、ユニークで現実的なデータシナリオを提供する。
RADは、13のカテゴリにわたる4765の画像と、50以上の視点から収集された4つの欠陥タイプで構成され、総合的で現実的なベンチマークを提供する。
この多視点設定は、あらゆる視点から異常を検出できない実世界の条件を反映する。
さらに,様々なビューをサンプリングすることにより,様々な視点でアルゴリズムの性能を総合的に評価することができる。
このアプローチは性能評価の徹底性を高め、アルゴリズムの堅牢性を改善するのに役立つ。
また、3次元多視点再構成アルゴリズムをサポートするために、ポーズ推定の精度を改善し、3次元点雲の再構成を容易にするデータ拡張手法を提案する。
我々は、RADを用いて最先端のRGBベースおよびポイントクラウドベースモデルを体系的に評価し、限界と今後の研究方向性を明らかにする。
コードとデータセットはhttps://github.com/kaichen-z/RADで確認できる。
関連論文リスト
- RAD: A Comprehensive Dataset for Benchmarking the Robustness of Image Anomaly Detection [4.231702796492545]
本研究では,自由なビュー,不均一な照度,ぼやけたコレクションを備えたロバスト異常検出データセットを提案する。
RADは、ワーキングプラットフォーム上の異物を異常として識別することを目的としている。
RADを用いた非教師ありゼロショット法11点の評価と解析を行った。
論文 参考訳(メタデータ) (2024-06-11T11:39:44Z) - Domain-Transferred Synthetic Data Generation for Improving Monocular Depth Estimation [9.812476193015488]
本稿では,3次元合成環境とCycleGANドメイン転送を用いたシミュレーションデータ生成手法を提案する。
本研究では,DenseDepth構造に基づく深度推定モデルを実データと模擬データの異なるトレーニングセットを用いて学習することにより,このデータ生成手法を,人気のNYUDepth V2データセットと比較する。
本稿では,Huskyロボットによる新たに収集した画像とLiDAR深度データを用いたモデルの性能評価を行い,GAN変換データを実世界のデータ,特に深度推定の有効な代替手段として有効であることを示す。
論文 参考訳(メタデータ) (2024-05-02T09:21:10Z) - SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection [18.796625355398252]
最先端のアルゴリズムは、ますます困難な設定やデータモダリティの欠陥を検出することができる。
本稿では,3次元ガウススプラッティングに基づくフレームワークSplatPoseを提案する。
競合手法に比べてトレーニングデータが少ない場合でも,トレーニング速度と推論速度,検出性能の両面で最先端の成果が得られている。
論文 参考訳(メタデータ) (2024-04-10T08:48:09Z) - FlightScope: A Deep Comprehensive Review of Aircraft Detection Algorithms in Satellite Imagery [2.9687381456164004]
本稿では,衛星画像中の航空機を識別するタスク用にカスタマイズされた,高度な物体検出アルゴリズム群を批判的に評価し,比較する。
この研究は、YOLOバージョン5と8、より高速なRCNN、CenterNet、RetinaNet、RTMDet、DETRを含む一連の方法論を含む。
YOLOv5は空中物体検出のための堅牢なソリューションとして登場し、平均的精度、リコール、ユニオンのスコアに対するインターセクションによってその重要性を裏付けている。
論文 参考訳(メタデータ) (2024-04-03T17:24:27Z) - Towards Unified 3D Object Detection via Algorithm and Data Unification [70.27631528933482]
我々は、最初の統一型マルチモーダル3Dオブジェクト検出ベンチマークMM-Omni3Dを構築し、上記のモノクロ検出器をマルチモーダルバージョンに拡張する。
設計した単分子・多モード検出器をそれぞれUniMODEとMM-UniMODEと命名した。
論文 参考訳(メタデータ) (2024-02-28T18:59:31Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - Transferable Active Grasping and Real Embodied Dataset [48.887567134129306]
ハンドマウント型RGB-Dカメラを用いて把握可能な視点を探索する方法を示す。
現実的な3段階の移動可能な能動把握パイプラインを開発し、未確認のクラッタシーンに適応する。
本研究のパイプラインでは,カテゴリ非関連行動の把握と確保において,スパース報酬問題を克服するために,新しいマスク誘導報酬を提案する。
論文 参考訳(メタデータ) (2020-04-28T08:15:35Z) - Object-oriented SLAM using Quadrics and Symmetry Properties for Indoor
Environments [11.069661312755034]
本稿ではRGB-Dカメラを用いたスパースオブジェクトレベルのSLAMアルゴリズムを提案する。
二次表現は、その位置、向き、占有空間を含むオブジェクトをコンパクトにモデル化するランドマークとして用いられる。
実験の結果,特に移動ロボットの前方軌道における最先端のアルゴリズムと比較して,提案アルゴリズムは2次再構成の精度と収束速度を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2020-04-11T04:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。