Fugu-MT 論文翻訳(概要): SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection

論文の概要: SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection

arxiv url: http://arxiv.org/abs/2404.06832v1
Date: Wed, 10 Apr 2024 08:48:09 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-11 15:10:01.494879
Title: SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection
Title（参考訳）: SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection
Authors: Mathis Kruse, Marco Rudolph, Dominik Woiwode, Bodo Rosenhahn,
Abstract要約: 最先端のアルゴリズムは、ますます困難な設定やデータモダリティの欠陥を検出することができる。本稿では,3次元ガウススプラッティングに基づくフレームワークSplatPoseを提案する。競合手法に比べてトレーニングデータが少ない場合でも,トレーニング速度と推論速度,検出性能の両面で最先端の成果が得られている。
参考スコア（独自算出の注目度）: 18.796625355398252
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Detecting anomalies in images has become a well-explored problem in both academia and industry. State-of-the-art algorithms are able to detect defects in increasingly difficult settings and data modalities. However, most current methods are not suited to address 3D objects captured from differing poses. While solutions using Neural Radiance Fields (NeRFs) have been proposed, they suffer from excessive computation requirements, which hinder real-world usability. For this reason, we propose the novel 3D Gaussian splatting-based framework SplatPose which, given multi-view images of a 3D object, accurately estimates the pose of unseen views in a differentiable manner, and detects anomalies in them. We achieve state-of-the-art results in both training and inference speed, and detection performance, even when using less training data than competing methods. We thoroughly evaluate our framework using the recently proposed Pose-agnostic Anomaly Detection benchmark and its multi-pose anomaly detection (MAD) data set.
Abstract（参考訳）: 画像中の異常を検出することは、学術と産業の両方でよく研究されている問題となっている。最先端のアルゴリズムは、ますます困難な設定やデータモダリティの欠陥を検出することができる。しかし、現在のほとんどの方法は、異なるポーズからキャプチャされた3Dオブジェクトに対処するのに適していない。 Neural Radiance Fields (NeRF) を用いたソリューションが提案されているが、計算の過剰な要求に悩まされ、現実のユーザビリティを損なう。そこで本研究では,3Dオブジェクトのマルチビュー画像が与えられた3Dガウススプラッティングに基づくフレームワークであるSplatPoseを提案する。競合手法に比べてトレーニングデータが少ない場合でも,トレーニング速度と推論速度,検出性能の両面で最先端の成果が得られている。我々は,最近提案されたPose-Agnostic Anomaly Detectionベンチマークと,その多目的異常検出(MAD)データセットを用いて,我々のフレームワークを徹底的に評価した。

関連論文リスト

DMP-3DAD: Cross-Category 3D Anomaly Detection via Realistic Depth Map Projection with Few Normal Samples [15.21047221062711]
3次元点雲のカテゴリ間異常検出は、見えない物体が対象カテゴリーに属するかどうかを判定することを目的としている。既存のほとんどのメソッドはカテゴリ固有のトレーニングに依存しており、数ショットのシナリオでは柔軟性が制限される。 DMP-3DADは、マルチビューリアルな深度マップ投影に基づく3次元異常検出のための訓練不要フレームワークである。
論文参考訳（メタデータ） (2026-02-11T12:47:38Z)
PLOT: Pseudo-Labeling via Video Object Tracking for Scalable Monocular 3D Object Detection [35.524943073010675]
モノクロ3Dオブジェクト検出(M3OD)は、高アノテーションコストと固有の2Dから3Dの曖昧さに起因するデータの不足により、長年にわたって課題に直面してきた。ビデオデータのみを使用し、マルチビュー設定、追加センサー、カメラポーズ、ドメイン固有のトレーニングを必要とせず、より堅牢な疑似ラベルフレームワークを提案する。
論文参考訳（メタデータ） (2025-07-03T07:46:39Z)
Towards Zero-shot 3D Anomaly Localization [58.62650061201283]
3DzALは3D異常検出とローカライゼーションのためのパッチレベルの新しいコントラスト学習フレームワークである。 3DzALは最先端の異常検出および局所化性能より優れていることを示す。
論文参考訳（メタデータ） (2024-12-05T16:25:27Z)
RIGI: Rectifying Image-to-3D Generation Inconsistency via Uncertainty-aware Learning [27.4552892119823]
マルチビュースナップショットの不整合は、しばしばオブジェクト境界に沿ってノイズやアーティファクトを導入し、3D再構成プロセスを損なう。 3次元ガウススプラッティング(3DGS)を3次元再構成に利用し,不確実性認識学習を再現プロセスに統合する。適応的な画素単位の損失重み付けを適用してモデルを正規化し、不確実領域における再構成強度を低減させる。
論文参考訳（メタデータ） (2024-11-28T02:19:28Z)
PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文参考訳（メタデータ） (2024-10-29T15:28:15Z)
CatFree3D: Category-agnostic 3D Object Detection with Diffusion [63.75470913278591]
本稿では,2次元検出と深度予測から3次元検出を分離するパイプラインを提案する。また,3次元検出結果の正確な評価のために,正規化ハンガリー距離(NHD)指標も導入した。
論文参考訳（メタデータ） (2024-08-22T22:05:57Z)
Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文参考訳（メタデータ） (2024-01-06T07:30:41Z)
PAD: A Dataset and Benchmark for Pose-agnostic Anomaly Detection [28.973078719467516]
我々は,多目的異常検出データセットとPose-Agnostic Anomaly Detectionベンチマークを開発する。具体的には、さまざまなポーズと、シミュレーションと実環境の両方で高品質で多様な3D異常を持つ20個の複合形状のレゴ玩具を用いて、MADを構築します。また,ポーズに依存しない異常検出のために,MADを用いて訓練した新しいOmniposeADを提案する。
論文参考訳（メタデータ） (2023-10-11T17:59:56Z)
SOGDet: Semantic-Occupancy Guided Multi-view 3D Object Detection [19.75965521357068]
本稿では,SOGDet(Semantic-Occupancy Guided Multi-view Object Detection)と呼ばれる新しい手法を提案する。以上の結果から,SOGDet は nuScenes Detection Score (NDS) と平均平均精度 (mAP) の3つのベースライン法の性能を一貫して向上させることがわかった。これは、3Dオブジェクト検出と3Dセマンティック占有の組み合わせが、3D環境をより包括的に認識し、より堅牢な自律運転システムの構築を支援することを示唆している。
論文参考訳（メタデータ） (2023-08-26T07:38:21Z)
Predict to Detect: Prediction-guided 3D Object Detection using Sequential Images [15.51093009875854]
本稿では,予測スキームを検出フレームワークに統合した新しい3Dオブジェクト検出モデルP2Dを提案する。 P2Dは、過去のフレームのみを用いて現在のフレーム内のオブジェクト情報を予測し、時間的動きの特徴を学習する。次に,予測対象情報に基づいて,バードアイビュー(Bird's-Eye-View,BEV)特徴を注意深く活用する時間的特徴集約手法を提案する。
論文参考訳（メタデータ） (2023-06-14T14:22:56Z)
PONet: Robust 3D Human Pose Estimation via Learning Orientations Only [116.1502793612437]
本稿では,学習向きのみを用いて3次元ポーズを頑健に推定できる新しいPose Orientation Net(PONet)を提案する。 PONetは、局所的な画像証拠を利用して、これらの手足の3D方向を推定し、3Dポーズを復元する。我々は,Human3.6M,MPII,MPI-INF-3DHP,3DPWを含む複数のデータセットについて評価を行った。
論文参考訳（メタデータ） (2021-12-21T12:48:48Z)
Learning Skeletal Graph Neural Networks for Hard 3D Pose Estimation [14.413034040734477]
本稿では, 深度あいまいさ, 自己閉塞性, 複雑なポーズを有するハードポーズに対する新しい骨格型GNN学習ソリューションを提案する。 Human3.6Mデータセットの実験結果から, 平均予測精度が10.3%向上したことがわかった。
論文参考訳（メタデータ） (2021-08-16T15:42:09Z)
Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文参考訳（メタデータ） (2021-07-08T15:19:36Z)
Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文参考訳（メタデータ） (2021-03-30T10:38:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。