論文の概要: SplatPose+: Real-time Image-Based Pose-Agnostic 3D Anomaly Detection
- arxiv url: http://arxiv.org/abs/2410.12080v1
- Date: Tue, 15 Oct 2024 21:52:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-17 13:42:22.523827
- Title: SplatPose+: Real-time Image-Based Pose-Agnostic 3D Anomaly Detection
- Title(参考訳): SplatPose+:リアルタイム画像ベース3次元異常検出
- Authors: Yizhe Liu, Yan Song Hu, Yuhao Chen, John Zelek,
- Abstract要約: そこで我々は,SplatPose+を提案する。SplatPose+は,局所化のためのStructure from Motion(SfM)モデルと,新規ビュー合成のための3次元ガウススプラッティング(3DGS)モデルを組み合わせたハイブリッド表現である。
提案するパイプラインには追加のSfMモデルの計算が必要であるが,SplatPoseと比較して,リアルタイムの推論速度と高速なトレーニングを提供する。
- 参考スコア(独自算出の注目度): 4.08109886949724
- License:
- Abstract: Image-based Pose-Agnostic 3D Anomaly Detection is an important task that has emerged in industrial quality control. This task seeks to find anomalies from query images of a tested object given a set of reference images of an anomaly-free object. The challenge is that the query views (a.k.a poses) are unknown and can be different from the reference views. Currently, new methods such as OmniposeAD and SplatPose have emerged to bridge the gap by synthesizing pseudo reference images at the query views for pixel-to-pixel comparison. However, none of these methods can infer in real-time, which is critical in industrial quality control for massive production. For this reason, we propose SplatPose+, which employs a hybrid representation consisting of a Structure from Motion (SfM) model for localization and a 3D Gaussian Splatting (3DGS) model for Novel View Synthesis. Although our proposed pipeline requires the computation of an additional SfM model, it offers real-time inference speeds and faster training compared to SplatPose. Quality-wise, we achieved a new SOTA on the Pose-agnostic Anomaly Detection benchmark with the Multi-Pose Anomaly Detection (MAD-SIM) dataset.
- Abstract(参考訳): 画像ベース Pose-Agnostic 3D Anomaly Detection は産業品質管理において重要な課題である。
このタスクは、異常のないオブジェクトの参照画像のセットが与えられたテスト対象のクエリ画像から異常を見つけようとする。
課題は、クエリビュー(a.k.aのポーズ)が未知であり、参照ビューと異なる可能性があることだ。
現在、OmniposeADやSplatPoseといった新しい手法が登場し、クエリビューで擬似参照画像を合成して、ピクセル間比較を行っている。
しかし、これらの手法はいずれもリアルタイムに推測することができず、大量生産のための工業的品質管理に欠かせないものである。
そこで我々は,SplatPose+を提案する。このSplatPose+は,ローカライゼーションのためのStructure from Motion(SfM)モデルと,ノベルビュー合成のための3次元ガウススティング(3DGS)モデルを組み合わせたハイブリッド表現である。
提案するパイプラインには,新たなSfMモデルの計算が必要であるが,SplatPoseと比較して,リアルタイムの推論速度と高速なトレーニングを提供する。
品質面では,マルチパス異常検出(MAD-SIM)データセットを用いたPose-Agnostic Anomaly Detectionベンチマークにおいて,新たなSOTAを実現した。
関連論文リスト
- NovelGS: Consistent Novel-view Denoising via Large Gaussian Reconstruction Model [57.92709692193132]
NovelGSは、スパースビュー画像が与えられたガウススプラッティングの拡散モデルである。
我々は3Dガウスを生成するためにトランスフォーマーネットワークを経由する新しい視点を利用する。
論文 参考訳(メタデータ) (2024-11-25T07:57:17Z) - No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:22Z) - SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection [18.796625355398252]
最先端のアルゴリズムは、ますます困難な設定やデータモダリティの欠陥を検出することができる。
本稿では,3次元ガウススプラッティングに基づくフレームワークSplatPoseを提案する。
競合手法に比べてトレーニングデータが少ない場合でも,トレーニング速度と推論速度,検出性能の両面で最先端の成果が得られている。
論文 参考訳(メタデータ) (2024-04-10T08:48:09Z) - InstantSplat: Sparse-view SfM-free Gaussian Splatting in Seconds [91.77050739918037]
スパース画像からの新しいビュー合成(NVS)は3次元コンピュータビジョンにおいて大きく進歩している。
これはStructure-from-Motion (SfM) を用いたカメラパラメータの正確な初期推定に依存する
本研究では,スパースビュー画像から堅牢なNVSを向上するための,新規で効率的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-29T17:29:58Z) - GS-Pose: Generalizable Segmentation-based 6D Object Pose Estimation with 3D Gaussian Splatting [23.724077890247834]
GS-Poseは、新しいオブジェクトの6Dポーズをローカライズし、推定するためのフレームワークである。
オブジェクトを入力画像に配置し、最初の6Dポーズを推定し、レンダリング・アンド・コンペア法でポーズを精算することで順次動作する。
市販のツールチェーンや携帯電話などのコモディティハードウェアを使用して、データベースに追加される新しいオブジェクトをキャプチャすることができる。
論文 参考訳(メタデータ) (2024-03-15T21:06:14Z) - FoundPose: Unseen Object Pose Estimation with Foundation Features [11.32559845631345]
FoundPoseは、単一のRGB画像から見えないオブジェクトを6Dポーズで推定するモデルベースの手法である。
この方法は、オブジェクトやタスク固有のトレーニングを必要とせずに、3Dモデルを使って、新しいオブジェクトを素早くオンボードできる。
論文 参考訳(メタデータ) (2023-11-30T18:52:29Z) - GigaPose: Fast and Robust Novel Object Pose Estimation via One Correspondence [64.77224422330737]
GigaPoseは、RGB画像におけるCADベースの新しいオブジェクトポーズ推定のための高速で堅牢で正確な方法である。
提案手法では,通常の3次元ではなく,2自由度空間でテンプレートをサンプリングする。
最先端の精度を実現し、既存の精錬手法とシームレスに統合することができる。
論文 参考訳(メタデータ) (2023-11-23T18:55:03Z) - OnePose++: Keypoint-Free One-Shot Object Pose Estimation without CAD
Models [51.68715543630427]
OnePoseは繰り返し可能なイメージキーポイントの検出に依存しているので、低テクスチャオブジェクトで失敗する傾向がある。
繰り返し可能なキーポイント検出の必要性を取り除くために,キーポイントフリーポーズ推定パイプラインを提案する。
2D-3Dマッチングネットワークは、クエリ画像と再構成されたポイントクラウドモデルとの間の2D-3D対応を直接確立する。
論文 参考訳(メタデータ) (2023-01-18T17:47:13Z) - UltraPose: Synthesizing Dense Pose with 1 Billion Points by Human-body
Decoupling 3D Model [58.70130563417079]
我々は,身体の発生を自由に制御できる,一連の分離されたパラメータを持つ新しい3次元人体モデルを導入する。
既存の手動注釈付きDensePose-COCOデータセットと比較して、合成されたUltraPoseは、アノテーションのコストと誤差を伴わずに、超高密度な画像-地上対応を持つ。
論文 参考訳(メタデータ) (2021-10-28T16:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。