論文の概要: HOC-Search: Efficient CAD Model and Pose Retrieval from RGB-D Scans
- arxiv url: http://arxiv.org/abs/2309.06107v1
- Date: Tue, 12 Sep 2023 10:20:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 13:30:04.366435
- Title: HOC-Search: Efficient CAD Model and Pose Retrieval from RGB-D Scans
- Title(参考訳): HOC-Search: RGB-Dの効率的なCADモデルと詩検索
- Authors: Stefan Ainetter, Sinisa Stekovic, Friedrich Fraundorfer, Vincent
Lepetit
- Abstract要約: 移動RGB-Dカメラで撮影するシーンにおいて,オブジェクトの高品質CADモデルを取得するための,自動かつ効率的な手法を提案する。
本手法は, 実物体に非常によく適合するCADモデルを, 網羅探索と比較して10倍から120倍の高速化率で検索することを示した。
- 参考スコア(独自算出の注目度): 32.79581980662367
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an automated and efficient approach for retrieving high-quality
CAD models of objects and their poses in a scene captured by a moving RGB-D
camera. We first investigate various objective functions to measure similarity
between a candidate CAD object model and the available data, and the best
objective function appears to be a "render-and-compare" method comparing depth
and mask rendering. We thus introduce a fast-search method that approximates an
exhaustive search based on this objective function for simultaneously
retrieving the object category, a CAD model, and the pose of an object given an
approximate 3D bounding box. This method involves a search tree that organizes
the CAD models and object properties including object category and pose for
fast retrieval and an algorithm inspired by Monte Carlo Tree Search, that
efficiently searches this tree. We show that this method retrieves CAD models
that fit the real objects very well, with a speed-up factor of 10x to 120x
compared to exhaustive search.
- Abstract(参考訳): 移動RGB-Dカメラで撮影するシーンにおいて,オブジェクトの高品質CADモデルとそのポーズを自動かつ効率的に検索する手法を提案する。
まず,候補CADオブジェクトモデルと利用可能なデータとの類似性を測定するための様々な目的関数について検討し,最良目的関数は深度とマスクレンダリングを比較する「render-and-compare」手法であると考えられる。
そこで本研究では,オブジェクトカテゴリ,CADモデル,および近似3次元バウンディングボックスが与えられたオブジェクトのポーズを同時に検索するために,この目的関数に基づいて全探索を近似する高速探索手法を提案する。
本手法は,オブジェクトカテゴリを含むCADモデルとオブジェクト特性を整理し,高速検索を行う探索木と,この木を効率的に検索するモンテカルロ木探索にインスパイアされたアルゴリズムを含む。
本手法では, 実物体に適合するCADモデルを, 徹底探索と比較して10倍から120倍の高速化率で検索する。
関連論文リスト
- PickScan: Object discovery and reconstruction from handheld interactions [99.99566882133179]
シーンの3次元表現を再構成する対話誘導型クラス依存型手法を開発した。
我々の主な貢献は、操作対象のインタラクションを検出し、操作対象のマスクを抽出する新しいアプローチである。
相互作用ベースとクラス非依存のベースラインであるCo-Fusionと比較すると、これはシャムファー距離の73%の減少に相当する。
論文 参考訳(メタデータ) (2024-11-17T23:09:08Z) - ComboVerse: Compositional 3D Assets Creation Using Spatially-Aware Diffusion Guidance [76.7746870349809]
複雑な構成で高品質な3Dアセットを生成する3D生成フレームワークであるComboVerseについて,複数のモデルを組み合わせることを学習して紹介する。
提案手法は,標準スコア蒸留法と比較して,物体の空間的アライメントを重視している。
論文 参考訳(メタデータ) (2024-03-19T03:39:43Z) - OnePose++: Keypoint-Free One-Shot Object Pose Estimation without CAD
Models [51.68715543630427]
OnePoseは繰り返し可能なイメージキーポイントの検出に依存しているので、低テクスチャオブジェクトで失敗する傾向がある。
繰り返し可能なキーポイント検出の必要性を取り除くために,キーポイントフリーポーズ推定パイプラインを提案する。
2D-3Dマッチングネットワークは、クエリ画像と再構成されたポイントクラウドモデルとの間の2D-3D対応を直接確立する。
論文 参考訳(メタデータ) (2023-01-18T17:47:13Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - OnePose: One-Shot Object Pose Estimation without CAD Models [30.307122037051126]
OnePoseはCADモデルに依存しておらず、インスタンスやカテゴリ固有のネットワークトレーニングなしで任意のカテゴリのオブジェクトを処理できる。
OnePoseは視覚的なローカライゼーションからアイデアを導き、オブジェクトのスパースSfMモデルを構築するために、オブジェクトの単純なRGBビデオスキャンしか必要としない。
既存の視覚的ローカライゼーション手法の低速な実行を緩和するため,クエリ画像中の2D関心点とSfMモデルの3Dポイントとを直接マッチングするグラフアテンションネットワークを提案する。
論文 参考訳(メタデータ) (2022-05-24T17:59:21Z) - Weakly-Supervised End-to-End CAD Retrieval to Scan Objects [25.41908065938424]
本稿では,意味的および構造的に類似したCADモデルをクエリ3Dスキャンシーンに検索する手法を提案する。
提案手法では,トップモデルとスキャンクエリとの幾何的および知覚的類似性により,エンド・ツー・エンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2022-03-24T06:30:47Z) - Patch2CAD: Patchwise Embedding Learning for In-the-Wild Shape Retrieval
from a Single Image [58.953160501596805]
本稿では,2次元画像と3次元CADモデルの結合埋め込み空間をパッチワイズで構築する手法を提案する。
我々のアプローチは、CADが正確に一致しない実世界のシナリオにおける最先端技術よりも堅牢である。
論文 参考訳(メタデータ) (2021-08-20T20:58:52Z) - 3D Object Detection and Pose Estimation of Unseen Objects in Color
Images with Local Surface Embeddings [35.769234123059086]
本研究では, 画像中のオブジェクトの3次元ポーズを, テクスチャのないCADモデルでのみ検出し, 推定する手法を提案する。
我々のアプローチはディープラーニングと3D幾何を組み合わせており、CADモデルと入力画像とを一致させるために、局所的な3D幾何の埋め込みに依存している。
我々は,Mask-RCNNをクラスに依存しない方法で,再学習せずに新しい物体を検出できることを示す。
論文 参考訳(メタデータ) (2020-10-08T15:57:06Z) - Mask2CAD: 3D Shape Prediction by Learning to Segment and Retrieve [54.054575408582565]
本稿では,既存の3次元モデルの大規模データセットを活用し,画像中の物体の3次元構造を理解することを提案する。
本稿では,実世界の画像と検出対象を共同で検出するMask2CADについて,最も類似したCADモデルとそのポーズを最適化する。
これにより、画像内のオブジェクトのクリーンで軽量な表現が生成される。
論文 参考訳(メタデータ) (2020-07-26T00:08:37Z) - Multi-Resolution POMDP Planning for Multi-Object Search in 3D [26.683481431467783]
フラストタル形状の視野を持つ3次元領域における多対象探索のためのPOMDPの定式化について述べる。
我々は,対象物体の異なる解像度レベルでの不確かさを捉えるために,新しいオクツリーに基づく信念表現を設計する。
移動ロボットによる2つの10m$2×2$m領域の異なる高さに配置された物体を、ベースを移動させ、胴体を作動させることにより、その位置を推定する手法を実証する。
論文 参考訳(メタデータ) (2020-05-06T14:54:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。