論文の概要: Combining Local and Global Pose Estimation for Precise Tracking of
Similar Objects
- arxiv url: http://arxiv.org/abs/2201.13278v1
- Date: Mon, 31 Jan 2022 14:36:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 16:58:33.052969
- Title: Combining Local and Global Pose Estimation for Precise Tracking of
Similar Objects
- Title(参考訳): 類似物体の高精度追跡のための局所的および大域的ポーズ推定
- Authors: Niklas Gard, Anna Hilsmann, Peter Eisert
- Abstract要約: 類似・非テクスチャオブジェクトに対する多目的6D検出・追跡パイプラインを提案する。
合成画像のみを訓練した新しいネットワークアーキテクチャは、複数のオブジェクトの同時ポーズ推定を可能にする。
建設現場における実際のAR支援アプリケーションにおいて,システムがどのように利用できるかを示す。
- 参考スコア(独自算出の注目度): 2.861848675707602
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a multi-object 6D detection and tracking pipeline
for potentially similar and non-textured objects. The combination of a
convolutional neural network for object classification and rough pose
estimation with a local pose refinement and an automatic mismatch detection
enables direct application in real-time AR scenarios. A new network
architecture, trained solely with synthetic images, allows simultaneous pose
estimation of multiple objects with reduced GPU memory consumption and enhanced
performance. In addition, the pose estimates are further improved by a local
edge-based refinement step that explicitly exploits known object geometry
information. For continuous movements, the sole use of local refinement reduces
pose mismatches due to geometric ambiguities or occlusions. We showcase the
entire tracking pipeline and demonstrate the benefits of the combined approach.
Experiments on a challenging set of non-textured similar objects demonstrate
the enhanced quality compared to the baseline method. Finally, we illustrate
how the system can be used in a real AR assistance application within the field
of construction.
- Abstract(参考訳): 本稿では,類似した非テキストオブジェクトに対するマルチオブジェクト6d検出と追跡パイプラインを提案する。
畳み込みニューラルネットワークによるオブジェクト分類と粗いポーズ推定と、局所的なポーズ補正と自動ミスマッチ検出の組み合わせは、リアルタイムarシナリオで直接適用することができる。
合成画像のみをトレーニングした新しいネットワークアーキテクチャでは、GPUメモリ使用量の削減とパフォーマンスの向上により、複数のオブジェクトの同時ポーズ推定が可能になる。
さらに、既知のオブジェクト幾何情報を明示的に活用するローカルエッジベースのリファインメントステップによって、ポーズ推定がさらに改善される。
連続運動において、局所的な精細化の唯一の使用は、幾何学的曖昧さや閉塞によるポーズミスマッチを減少させる。
トラッキングパイプライン全体を紹介し、組み合わせたアプローチのメリットを示します。
非テクスチャ類似オブジェクトの挑戦的なセットの実験は、ベースライン法と比較して品質が向上したことを示している。
最後に,建設現場における実際のAR支援アプリケーションにおいて,システムがどのように利用できるかを説明する。
関連論文リスト
- FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - Spatial Reasoning for Few-Shot Object Detection [21.3564383157159]
本稿では,空間的推論フレームワークを提案する。
グラフ畳み込みネットワークをRoIとその関連性はそれぞれノードとエッジとして定義する。
提案手法は最先端の手法を著しく上回り, 広範囲なアブレーション研究により有効性を検証する。
論文 参考訳(メタデータ) (2022-11-02T12:38:08Z) - Learning to Complete Object Shapes for Object-level Mapping in Dynamic
Scenes [30.500198859451434]
本研究では,動的シーンにおけるオブジェクトの分割,追跡,再構築を同時に行うオブジェクトレベルのマッピングシステムを提案する。
さらに、深度入力とカテゴリレベルの前の形状からの再構成を条件にすることで、完全なジオメトリを予測し、完成させることができる。
実世界の合成シーケンスと実世界のシーケンスの両方で定量的に定性的にテストすることで,その有効性を評価する。
論文 参考訳(メタデータ) (2022-08-09T22:56:33Z) - Robust Change Detection Based on Neural Descriptor Fields [53.111397800478294]
我々は、部分的に重なり合う観測結果とノイズのある局所化結果に頑健なオブジェクトレベルのオンライン変化検出手法を開発した。
形状符号の類似性を利用して物体を連想させ, 局所的な物体近傍の空間配置を比較することにより, 観測重複や局所雑音に対する頑健性を示す。
論文 参考訳(メタデータ) (2022-08-01T17:45:36Z) - RISP: Rendering-Invariant State Predictor with Differentiable Simulation
and Rendering for Cross-Domain Parameter Estimation [110.4255414234771]
既存のソリューションでは、大量のトレーニングデータが必要か、未知のレンダリング設定への一般化性が欠如している。
本稿では、ドメインのランダム化と微分可能なレンダリング勾配を併用してこの問題に対処する手法を提案する。
提案手法は, 再構成誤差を大幅に低減し, 未知のレンダリング構成間の一般化性が向上する。
論文 参考訳(メタデータ) (2022-05-11T17:59:51Z) - Object-Augmented RGB-D SLAM for Wide-Disparity Relocalisation [3.888848425698769]
本稿では、一貫したオブジェクトマップを構築し、地図内のオブジェクトのセントロイドに基づいて再局在を行うことができるオブジェクト拡張RGB-D SLAMシステムを提案する。
論文 参考訳(メタデータ) (2021-08-05T11:02:25Z) - End-to-end learning of keypoint detection and matching for relative pose
estimation [1.8352113484137624]
2つの画像間の相対的なポーズを推定する新しい手法を提案する。
キーポイント検出,説明抽出,マッチング,ロバストなポーズ推定を共同で学習する。
本研究では,既知のポーズを持つ画像データベース内でのクエリ画像の視覚的局在化の手法を示す。
論文 参考訳(メタデータ) (2021-04-02T15:16:17Z) - Category Level Object Pose Estimation via Neural Analysis-by-Synthesis [64.14028598360741]
本稿では、勾配に基づくフィッティング法とパラメトリックニューラルネットワーク合成モジュールを組み合わせる。
画像合成ネットワークは、ポーズ設定空間を効率的に分散するように設計されている。
本研究では,2次元画像のみから高精度に物体の向きを復元できることを実験的に示す。
論文 参考訳(メタデータ) (2020-08-18T20:30:47Z) - Object-based Illumination Estimation with Rendering-aware Neural
Networks [56.01734918693844]
個々の物体とその局所画像領域のRGBD外観から高速環境光推定手法を提案する。
推定照明により、仮想オブジェクトは実際のシーンと一貫性のあるシェーディングでARシナリオでレンダリングできる。
論文 参考訳(メタデータ) (2020-08-06T08:23:19Z) - Single View Metrology in the Wild [94.7005246862618]
本研究では,物体の3次元の高さや地上のカメラの高さで表現されるシーンの絶対的なスケールを再現する,単一ビューメロジに対する新しいアプローチを提案する。
本手法は,被写体の高さなどの3Dエンティティによる未知のカメラとの相互作用から,弱い教師付き制約を抑えるために設計されたディープネットワークによって学習されたデータ駆動の先行情報に依存する。
いくつかのデータセットと仮想オブジェクト挿入を含むアプリケーションに対して、最先端の定性的かつ定量的な結果を示す。
論文 参考訳(メタデータ) (2020-07-18T22:31:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。