論文の概要: SRT3D: A Sparse Region-Based 3D Object Tracking Approach for the Real
World
- arxiv url: http://arxiv.org/abs/2110.12715v1
- Date: Mon, 25 Oct 2021 07:58:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-27 02:43:00.675751
- Title: SRT3D: A Sparse Region-Based 3D Object Tracking Approach for the Real
World
- Title(参考訳): SRT3D:現実世界におけるスパース領域に基づく3次元物体追跡手法
- Authors: Manuel Stoiber, Martin Pfanne, Klaus H. Strobl, Rudolph Triebel, Alin
Albu-Sch\"affer
- Abstract要約: 領域ベースの手法は、散らばったシーンにおけるテクスチャのない物体のモデルベースで単色な3D追跡において、ますます人気が高まっている。
しかし、ほとんどの手法は計算コストが高く、リアルタイムにかなりのリソースを必要とする。
SRT3Dは、この効率のギャップを埋める3Dオブジェクト追跡のためのスパース領域ベースのアプローチである。
- 参考スコア(独自算出の注目度): 10.029003607782878
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Region-based methods have become increasingly popular for model-based,
monocular 3D tracking of texture-less objects in cluttered scenes. However,
while they achieve state-of-the-art results, most methods are computationally
expensive, requiring significant resources to run in real-time. In the
following, we build on our previous work and develop SRT3D, a sparse
region-based approach to 3D object tracking that bridges this gap in
efficiency. Our method considers image information sparsely along so-called
correspondence lines that model the probability of the object's contour
location. We thereby improve on the current state of the art and introduce
smoothed step functions that consider a defined global and local uncertainty.
For the resulting probabilistic formulation, a thorough analysis is provided.
Finally, we use a pre-rendered sparse viewpoint model to create a joint
posterior probability for the object pose. The function is maximized using
second-order Newton optimization with Tikhonov regularization. During the pose
estimation, we differentiate between global and local optimization, using a
novel approximation for the first-order derivative employed in the Newton
method. In multiple experiments, we demonstrate that the resulting algorithm
improves the current state of the art both in terms of runtime and quality,
performing particularly well for noisy and cluttered images encountered in the
real world.
- Abstract(参考訳): 領域ベースの手法は、乱雑なシーンにおけるテクスチャレスオブジェクトのモデルベース、モノクロの3d追跡にますます人気がある。
しかし、最新の結果が得られる一方で、ほとんどのメソッドは計算コストが高く、リアルタイムに実行するためにかなりのリソースを必要とする。
以下では、前回の作業に基づいて、このギャップを効率的に橋渡しする3dオブジェクトトラッキングに対するスパースなリージョンベースのアプローチであるsrt3dを開発した。
本手法では,物体の輪郭位置の確率をモデル化するいわゆる対応線に沿って画像情報を疎らに検討する。
これにより,技術の現状を改善し,大域的かつ局所的な不確実性を考慮したスムーズなステップ関数を導入する。
得られた確率的定式化のために、徹底的な分析を提供する。
最後に、事前レンダリングされたスパース視点モデルを用いて、オブジェクトのポーズの結合後確率を生成する。
この関数はティホノフ正則化による二階ニュートン最適化によって最大化される。
ポーズ推定では、ニュートン法で用いられる一階微分に対する新しい近似を用いて、大域的最適化と局所的最適化を区別する。
複数の実験において,本アルゴリズムは,実世界で遭遇するノイズの多い画像に対して特に良好に動作し,実行時と品質の両面で技術の現状を改善することを実証した。
関連論文リスト
- GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z) - Volumetric Semantically Consistent 3D Panoptic Mapping [77.13446499924977]
非構造環境における自律エージェントに適したセマンティック3Dマップを生成することを目的としたオンライン2次元から3次元のセマンティック・インスタンスマッピングアルゴリズムを提案する。
マッピング中にセマンティック予測の信頼性を統合し、セマンティックおよびインスタンス一貫性のある3D領域を生成する新しい方法を導入する。
提案手法は,パブリックな大規模データセット上での最先端の精度を実現し,多くの広く使用されているメトリクスを改善した。
論文 参考訳(メタデータ) (2023-09-26T08:03:10Z) - FvOR: Robust Joint Shape and Pose Optimization for Few-view Object
Reconstruction [37.81077373162092]
数枚の画像から正確な3Dオブジェクトモデルを再構築することは、コンピュータビジョンにおいて難しい問題である。
FvORは、ノイズの多い入力ポーズを持つ数枚の画像から正確な3Dモデルを予測する学習ベースのオブジェクト再構成手法である。
論文 参考訳(メタデータ) (2022-05-16T15:39:27Z) - Stereo Neural Vernier Caliper [57.187088191829886]
学習に基づくステレオ3Dオブジェクト検出のための新しいオブジェクト中心フレームワークを提案する。
初期3次元立方体推定値から改良された更新を予測する方法の問題に対処する。
提案手法は,KITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-21T14:36:07Z) - LocATe: End-to-end Localization of Actions in 3D with Transformers [91.28982770522329]
LocATeは、3Dシーケンスでアクションを共同でローカライズし認識するエンドツーエンドのアプローチである。
画像やパッチの特徴を入力として考えるトランスフォーマーベースのオブジェクト検出や分類モデルとは異なり、LocATeのトランスフォーマーモデルはシーケンス内のアクション間の長期的な相関をキャプチャすることができる。
BABEL-TAL-20 (BT20) という新しい,挑戦的で,より現実的なベンチマークデータセットを導入する。
論文 参考訳(メタデータ) (2022-03-21T03:35:32Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - Soft Expectation and Deep Maximization for Image Feature Detection [68.8204255655161]
質問をひっくり返し、まず繰り返し可能な3Dポイントを探し、次に検出器を訓練して画像空間にローカライズする、反復的半教師付き学習プロセスSEDMを提案する。
以上の結果から,sdmを用いてトレーニングした新しいモデルでは,シーン内の下位3dポイントのローカライズが容易になった。
論文 参考訳(メタデータ) (2021-04-21T00:35:32Z) - Factor Graph based 3D Multi-Object Tracking in Point Clouds [8.411514688735183]
明示的および固定的な代入に依存しない新しい最適化に基づくアプローチを提案する。
我々は、実世界のKITTI追跡データセットの性能を実証し、多くの最先端アルゴリズムよりも優れた結果を得る。
論文 参考訳(メタデータ) (2020-08-12T13:34:46Z) - Joint Spatial-Temporal Optimization for Stereo 3D Object Tracking [34.40019455462043]
本研究では,空間時間最適化に基づくステレオ3次元物体追跡手法を提案する。
ネットワークから隣接画像上の対応する2Dバウンディングボックスを検出し,初期3Dバウンディングボックスを回帰する。
オブジェクトセントロイドに関連づけられた複雑なオブジェクトキューは、リージョンベースのネットワークを使用して予測される。
論文 参考訳(メタデータ) (2020-04-20T13:59:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。