論文の概要: Robust Neural Routing Through Space Partitions for Camera Relocalization
in Dynamic Indoor Environments
- arxiv url: http://arxiv.org/abs/2012.04746v2
- Date: Fri, 2 Apr 2021 22:28:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:12:07.136057
- Title: Robust Neural Routing Through Space Partitions for Camera Relocalization
in Dynamic Indoor Environments
- Title(参考訳): 動的室内環境における空間分割によるロバストなニューラルルーティング
- Authors: Siyan Dong, Qingnan Fan, He Wang, Ji Shi, Li Yi, Thomas Funkhouser,
Baoquan Chen, Leonidas Guibas
- Abstract要約: カメラを既知の屋内環境にローカライズすることは、シーンマッピング、ロボットナビゲーション、arなどの重要なビルディングブロックである。
最近の進歩は、2d/3dカメラ空間と3dワールド空間の座標間の2d/3d-3d対応を最適化することでカメラのポーズを推定する。
本稿では,2つの世界,深層学習と決定木アプローチを橋渡しする,外来対応ニューラルツリーを提案する。
- 参考スコア(独自算出の注目度): 39.99342226556908
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Localizing the camera in a known indoor environment is a key building block
for scene mapping, robot navigation, AR, etc. Recent advances estimate the
camera pose via optimization over the 2D/3D-3D correspondences established
between the coordinates in 2D/3D camera space and 3D world space. Such a
mapping is estimated with either a convolution neural network or a decision
tree using only the static input image sequence, which makes these approaches
vulnerable to dynamic indoor environments that are quite common yet challenging
in the real world. To address the aforementioned issues, in this paper, we
propose a novel outlier-aware neural tree which bridges the two worlds, deep
learning and decision tree approaches. It builds on three important blocks: (a)
a hierarchical space partition over the indoor scene to construct the decision
tree; (b) a neural routing function, implemented as a deep classification
network, employed for better 3D scene understanding; and (c) an outlier
rejection module used to filter out dynamic points during the hierarchical
routing process. Our proposed algorithm is evaluated on the RIO-10 benchmark
developed for camera relocalization in dynamic indoor environments. It achieves
robust neural routing through space partitions and outperforms the
state-of-the-art approaches by around 30% on camera pose accuracy, while
running comparably fast for evaluation.
- Abstract(参考訳): カメラを既知の屋内環境に配置することは、シーンマッピング、ロボットナビゲーション、ARなどの重要なビルディングブロックである。
近年の進歩では、2D/3Dカメラ空間と3Dワールド空間の座標間の2D/3D-3D対応を最適化してカメラポーズを推定している。
このようなマッピングは畳み込みニューラルネットワークか、静的入力画像シーケンスのみを使用して決定木で推定されるため、実世界では非常に一般的だが難しい動的屋内環境に対して脆弱なアプローチとなる。
上記の課題に対処するため,本論文では,ディープラーニングと決定木アプローチという2つの世界を橋渡しする,新しい不整合認識ニューラルツリーを提案する。
a) 決定木を構築するための屋内シーン上の階層的空間分割、(b) 深い分類ネットワークとして実装され、より良い3dシーン理解のために使用される神経ルーティング機能、(c) 階層的ルーティングプロセス中に動的ポイントをフィルターアウトするために使用される外れ値拒絶モジュールである。
提案アルゴリズムは,動的屋内環境におけるカメラ再局在化のためのRIO-10ベンチマークを用いて評価した。
空間分割による堅牢なニューラルルーティングを実現し、カメラポーズの精度で最先端のアプローチを約30%上回り、評価のために比較可能な速度で実行します。
関連論文リスト
- SCIPaD: Incorporating Spatial Clues into Unsupervised Pose-Depth Joint Learning [17.99904937160487]
本研究では,教師なし深層学習のための空間的手がかりを取り入れた新しいアプローチであるSCIPaDを紹介する。
SCIPaDは平均翻訳誤差22.2%、カメラポーズ推定タスクの平均角誤差34.8%をKITTI Odometryデータセットで達成している。
論文 参考訳(メタデータ) (2024-07-07T06:52:51Z) - Improved Scene Landmark Detection for Camera Localization [11.56648898250606]
シーンランドマーク検出(SLD)に基づく手法が近年提案されている。
畳み込みニューラルネットワーク(CNN)をトレーニングして、所定の、健全でシーン固有の3Dポイントやランドマークを検出する。
トレーニング中はモデル容量とノイズラベルが不足していたため,精度の差がみられた。
論文 参考訳(メタデータ) (2024-01-31T18:59:12Z) - ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - R3D3: Dense 3D Reconstruction of Dynamic Scenes from Multiple Cameras [106.52409577316389]
R3D3は高密度3次元再構成とエゴモーション推定のためのマルチカメラシステムである。
提案手法は,複数のカメラからの時空間情報と単眼深度補正を利用する。
この設計により、困難で動的な屋外環境の密集した一貫した3次元再構成が可能になる。
論文 参考訳(メタデータ) (2023-08-28T17:13:49Z) - Neural Voting Field for Camera-Space 3D Hand Pose Estimation [106.34750803910714]
3次元暗黙表現に基づく1枚のRGB画像からカメラ空間の3Dハンドポーズ推定のための統一的なフレームワークを提案する。
本稿では,カメラフラストラムにおける高密度3次元ポイントワイド投票により,カメラ空間の3次元ハンドポーズを推定する,新しい3次元高密度回帰手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T16:51:34Z) - Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z) - 3D Human Pose Estimation in Multi-View Operating Room Videos Using
Differentiable Camera Projections [2.486571221735935]
本稿では,3次元の損失に基づいて2次元CNNをエンドツーエンドにトレーニングすることで,3次元のローカライゼーションを直接最適化することを提案する。
MVORデータセットの動画を用いて、このエンドツーエンドアプローチが2次元空間での最適化より優れていることを示す。
論文 参考訳(メタデータ) (2022-10-21T09:00:02Z) - Graph Attention Network for Camera Relocalization on Dynamic Scenes [1.0398909602421018]
動的環境における画像カメラの位置を推定するために,シーントライアングルメッシュ表現を学習するためのグラフアテンションネットワークに基づくアプローチを考案する。
室内カメラの動的再局在化のためのRIO10ベンチマークにおいて,最先端手法のカメラポーズ精度を0.358ドルから0.506ドルに改善した。
論文 参考訳(メタデータ) (2022-09-29T18:57:52Z) - VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild
Environment [80.77351380961264]
複数のカメラビューから複数の人の3Dポーズを推定する手法を提案する。
本稿では,3D空間で動作するエンドツーエンドのソリューションを提案する。
本稿では,各提案の詳細な3次元ポーズを推定するために,Pose Regression Network (PRN)を提案する。
論文 参考訳(メタデータ) (2020-04-13T23:50:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。