論文の概要: Floorplan-Aware Camera Poses Refinement
- arxiv url: http://arxiv.org/abs/2210.04572v1
- Date: Mon, 10 Oct 2022 11:24:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 18:05:53.894365
- Title: Floorplan-Aware Camera Poses Refinement
- Title(参考訳): フロアプラン対応カメラのリファインメント
- Authors: Anna Sokolova, Filipp Nikitin, Anna Vorontsova, Anton Konushin
- Abstract要約: フロアプランは空間情報の有用な情報源であり、3次元モデルの最適化を導くことができる。
本稿では,シーン構造に関する事前知識をフロアプラン形式で活用する,従来のBAを拡張した新しい最適化アルゴリズムを提案する。
レッドウッドデータセットと自己キャプチャーデータを用いた実験により,フロアプランの利用により3次元再構成の精度が向上することが示された。
- 参考スコア(独自算出の注目度): 2.294014185517203
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Processing large indoor scenes is a challenging task, as scan registration
and camera trajectory estimation methods accumulate errors across time. As a
result, the quality of reconstructed scans is insufficient for some
applications, such as visual-based localization and navigation, where the
correct position of walls is crucial.
For many indoor scenes, there exists an image of a technical floorplan that
contains information about the geometry and main structural elements of the
scene, such as walls, partitions, and doors. We argue that such a floorplan is
a useful source of spatial information, which can guide a 3D model
optimization.
The standard RGB-D 3D reconstruction pipeline consists of a tracking module
applied to an RGB-D sequence and a bundle adjustment (BA) module that takes the
posed RGB-D sequence and corrects the camera poses to improve consistency. We
propose a novel optimization algorithm expanding conventional BA that leverages
the prior knowledge about the scene structure in the form of a floorplan. Our
experiments on the Redwood dataset and our self-captured data demonstrate that
utilizing floorplan improves accuracy of 3D reconstructions.
- Abstract(参考訳): 大きな屋内シーンを処理するのは難しい作業であり、スキャン登録とカメラの軌跡推定手法が時間に渡りエラーを蓄積する。
その結果,壁の正しい位置が重要である視覚ベースの位置決めやナビゲーションなど,いくつかのアプリケーションでは再構成スキャンの品質が不十分となる。
多くの屋内シーンには、壁、仕切り、ドアなど、シーンの幾何学的要素や主要な構造要素に関する情報を含む技術的なフロアプランのイメージが存在している。
このようなフロアプランは空間情報の有用な情報源であり、3次元モデルの最適化を導くことができる。
標準RGB-D3D再構築パイプラインは、RGB-Dシーケンスに適用されるトラッキングモジュールと、RGB-Dシーケンスをポーズし、カメラのポーズを補正して一貫性を向上させるバンドル調整(BA)モジュールとから構成される。
本稿では,シーン構造に関する事前知識をフロアプラン形式で活用する,従来のBAを拡張した新しい最適化アルゴリズムを提案する。
redwoodデータセットと自己取得データを用いた実験により,3次元復元の精度が向上した。
関連論文リスト
- SCRREAM : SCan, Register, REnder And Map:A Framework for Annotating Accurate and Dense 3D Indoor Scenes with a Benchmark [43.88114765730359]
SCRREAMは、シーン内のオブジェクトの完全な高密度メッシュのアノテーションを可能にし、実際の画像シーケンスにカメラのポーズを登録する。
データセットのアノテーションパイプラインの詳細を示し、可能なデータセットの4つのバリエーションを示す。
最近の屋内再建とSLAMのためのパイプラインは、新しいベンチマークとして機能している。
論文 参考訳(メタデータ) (2024-10-30T05:53:07Z) - MM3DGS SLAM: Multi-modal 3D Gaussian Splatting for SLAM Using Vision, Depth, and Inertial Measurements [59.70107451308687]
カメラ画像と慣性測定による地図表現に3Dガウスアンを用いることで、精度の高いSLAMが実現できることを示す。
我々の手法であるMM3DGSは、より高速なスケール認識と軌道追跡の改善により、事前レンダリングの限界に対処する。
また,カメラと慣性測定ユニットを備えた移動ロボットから収集したマルチモーダルデータセットUT-MMもリリースした。
論文 参考訳(メタデータ) (2024-04-01T04:57:41Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - Lazy Visual Localization via Motion Averaging [89.8709956317671]
本研究では,データベースからシーンを再構築することなく,高精度なローカライゼーションを実現することができることを示す。
実験の結果、我々の視覚的ローカライゼーションの提案であるLazyLocは、最先端の構造に基づく手法に対して同等のパフォーマンスを実現していることがわかった。
論文 参考訳(メタデータ) (2023-07-19T13:40:45Z) - 3D Reconstruction of Spherical Images based on Incremental Structure
from Motion [2.6432771146480283]
本研究では, 球面対応を用いた相対配向アルゴリズム, シーンと球面間の3次元対応を用いた絶対配向, BA最適化のためのコスト関数について検討した。
上記のアルゴリズムを用いて,球面画像に対して段階的SfM(Structure from Motion)ワークフローを提案する。
論文 参考訳(メタデータ) (2023-06-22T09:49:28Z) - StructuredMesh: 3D Structured Optimization of Fa\c{c}ade Components on
Photogrammetric Mesh Models using Binary Integer Programming [17.985961236568663]
我々は、フォトグラムメッシュモデル内の建物の規則性に応じてファサード構造を再構築する新しい手法であるStructuredMeshを提案する。
本手法では,仮想カメラを用いて建物モデルの多視点色と深度画像を取得する。
次に、深度画像を用いてこれらのボックスを3次元空間に再マップし、初期ファサードレイアウトを生成する。
論文 参考訳(メタデータ) (2023-06-07T06:40:54Z) - BS3D: Building-scale 3D Reconstruction from RGB-D Images [25.604775584883413]
本稿では,消費者向け深度カメラを用いた大規模3次元再構築のための使い易いフレームワークを提案する。
複雑で高価な買収設定とは異なり、当社のシステムはクラウドソーシングを可能にする。
論文 参考訳(メタデータ) (2023-01-03T11:46:14Z) - Towards Non-Line-of-Sight Photography [48.491977359971855]
非視線イメージング(NLOS)は、隠された物体からの多重バウンス間接反射を捉えることに基づいている。
アクティブなNLOSイメージングシステムは、シーンを通しての光の飛行時間の捕捉に依存している。
我々はNLOS写真と呼ばれる新しい問題定式化を提案し、この欠陥に特に対処する。
論文 参考訳(メタデータ) (2021-09-16T08:07:13Z) - Plan2Scene: Converting Floorplans to 3D Scenes [36.34298107648571]
住宅のフロアプランと関連する写真の集合をテクスチャ化された3Dメッシュモデルに変換するタスクに対処する。
システム1)は、フロアプラン画像を3Dメッシュモデルに引き上げ、2)入力された写真に基づいて表面テクスチャを合成し、3)グラフニューラルネットワークアーキテクチャを用いて未観測表面のテクスチャを推論する。
論文 参考訳(メタデータ) (2021-06-09T20:32:20Z) - LED2-Net: Monocular 360 Layout Estimation via Differentiable Depth
Rendering [59.63979143021241]
パノラマの地平線上での深度予測問題として360度レイアウト推定のタスクを定式化する。
レイアウトから深度予測への変換を区別できるように、差分可能な深度レンダリング手順を提案します。
提案手法は,360 レイアウトのベンチマークデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-01T15:48:41Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。