論文の概要: BS3D: Building-scale 3D Reconstruction from RGB-D Images
- arxiv url: http://arxiv.org/abs/2301.01057v1
- Date: Tue, 3 Jan 2023 11:46:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 14:40:40.162407
- Title: BS3D: Building-scale 3D Reconstruction from RGB-D Images
- Title(参考訳): BS3D:RGB-D画像による大規模3D再構成
- Authors: Janne Mustaniemi, Juho Kannala, Esa Rahtu, Li Liu and Janne Heikkil\"a
- Abstract要約: 本稿では,消費者向け深度カメラを用いた大規模3次元再構築のための使い易いフレームワークを提案する。
複雑で高価な買収設定とは異なり、当社のシステムはクラウドソーシングを可能にする。
- 参考スコア(独自算出の注目度): 25.604775584883413
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various datasets have been proposed for simultaneous localization and mapping
(SLAM) and related problems. Existing datasets often include small
environments, have incomplete ground truth, or lack important sensor data, such
as depth and infrared images. We propose an easy-to-use framework for acquiring
building-scale 3D reconstruction using a consumer depth camera. Unlike complex
and expensive acquisition setups, our system enables crowd-sourcing, which can
greatly benefit data-hungry algorithms. Compared to similar systems, we utilize
raw depth maps for odometry computation and loop closure refinement which
results in better reconstructions. We acquire a building-scale 3D dataset
(BS3D) and demonstrate its value by training an improved monocular depth
estimation model. As a unique experiment, we benchmark visual-inertial odometry
methods using both color and active infrared images.
- Abstract(参考訳): 同時ローカライゼーションとマッピング(SLAM)と関連する問題に対して,様々なデータセットが提案されている。
既存のデータセットには、小さな環境、不完全な地上真実、奥行きや赤外線画像などの重要なセンサーデータがないことが多い。
本稿では,消費者向け深度カメラを用いた大規模3次元再構築のための使い易いフレームワークを提案する。
複雑で高価な買収設定とは異なり、当社のシステムはクラウドソーシングを可能にする。
類似のシステムと比較して, 生の深度マップをオドメトリー計算やループ閉鎖補正に利用し, より良い再構成を行う。
ビル規模の3Dデータセット(BS3D)を取得し,改良された単眼深度推定モデルをトレーニングすることにより,その価値を実証する。
ユニークな実験として、カラーとアクティブな赤外線画像の両方を用いて視覚慣性計測法をベンチマークする。
関連論文リスト
- MM3DGS SLAM: Multi-modal 3D Gaussian Splatting for SLAM Using Vision, Depth, and Inertial Measurements [59.70107451308687]
カメラ画像と慣性測定による地図表現に3Dガウスアンを用いることで、精度の高いSLAMが実現できることを示す。
我々の手法であるMM3DGSは、より高速なスケール認識と軌道追跡の改善により、事前レンダリングの限界に対処する。
また,カメラと慣性測定ユニットを備えた移動ロボットから収集したマルチモーダルデータセットUT-MMもリリースした。
論文 参考訳(メタデータ) (2024-04-01T04:57:41Z) - AugUndo: Scaling Up Augmentations for Monocular Depth Completion and Estimation [51.143540967290114]
本研究では,教師なし深度計算と推定のために,従来不可能であった幾何拡張の幅広い範囲をアンロックする手法を提案する。
これは、出力深さの座標への幾何変換を反転、あるいはアンドウイング(undo''-ing)し、深度マップを元の参照フレームに戻すことで達成される。
論文 参考訳(メタデータ) (2023-10-15T05:15:45Z) - R3D3: Dense 3D Reconstruction of Dynamic Scenes from Multiple Cameras [106.52409577316389]
R3D3は高密度3次元再構成とエゴモーション推定のためのマルチカメラシステムである。
提案手法は,複数のカメラからの時空間情報と単眼深度補正を利用する。
この設計により、困難で動的な屋外環境の密集した一貫した3次元再構成が可能になる。
論文 参考訳(メタデータ) (2023-08-28T17:13:49Z) - 3D Reconstruction of Spherical Images based on Incremental Structure
from Motion [2.6432771146480283]
本研究では, 球面対応を用いた相対配向アルゴリズム, シーンと球面間の3次元対応を用いた絶対配向, BA最適化のためのコスト関数について検討した。
上記のアルゴリズムを用いて,球面画像に対して段階的SfM(Structure from Motion)ワークフローを提案する。
論文 参考訳(メタデータ) (2023-06-22T09:49:28Z) - MobileBrick: Building LEGO for 3D Reconstruction on Mobile Devices [78.20154723650333]
高品質な3次元地下構造は3次元物体再構成評価に不可欠である。
本稿では,モバイルデバイスを用いた新しいマルチビューRGBDデータセットを提案する。
我々は,ハイエンド3Dスキャナーを使わずに,精密な3次元地下構造が得られる。
論文 参考訳(メタデータ) (2023-03-03T14:02:50Z) - Beyond Visual Field of View: Perceiving 3D Environment with Echoes and
Vision [51.385731364529306]
本稿では,エコーとRGB画像を用いた3次元環境の知覚とナビゲーションに焦点を当てた。
特に、複数の方向から受信したエコーでRGB画像を融合して深度推定を行う。
本稿では,RGB像を補完する3次元構造について,エコーが包括的かつ包括的情報を提供することを示す。
論文 参考訳(メタデータ) (2022-07-03T22:31:47Z) - VR3Dense: Voxel Representation Learning for 3D Object Detection and
Monocular Dense Depth Reconstruction [0.951828574518325]
3次元物体検出と単眼深層再構成ニューラルネットワークを共同トレーニングする方法を紹介します。
推論中に入力、LiDARポイントクラウド、単一のRGBイメージとして取得し、オブジェクトポーズ予測と密に再構築された深度マップを生成します。
物体検出は教師付き方式で訓練されるが,自己教師型と教師型の両方の損失関数を用いて深度予測ネットワークを訓練する。
論文 参考訳(メタデータ) (2021-04-13T04:25:54Z) - Depth-Enhanced Feature Pyramid Network for Occlusion-Aware Verification
of Buildings from Oblique Images [15.466320414614971]
本稿では,都市環境における建物変化を検知する特徴ピラミッドネットワークを提案する。
これは、斜めの画像から既存の建物の2Dフットプリントを3D検証するために、色と深さのデータの両方を使用します。
提案手法は, 変更された建物をすべて検出できることを示す。
論文 参考訳(メタデータ) (2020-11-26T10:51:36Z) - Learning to Detect 3D Reflection Symmetry for Single-View Reconstruction [32.14605731030579]
単一のRGB画像からの3D再構成は、コンピュータビジョンにおいて難しい問題である。
従来の手法は通常データ駆動であり、不正確な3次元形状の復元と限定的な一般化能力をもたらす。
本稿では,人造物体によく見られる反射対称性の鏡面を初めて検出し,その対称性の画素内対応を見いだして深度マップを予測する。
論文 参考訳(メタデータ) (2020-06-17T17:58:59Z) - Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images [59.906948203578544]
本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。
まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。
これらの深度マップは、異なるビューを粗く整列するために使用される。
本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-27T21:28:54Z) - Atlas: End-to-End 3D Scene Reconstruction from Posed Images [13.154808583020229]
RGB画像の集合からTSDF(truncated signed distance function)を直接回帰することにより,シーンのエンドツーエンドな3D再構成手法を提案する。
2D CNNは、各画像から特徴を独立して抽出し、その特徴をバックプロジェクションし、ボクセルボリュームに蓄積する。
3D CNNは蓄積した特徴を洗練し、TSDF値を予測する。
論文 参考訳(メタデータ) (2020-03-23T17:59:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。