Fugu-MT 論文翻訳(概要): BS3D: Building-scale 3D Reconstruction from RGB-D Images

論文の概要: BS3D: Building-scale 3D Reconstruction from RGB-D Images

arxiv url: http://arxiv.org/abs/2301.01057v1
Date: Tue, 3 Jan 2023 11:46:14 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-04 14:40:40.162407
Title: BS3D: Building-scale 3D Reconstruction from RGB-D Images
Title（参考訳）: BS3D:RGB-D画像による大規模3D再構成
Authors: Janne Mustaniemi, Juho Kannala, Esa Rahtu, Li Liu and Janne Heikkil\"a
Abstract要約: 本稿では,消費者向け深度カメラを用いた大規模3次元再構築のための使い易いフレームワークを提案する。複雑で高価な買収設定とは異なり、当社のシステムはクラウドソーシングを可能にする。
参考スコア（独自算出の注目度）: 25.604775584883413
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Various datasets have been proposed for simultaneous localization and mapping (SLAM) and related problems. Existing datasets often include small environments, have incomplete ground truth, or lack important sensor data, such as depth and infrared images. We propose an easy-to-use framework for acquiring building-scale 3D reconstruction using a consumer depth camera. Unlike complex and expensive acquisition setups, our system enables crowd-sourcing, which can greatly benefit data-hungry algorithms. Compared to similar systems, we utilize raw depth maps for odometry computation and loop closure refinement which results in better reconstructions. We acquire a building-scale 3D dataset (BS3D) and demonstrate its value by training an improved monocular depth estimation model. As a unique experiment, we benchmark visual-inertial odometry methods using both color and active infrared images.
Abstract（参考訳）: 同時ローカライゼーションとマッピング(SLAM)と関連する問題に対して,様々なデータセットが提案されている。既存のデータセットには、小さな環境、不完全な地上真実、奥行きや赤外線画像などの重要なセンサーデータがないことが多い。本稿では,消費者向け深度カメラを用いた大規模3次元再構築のための使い易いフレームワークを提案する。複雑で高価な買収設定とは異なり、当社のシステムはクラウドソーシングを可能にする。類似のシステムと比較して, 生の深度マップをオドメトリー計算やループ閉鎖補正に利用し, より良い再構成を行う。ビル規模の3Dデータセット(BS3D)を取得し,改良された単眼深度推定モデルをトレーニングすることにより,その価値を実証する。ユニークな実験として、カラーとアクティブな赤外線画像の両方を用いて視覚慣性計測法をベンチマークする。

関連論文リスト

RS3DBench: A Comprehensive Benchmark for 3D Spatial Perception in Remote Sensing [71.75704516333394]
本稿では、RS3DBenchと呼ばれるリモートセンシング画像の3次元理解のためのビジュアルベンチマークを提案する。このデータセットは、54,951対のリモートセンシング画像とピクセルレベルの一致した深度マップを含んでいる。安定拡散から導かれるリモートセンシング深度推定モデルを導入し,そのマルチモーダル融合機能を利用する。
論文参考訳（メタデータ） (2025-09-23T11:20:51Z)
Towards Scalable Spatial Intelligence via 2D-to-3D Data Lifting [64.64738535860351]
単一ビュー画像を包括的・スケール的・外観リアルな3D表現に変換するスケーラブルなパイプラインを提案する。本手法は,画像の膨大な保存と空間的シーン理解への需要の増大とのギャップを埋めるものである。画像から精度の高い3Dデータを自動的に生成することにより,データ収集コストを大幅に削減し,空間知性を向上するための新たな道を開く。
論文参考訳（メタデータ） (2025-07-24T14:53:26Z)
DreamGrasp: Zero-Shot 3D Multi-Object Reconstruction from Partial-View Images for Robotic Manipulation [12.812918371506209]
シーンの未観測部分を推論するフレームワークであるDreamGraspを紹介します。粗い3D再構成、対照的な学習によるインスタンスセグメンテーション、テキスト誘導型インスタンスワイドリファインメントを組み合わせることで、DreamGraspは以前の方法の制限を回避することができる。実験の結果,DreamGraspは正確なオブジェクト形状を復元するだけでなく,シーケンシャルなデクラッタリングや高い成功率のターゲット検索といった下流タスクもサポートしていることがわかった。
論文参考訳（メタデータ） (2025-07-08T03:12:49Z)
SiLVR: Scalable Lidar-Visual Radiance Field Reconstruction with Uncertainty Quantification [0.0]
本稿では,ライダーと視覚データを融合したNeRFを用いた大規模再構成システムを提案する。我々のシステムは、ライダーを付加的に組み込むために最先端のNeRF表現を採用する。ロボット搭載型とハンドヘルド型の両方のスキャニング実験において,マルチカメラ・ライダーセンサ・スイートを用いた再構築システムを実証した。
論文参考訳（メタデータ） (2025-02-04T19:00:49Z)
MM3DGS SLAM: Multi-modal 3D Gaussian Splatting for SLAM Using Vision, Depth, and Inertial Measurements [59.70107451308687]
カメラ画像と慣性測定による地図表現に3Dガウスアンを用いることで、精度の高いSLAMが実現できることを示す。我々の手法であるMM3DGSは、より高速なスケール認識と軌道追跡の改善により、事前レンダリングの限界に対処する。また,カメラと慣性測定ユニットを備えた移動ロボットから収集したマルチモーダルデータセットUT-MMもリリースした。
論文参考訳（メタデータ） (2024-04-01T04:57:41Z)
AugUndo: Scaling Up Augmentations for Monocular Depth Completion and Estimation [51.143540967290114]
本研究では,教師なし深度計算と推定のために,従来不可能であった幾何拡張の幅広い範囲をアンロックする手法を提案する。これは、出力深さの座標への幾何変換を反転、あるいはアンドウイング(undo''-ing)し、深度マップを元の参照フレームに戻すことで達成される。
論文参考訳（メタデータ） (2023-10-15T05:15:45Z)
R3D3: Dense 3D Reconstruction of Dynamic Scenes from Multiple Cameras [106.52409577316389]
R3D3は高密度3次元再構成とエゴモーション推定のためのマルチカメラシステムである。提案手法は,複数のカメラからの時空間情報と単眼深度補正を利用する。この設計により、困難で動的な屋外環境の密集した一貫した3次元再構成が可能になる。
論文参考訳（メタデータ） (2023-08-28T17:13:49Z)
3D Reconstruction of Spherical Images based on Incremental Structure from Motion [2.6432771146480283]
本研究では, 球面対応を用いた相対配向アルゴリズム, シーンと球面間の3次元対応を用いた絶対配向, BA最適化のためのコスト関数について検討した。上記のアルゴリズムを用いて,球面画像に対して段階的SfM(Structure from Motion)ワークフローを提案する。
論文参考訳（メタデータ） (2023-06-22T09:49:28Z)
MobileBrick: Building LEGO for 3D Reconstruction on Mobile Devices [78.20154723650333]
高品質な3次元地下構造は3次元物体再構成評価に不可欠である。本稿では,モバイルデバイスを用いた新しいマルチビューRGBDデータセットを提案する。我々は,ハイエンド3Dスキャナーを使わずに,精密な3次元地下構造が得られる。
論文参考訳（メタデータ） (2023-03-03T14:02:50Z)
Beyond Visual Field of View: Perceiving 3D Environment with Echoes and Vision [51.385731364529306]
本稿では,エコーとRGB画像を用いた3次元環境の知覚とナビゲーションに焦点を当てた。特に、複数の方向から受信したエコーでRGB画像を融合して深度推定を行う。本稿では,RGB像を補完する3次元構造について,エコーが包括的かつ包括的情報を提供することを示す。
論文参考訳（メタデータ） (2022-07-03T22:31:47Z)
VR3Dense: Voxel Representation Learning for 3D Object Detection and Monocular Dense Depth Reconstruction [0.951828574518325]
3次元物体検出と単眼深層再構成ニューラルネットワークを共同トレーニングする方法を紹介します。推論中に入力、LiDARポイントクラウド、単一のRGBイメージとして取得し、オブジェクトポーズ予測と密に再構築された深度マップを生成します。物体検出は教師付き方式で訓練されるが,自己教師型と教師型の両方の損失関数を用いて深度予測ネットワークを訓練する。
論文参考訳（メタデータ） (2021-04-13T04:25:54Z)
Depth-Enhanced Feature Pyramid Network for Occlusion-Aware Verification of Buildings from Oblique Images [15.466320414614971]
本稿では,都市環境における建物変化を検知する特徴ピラミッドネットワークを提案する。これは、斜めの画像から既存の建物の2Dフットプリントを3D検証するために、色と深さのデータの両方を使用します。提案手法は, 変更された建物をすべて検出できることを示す。
論文参考訳（メタデータ） (2020-11-26T10:51:36Z)
Learning to Detect 3D Reflection Symmetry for Single-View Reconstruction [32.14605731030579]
単一のRGB画像からの3D再構成は、コンピュータビジョンにおいて難しい問題である。従来の手法は通常データ駆動であり、不正確な3次元形状の復元と限定的な一般化能力をもたらす。本稿では,人造物体によく見られる反射対称性の鏡面を初めて検出し,その対称性の画素内対応を見いだして深度マップを予測する。
論文参考訳（メタデータ） (2020-06-17T17:58:59Z)
Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images [59.906948203578544]
本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。これらの深度マップは、異なるビューを粗く整列するために使用される。本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2020-03-27T21:28:54Z)
Atlas: End-to-End 3D Scene Reconstruction from Posed Images [13.154808583020229]
RGB画像の集合からTSDF(truncated signed distance function)を直接回帰することにより,シーンのエンドツーエンドな3D再構成手法を提案する。 2D CNNは、各画像から特徴を独立して抽出し、その特徴をバックプロジェクションし、ボクセルボリュームに蓄積する。 3D CNNは蓄積した特徴を洗練し、TSDF値を予測する。
論文参考訳（メタデータ） (2020-03-23T17:59:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。