論文の概要: ActMVS: Active Scene Reconstruction with Monocular Multi-View Stereo
- arxiv url: http://arxiv.org/abs/2606.01367v1
- Date: Sun, 31 May 2026 17:51:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.664012
- Title: ActMVS: Active Scene Reconstruction with Monocular Multi-View Stereo
- Title(参考訳): ActMVS:モノクロ多視点ステレオを用いたアクティブシーン再構成
- Authors: Guo Pu, Yixuan Han, Zhouhui Lian,
- Abstract要約: アクティブなシーン再構築により、ロボットやUAVは、手作業によるデータ取得を伴わずに、自律的に軌道を計画し、環境を再構築することができる。
単分子アクティブリコンストラクションのための最初のフレームワークである ActMVS を紹介する。
本フレームワークは,多視点ステレオ深度予測のためのビューファクタグラフ構築とグローバル深度最適化を統合した。
- 参考スコア(独自算出の注目度): 19.601265692718787
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Active scene reconstruction enables robots/UAVs to autonomously plan trajectories and reconstruct environments without costly manual data acquisition. Unlike passive methods, active reconstruction requires real-time construction of high-confidence occupancy maps for collision-free navigation. Existing approaches rely on depth sensors for occupancy map updates, increasing platform cost and weight. To advance spatial intelligence, we aim for a vision-only monocular solution. However, current monocular scene reconstruction methods operate offline and fail to deliver globally consistent dense depth at the frame rates required for robots/UAVs navigation. To bridge this gap, we introduce ActMVS, the first framework for monocular active reconstruction. Our framework integrates a view factor graph construction for informed Multi-View Stereo depth prediction, along with a global depth optimization, to enable the online generation of high-quality, globally consistent dense depth maps. This enables monocular robots/UAVs to maintain reliable occupancy maps for safe trajectory planning during reconstruction. Experiments on Replica datasets demonstrate performance competitive with RGB-D methods. Our code and data are available at https://github.com/TrickyGo/ActMVS.
- Abstract(参考訳): アクティブなシーン再構築により、ロボットやUAVは、手作業によるデータ取得を伴わずに、自律的に軌道を計画し、環境を再構築することができる。
受動的手法とは異なり、アクティブリコンストラクションでは、衝突のないナビゲーションのために、高信頼の占有マップをリアルタイムに構築する必要がある。
既存のアプローチでは、占有率マップの更新、プラットフォームのコストと重量の増加に、奥行きセンサーに依存している。
空間知能を向上するために,視覚のみの単分子解を目指す。
しかし、現在の単眼のシーン再構築手法はオフラインで動作しており、ロボットやUAVのナビゲーションに必要なフレームレートで世界中に一貫した深度を達成できない。
このギャップを埋めるために,単分子アクティブな再構築のための最初のフレームワークであるActMVSを紹介する。
我々のフレームワークは,多視点ステレオ深度予測のためのビューファクタグラフ構築とグローバル深度最適化を統合し,高品質で一貫した深度マップのオンライン生成を可能にする。
これにより、単眼ロボット/UAVは、再建中の安全な軌道計画のための信頼性の高い占有マップを維持することができる。
Replicaデータセットの実験は、RGB-Dメソッドとパフォーマンスの競合を示す。
私たちのコードとデータはhttps://github.com/TrickyGo/ActMVS.comで公開されています。
関連論文リスト
- Deep Learning Aided Vision System for Planetary Rovers [0.2333246928962179]
本研究では、リアルタイム認識とオフライン地形再構成を組み合わせた惑星探査機の視覚システムを提案する。
リアルタイムモジュールは、CLAHE強化ステレオ画像、YOLOv11nに基づくオブジェクト検出、および物体距離を推定するニューラルネットワークを統合する。
このアーキテクチャは、自律的な惑星探査のためのスケーラブルで計算効率の良いビジョンソリューションを提供する。
論文 参考訳(メタデータ) (2026-03-26T07:34:14Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - Co-SemDepth: Fast Joint Semantic Segmentation and Depth Estimation on Aerial Images [0.9883261192383611]
本稿では,空飛ぶロボットの単眼カメラを用いて,非構造環境における深度とセマンティックマップの予測を行う。
本稿では,2つのタスクを正確かつ迅速に実行可能な共同ディープラーニングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-03-23T08:25:07Z) - Driv3R: Learning Dense 4D Reconstruction for Autonomous Driving [116.10577967146762]
マルチビュー画像シーケンスからフレーム単位のポイントマップを直接回帰するフレームワークであるDriv3Rを提案する。
我々は4次元フロー予測器を用いてシーン内の移動物体を識別し、これらの動的領域の再構築をより重視する。
Driv3Rは4D動的シーン再構築において従来のフレームワークより優れており、推論速度は15倍高速である。
論文 参考訳(メタデータ) (2024-12-09T18:58:03Z) - SurroundDepth: Entangling Surrounding Views for Self-Supervised
Multi-Camera Depth Estimation [101.55622133406446]
本研究では,複数の周囲からの情報を組み込んだSurroundDepth法を提案し,カメラ間の深度マップの予測を行う。
具体的には、周囲のすべてのビューを処理し、複数のビューから情報を効果的に融合するクロスビュー変換器を提案する。
実験において,本手法は,挑戦的なマルチカメラ深度推定データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-04-07T17:58:47Z) - TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view
Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。
ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。
TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文 参考訳(メタデータ) (2021-11-14T19:01:02Z) - Real-time dense 3D Reconstruction from monocular video data captured by
low-cost UAVs [0.3867363075280543]
リアルタイム3d再構築は,ナビゲーションや緊急時のライブ評価など,多数のアプリケーションにメリットがある環境の高速密マッピングを可能にする。
ほとんどのリアルタイム対応のアプローチとは対照的に、我々のアプローチは明示的な深度センサーを必要としない。
建物周辺を斜め視で飛行する無人航空機(UAV)の自己動作を利用して、選択された画像のカメラ軌道と深度の両方を、十分な新規な内容で推定します。
論文 参考訳(メタデータ) (2021-04-21T13:12:17Z) - OmniSLAM: Omnidirectional Localization and Dense Mapping for
Wide-baseline Multi-camera Systems [88.41004332322788]
超広視野魚眼カメラ(FOV)を用いた広視野多視点ステレオ構成のための全方向位置決めと高密度マッピングシステムを提案する。
より実用的で正確な再構築のために、全方向深度推定のための改良された軽量のディープニューラルネットワークを導入する。
我々は全方位深度推定をビジュアル・オドメトリー(VO)に統合し,大域的整合性のためのループ閉鎖モジュールを付加する。
論文 参考訳(メタデータ) (2020-03-18T05:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。