論文の概要: Fixed External Cameras as Common Prior Maps for Active 3D Scene Graph Generation
- arxiv url: http://arxiv.org/abs/2605.18184v1
- Date: Mon, 18 May 2026 10:26:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.395586
- Title: Fixed External Cameras as Common Prior Maps for Active 3D Scene Graph Generation
- Title(参考訳): アクティブな3Dシーングラフ生成のための共通事前マップとしての固定外付けカメラ
- Authors: Giorgia Modi, Davide Buoso, Giuseppe Averta, Daniele De Martini,
- Abstract要約: 本稿では,ロボットカメラと固定外付けカメラの両方の観察を,ハードウェアに依存しない単一のパイプライン内でシームレスに融合する,アクティブでインクリメンタルな3Dシーングラフ生成のためのRGB専用フレームワークを提案する。
実験では、シーングラフを1台の外部カメラでブートストラップすることで、初期オブジェクトのリコールが+79%増加し、事前のリッチなコンテキストがその後のアクティブな探索の効率を大幅に向上することを示した。
- 参考スコア(独自算出の注目度): 11.977612002830725
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Commonly available prior information, such as BIM models, floor plans, and remote sensing images, can provide valuable geometric and semantic context for autonomous robotic systems. In this paper, we treat observations from fixed external RGB cameras as Common Prior Maps (CPMs): wide-field views of the environment that initialize a semantic and geometric scene prior before any robot motion begins. We present an RGB-only framework for active, incremental 3D scene graph (3DSG) generation that seamlessly fuses observations from both onboard robot cameras and fixed external cameras within a single hardware-agnostic pipeline. By relying solely on RGB observations processed by a feed-forward 3D reconstruction model, the system treats all cameras - onboard or external - identically, requiring no hardware modifications. A graph-based active semantic exploration framework then directly leverages the partial scene graph to guide the robot toward regions of high semantic uncertainty, progressively completing and refining the prior. Experiments demonstrate that bootstrapping the scene graph with even a single external camera increases initial object recall by up to +79%, and that the richer context of the prior significantly improves the efficiency of subsequent active exploration.
- Abstract(参考訳): BIMモデル、フロアプラン、リモートセンシング画像などの一般的な事前情報は、自律ロボットシステムにとって貴重な幾何学的、意味的なコンテキストを提供することができる。
本稿では,固定外付けRGBカメラの観測をCPM(Common Prior Map)として扱う。
本稿では,ロボットカメラと固定外付けカメラの両方の観察を,ハードウェア非依存のパイプライン内でシームレスに融合する,アクティブでインクリメンタルな3Dシーングラフ(DSG)生成のためのRGB専用フレームワークを提案する。
フィードフォワード3D再構成モデルによって処理されるRGBの観測のみに依存することにより、システムはすべてのカメラ(搭載または外部)を同一に扱い、ハードウェアの変更は不要である。
グラフベースのアクティブセマンティック探索フレームワークは、部分的なシーングラフを直接利用して、ロボットを高度なセマンティック不確実性のある領域へ誘導し、段階的に完了し、事前を精査する。
実験では、シーングラフを1台の外部カメラでブートストラップすることで、初期オブジェクトのリコールが+79%増加し、事前のリッチなコンテキストがその後のアクティブな探索の効率を大幅に向上することを示した。
関連論文リスト
- RGB-only Active 3D Scene Graph Generation for Indoor Mobile Robots [11.977612002830725]
3Dシーングラフ生成への現在のアプローチは、メトリック3D再構成のためにLiDARやRGB-Dカメラのような専用深度センサーに依存している。
本稿では,RGB入力のみからの3次元シーングラフの能動的・漸進的な構築のための,完全な視覚的枠組みを提案する。
論文 参考訳(メタデータ) (2026-05-18T10:37:39Z) - FunRec: Reconstructing Functional 3D Scenes from Egocentric Interaction Videos [134.8812117202239]
本稿では,エゴセントリックなRGB-Dインタラクションビデオから直接室内シーンの3次元ディジタル双対を再構成するFunRecを提案する。
本研究では,URDF/USDエクスポートのシミュレーション,手指のアベイランスマッピング,ロボットとシーンのインタラクションへの応用を実演する。
論文 参考訳(メタデータ) (2026-04-07T09:22:12Z) - Robo3R: Enhancing Robotic Manipulation with Accurate Feed-Forward 3D Reconstruction [70.06600045165905]
3D空間認識は、一般的なロボット操作の基本であるが、信頼性が高く高品質な3D形状の取得は依然として困難である。
本稿では,RGB画像やロボットの状態から直接,正確な距離スケールのシーン形状をリアルタイムで予測する操作可能な3次元再構成モデルであるRobo3Rを紹介する。
我々は、ロボット操作のためのこの代替3Dセンシングモジュールの約束を示唆し、パフォーマンスの連続的な向上を観察する。
論文 参考訳(メタデータ) (2026-02-10T18:58:15Z) - ArtiSG: Functional 3D Scene Graph Construction via Human-demonstrated Articulated Objects Manipulation [51.54082859171464]
ArtiSGは、人間のデモを構造化されたロボットメモリにエンコードすることで、機能的な3Dシーングラフを構築するフレームワークである。
本研究では,ArtiSGが機能的要素リコールおよび調音推定精度において,ベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2025-12-31T13:10:40Z) - Unifying Scene Representation and Hand-Eye Calibration with 3D Foundation Models [13.58353565350936]
環境の表現はロボティクスにおける中心的な課題である。
伝統的に、ユーザーはチェッカーボードやエイプリルタグなどの特定の外部マーカーを使用してカメラを校正する必要がある。
本稿では,マニピュレータ搭載RGBカメラを搭載したロボットシステムへの3Dファウンデーション表現の統合を提唱する。
論文 参考訳(メタデータ) (2024-04-17T18:29:32Z) - ImageManip: Image-based Robotic Manipulation with Affordance-guided Next
View Selection [10.162882793554191]
ロボットが環境と対話するためには、3Dの関節による物体操作が不可欠である。
既存の多くの研究では、操作ポリシーの主要な入力として3Dポイントクラウドを使用している。
RGB画像は、コスト効率の良い装置を用いた高分解能な観察を提供するが、空間的3次元幾何学的情報は欠如している。
このフレームワークは、対象対象物の複数の視点を捉え、その幾何学を補完するために深度情報を推測するように設計されている。
論文 参考訳(メタデータ) (2023-10-13T12:42:54Z) - Event Camera-based Visual Odometry for Dynamic Motion Tracking of a
Legged Robot Using Adaptive Time Surface [5.341864681049579]
イベントカメラは高時間分解能とダイナミックレンジを提供しており、高速移動時のぼやけたRGB画像の問題を排除できる。
本稿では,従来の時間面におけるホワイトアウト問題とブラックアウト問題に対処する適応時間面(ATS)手法を提案する。
最後に,RGBとイベントベースの地図と画像の両方で3D-2Dアライメントを同時に行う非線形ポーズ最適化式を提案する。
論文 参考訳(メタデータ) (2023-05-15T19:03:45Z) - RGB-Only Reconstruction of Tabletop Scenes for Collision-Free
Manipulator Control [71.51781695764872]
世界のRGBビューのみを用いたロボットマニピュレータの無衝突制御システムを提案する。
テーブルトップシーンの知覚入力は、ロボットエンドエフェクタにハンドヘルドまたは装着されたRGBカメラの複数の画像によって提供される。
シーンの3次元形状を再構成するために、NeRFのようなプロセスが使用され、そこからユークリッド完全符号距離関数(ESDF)が計算される。
次に、モデル予測制御アルゴリズムを用いてマニピュレータを制御し、ESDFの障害物を避けながら所望のポーズに達する。
論文 参考訳(メタデータ) (2022-10-21T01:45:08Z) - Neural Scene Representation for Locomotion on Structured Terrain [56.48607865960868]
本研究では,都市環境を横断する移動ロボットの局所的な地形を再構築する学習手法を提案する。
搭載されたカメラとロボットの軌道からの深度測定のストリームを用いて、ロボットの近傍の地形を推定する。
ノイズ測定とカメラ配置の盲点からの大量の欠落データにもかかわらず,シーンを忠実に再構築する3次元再構成モデルを提案する。
論文 参考訳(メタデータ) (2022-06-16T10:45:17Z) - Real-time RGBD-based Extended Body Pose Estimation [57.61868412206493]
3DヒトポーズのリアルタイムRGBDに基づく推定システムを提案する。
パラメトリック3次元変形可能なヒューマンメッシュモデル(SMPL-X)を表現として使用する。
身体のポーズと表情パラメータの推定子を訓練する。
論文 参考訳(メタデータ) (2021-03-05T13:37:50Z) - RGB-D Odometry and SLAM [20.02647320786556]
RGB-Dセンサーは低コストで低消費電力で、LiDARのような従来のレンジセンサーの代替品である。
RGBカメラとは異なり、RGB-Dセンサーは3Dシーン再構成のためのフレーム単位の三角測量の必要性を取り除く追加の深度情報を提供する。
本章は3つの主要な部分から構成される: 第一部では、オドメトリーとSLAMの基本概念を紹介し、RGB-Dセンサーの使用を動機づける。
第2部では、カメラポーズトラッキング、シーンマッピング、ループクローズという、SLAMシステムの主要な3つのコンポーネントについて詳述する。
論文 参考訳(メタデータ) (2020-01-19T17:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。