論文の概要: Depth Completion in Unseen Field Robotics Environments Using Extremely Sparse Depth Measurements
- arxiv url: http://arxiv.org/abs/2602.03209v1
- Date: Tue, 03 Feb 2026 07:24:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.125459
- Title: Depth Completion in Unseen Field Robotics Environments Using Extremely Sparse Depth Measurements
- Title(参考訳): 極小深度計測による見えないフィールドロボティクス環境における深度完了
- Authors: Marco Job, Thomas Stastny, Eleni Kelasidi, Roland Siegwart, Michael Pantic,
- Abstract要約: 本研究では,合成データに基づく深度補完モデルを提案し,深度センサによる極端にスパースな計測値を用いて,見えないフィールドロボティクス環境における深度を推定する。
当社のアプローチでは,Nvidia Jetson AGX Orin上で1フレームあたり53ミリ秒のエンドツーエンドレイテンシを実現し,組み込みプラットフォームへのリアルタイムデプロイメントを実現している。
- 参考スコア(独自算出の注目度): 17.714237831766173
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous field robots operating in unstructured environments require robust perception to ensure safe and reliable operations. Recent advances in monocular depth estimation have demonstrated the potential of low-cost cameras as depth sensors; however, their adoption in field robotics remains limited due to the absence of reliable scale cues, ambiguous or low-texture conditions, and the scarcity of large-scale datasets. To address these challenges, we propose a depth completion model that trains on synthetic data and uses extremely sparse measurements from depth sensors to predict dense metric depth in unseen field robotics environments. A synthetic dataset generation pipeline tailored to field robotics enables the creation of multiple realistic datasets for training purposes. This dataset generation approach utilizes textured 3D meshes from Structure from Motion and photorealistic rendering with novel viewpoint synthesis to simulate diverse field robotics scenarios. Our approach achieves an end-to-end latency of 53 ms per frame on a Nvidia Jetson AGX Orin, enabling real-time deployment on embedded platforms. Extensive evaluation demonstrates competitive performance across diverse real-world field robotics scenarios.
- Abstract(参考訳): 非構造環境で動作する自律型フィールドロボットは、安全で信頼性の高い操作を保証するために、堅牢な認識を必要とする。
単眼深度推定の最近の進歩は、低コストカメラが深度センサとしての可能性を示しているが、信頼性の高いスケールキュー、曖昧性や低テクスチュア条件、大規模データセットの不足により、フィールドロボティクスへの採用は制限されている。
これらの課題に対処するため,我々は,合成データを学習し,深度センサによる極端にスパースな測定値を用いて,見えないフィールドロボット環境における密度計量深度を推定する深度補完モデルを提案する。
フィールドロボティクスに適した合成データセット生成パイプラインは、トレーニング目的のために複数の現実的なデータセットを作成することができる。
このデータセット生成アプローチは、Structure from Motionとフォトリアリスティックレンダリングのテクスチャ化された3Dメッシュと、新しい視点合成を用いて、多様なフィールドロボティクスシナリオをシミュレートする。
当社のアプローチでは,Nvidia Jetson AGX Orin上で1フレームあたり53ミリ秒のエンドツーエンドレイテンシを実現し,組み込みプラットフォームへのリアルタイムデプロイメントを実現している。
広範囲な評価は、様々な現実世界のフィールドロボティクスシナリオ間の競争性能を示す。
関連論文リスト
- Mirage2Matter: A Physically Grounded Gaussian World Model from Video [87.9732484393686]
我々は、グラフィック駆動の世界モデリングおよびシミュレーションフレームワークであるSimulate Anythingを紹介する。
実世界の環境を3次元ガウススプレイティング(3DGS)による写実的シーン表現に再構築する。
次に、生成モデルを利用して、物理的に現実的な表現を復元し、精度校正ターゲットを介してシミュレーション環境に統合する。
論文 参考訳(メタデータ) (2026-01-24T07:43:57Z) - Optimizing Grasping in Legged Robots: A Deep Learning Approach to Loco-Manipulation [0.6533458718563319]
本稿では,腕を備えた四足歩行の把握能力を高めるための枠組みを提案する。
そこで我々は,ジェネシスシミュレーション環境内にパイプラインを構築し,共通物体の把握試行の合成データセットを生成する。
このデータセットは、オンボードのRGBとディープカメラからのマルチモーダル入力を処理するU-Netのようなアーキテクチャで、カスタムCNNのトレーニングに使用された。
四脚ロボットの完全な枠組みを検証した。
論文 参考訳(メタデータ) (2025-08-24T17:47:56Z) - A workflow for generating synthetic LiDAR datasets in simulation environments [0.0]
本稿では,自動運転車の認識,ロボット工学研究,センサセキュリティ解析を支援するために,合成LiDARデータセットを生成するシミュレーションワークフローを提案する。
都会のシナリオで運用されている模擬車両プラットフォームに飛行時間LiDAR、画像センサ、二次元スキャナを統合する。
本研究は, 対向点注入や偽造攻撃などのLiDARデータにおける潜在的なセキュリティ脆弱性を調査し, 合成データセットが防衛戦略の評価をいかに促進するかを実証する。
論文 参考訳(メタデータ) (2025-06-20T17:56:15Z) - Synthetic Dataset Generation for Autonomous Mobile Robots Using 3D Gaussian Splatting for Vision Training [0.708987965338602]
本論文では,Unreal Engineにおける注釈付き合成データの自動生成手法を提案する。
合成データセットが実世界のデータセットに匹敵する性能を達成できることを実証する。
これは、ロボットサッカーにおけるオブジェクト検出アルゴリズムのトレーニングのための合成データの最初の応用である。
論文 参考訳(メタデータ) (2025-06-05T14:37:40Z) - Is Single-View Mesh Reconstruction Ready for Robotics? [78.14584238127338]
本研究では,ロボット操作のための物理シミュレータを用いたリアルタイム計画と動的予測のためのディジタル双対生成の実現の可能性について,単一ビューメッシュ再構成モデルの評価を行った。
我々の研究は、コンピュータビジョンの進歩とロボティクスの必要性の間に重要なギャップがあることを浮き彫りにし、この交差点における将来の研究を導く。
論文 参考訳(メタデータ) (2025-05-23T14:35:56Z) - Deep Learning-Enhanced Visual Monitoring in Hazardous Underwater Environments with a Swarm of Micro-Robots [8.38975683806005]
水中貯蔵施設のような極端な環境の監視と探索は、コストが高く、労働集約的で危険である。
本稿では,複数時間深層学習ネットワークを統合し,協調予測と画像再構成を行う新しい手法を提案する。
その結果,座標予測精度と画像の集合性が非常に高く,本手法の現実的適用性を示している。
論文 参考訳(メタデータ) (2025-03-04T16:19:06Z) - Synthetica: Large Scale Synthetic Data for Robot Perception [21.415878105900187]
本稿では,ロバストな状態推定器を訓練するための大規模合成データ生成手法であるSyntheticaを提案する。
本稿では,ほとんどの状態推定問題のフロントエンドとして機能する重要な問題であるオブジェクト検出の課題に焦点を当てる。
レイトレーシングのデータを利用して270万の画像を生成し、高精度なリアルタイム検出変換器を訓練する。
我々は,従来のSOTAの9倍の50-100Hzの検出器を動作させながら,物体検出タスクにおける最先端性能を示す。
論文 参考訳(メタデータ) (2024-10-28T15:50:56Z) - Semi-Perspective Decoupled Heatmaps for 3D Robot Pose Estimation from
Depth Maps [66.24554680709417]
協調環境における労働者とロボットの正確な3D位置を知ることは、いくつかの実際のアプリケーションを可能にする。
本研究では、深度デバイスと深度ニューラルネットワークに基づく非侵襲的なフレームワークを提案し、外部カメラからロボットの3次元ポーズを推定する。
論文 参考訳(メタデータ) (2022-07-06T08:52:12Z) - Neural Scene Representation for Locomotion on Structured Terrain [56.48607865960868]
本研究では,都市環境を横断する移動ロボットの局所的な地形を再構築する学習手法を提案する。
搭載されたカメラとロボットの軌道からの深度測定のストリームを用いて、ロボットの近傍の地形を推定する。
ノイズ測定とカメラ配置の盲点からの大量の欠落データにもかかわらず,シーンを忠実に再構築する3次元再構成モデルを提案する。
論文 参考訳(メタデータ) (2022-06-16T10:45:17Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Vision-driven Robotic
Grasping via Physics-based Metaverse Synthesis [78.26022688167133]
本稿では,物理に基づくメタバース合成による視覚駆動型ロボットグルーピングのための大規模ベンチマークデータセットを提案する。
提案するデータセットには,10万の画像と25種類のオブジェクトが含まれている。
また,オブジェクト検出とセグメンテーション性能を評価するためのデータセットとともに,新しいレイアウト重み付け性能指標を提案する。
論文 参考訳(メタデータ) (2021-12-29T17:23:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。