論文の概要: CeRLP: A Cross-embodiment Robot Local Planning Framework for Visual Navigation
- arxiv url: http://arxiv.org/abs/2603.19602v1
- Date: Fri, 20 Mar 2026 03:17:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:38.965341
- Title: CeRLP: A Cross-embodiment Robot Local Planning Framework for Visual Navigation
- Title(参考訳): CeRLP:視覚ナビゲーションのためのロボットローカルプランニングフレームワーク
- Authors: Haoyu Xi, Mingao Tan, Xinming Zhang, Siwei Cheng, Shanze Wang, Yin Gu, Xiaoyu Shen, Wei Zhang,
- Abstract要約: 汎用視覚ナビゲーションのためのクロス・エボディメント・ロボット・ローカル・プランニング(CeRLP)フレームワークを提案する。
CeRLPは、視覚情報を統一された幾何学的定式化に抽象化し、異種ロボットに適用する。
シミュレーション環境での実験では、CeRLPは比較法よりも優れていた。
- 参考スコア(独自算出の注目度): 12.047848283467019
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual navigation for cross-embodiment robots is challenging due to variations in robot and camera configurations, which can lead to the failure of navigation tasks. Previous approaches typically rely on collecting massive datasets across different robots, which is highly data-intensive, or fine-tuning models, which is time-consuming. Furthermore, both methods often lack explicit consideration of robot geometry. In this paper, we propose a Cross-embodiment Robot Local Planning (CeRLP) framework for general visual navigation, which abstracts visual information into a unified geometric formulation and applies to heterogeneous robots with varying physical dimensions, camera parameters, and camera types. CeRLP introduces a depth estimation scale correction method that utilizes offline pre-calibration to resolve the scale ambiguity of monocular depth estimation, thereby recovering precise metric depth images. Furthermore, CeRLP designs a visual-to-scan abstraction module that projects varying visual inputs into height-adaptive laser scans, making the policy robust to heterogeneous robots. Experiments in simulation environments demonstrate that CeRLP outperforms comparative methods, validating its robust obstacle avoidance capabilities as a local planner. Additionally, extensive real-world experiments verify the effectiveness of CeRLP in tasks such as point-to-point navigation and vision-language navigation, demonstrating its generalization across varying robot and camera configurations.
- Abstract(参考訳): ロボットの視覚ナビゲーションは、ナビゲーションタスクの失敗につながる可能性があるロボットやカメラの設定の変化のため、困難である。
従来のアプローチでは、データ集約性の高いロボットや、時間を要する微調整モデルなど、さまざまなロボットにまたがる大規模なデータセットの収集が一般的だった。
さらに、どちらの手法もロボット幾何学の明確な考慮を欠いていることが多い。
本稿では、視覚情報を統一的な幾何学的定式化に抽象化し、物理次元、カメラパラメータ、カメラタイプが異なる異種ロボットに適用する汎用視覚ナビゲーションのためのクロス・エボディメント・ロボット・ローカル・プランニング(CeRLP)フレームワークを提案する。
CeRLPは、オフラインの事前校正を利用して、単眼深度推定のスケールのあいまいさを解消し、正確なメートル法深度像を復元する深さ推定スケール補正法を導入している。
さらに、CeRLPは、高度適応型レーザースキャンに様々な視覚入力を投影する視覚スキャン抽象化モジュールを設計し、異種ロボットにロバストなポリシーを実現している。
シミュレーション環境での実験では、CeRLPは局所プランナーとして頑健な障害物回避能力を検証し、比較手法よりも優れていた。
さらに、CeRLPがポイントツーポイントナビゲーションや視覚言語ナビゲーションなどのタスクで有効であることを検証する大規模な実世界の実験では、様々なロボットやカメラ構成にまたがる一般化を実証している。
関連論文リスト
- DeFM: Learning Foundation Representations from Depth for Robotics [49.77188649197404]
DeFMはロボットアプリケーションのための深度画像に基づいて訓練された自己教師型基礎モデルである。
DeFMは幾何学的および意味的な表現を学び、様々な環境、タスク、センサーに一般化する。
最先端の性能を達成し、シミュレーションから実環境への強力な一般化を実証する。
論文 参考訳(メタデータ) (2026-01-26T19:45:31Z) - Towards an Accurate and Effective Robot Vision (The Problem of Topological Localization for Mobile Robots) [0.43064121494080315]
本研究は,ロボットプラットフォームに搭載された視点カラーカメラで取得した画像のみを用いて,オフィス環境におけるトポロジカルローカライゼーションに対処する。
テキスト検索にヒントを得たColor Histograms, SIFT, ASIFT, RGB-SIFT, Bag-of-Visual-Wordsアプローチなど,最先端のビジュアル記述子の評価を行った。
論文 参考訳(メタデータ) (2025-09-05T09:14:59Z) - Optimizing Grasping in Legged Robots: A Deep Learning Approach to Loco-Manipulation [0.6533458718563319]
本稿では,腕を備えた四足歩行の把握能力を高めるための枠組みを提案する。
そこで我々は,ジェネシスシミュレーション環境内にパイプラインを構築し,共通物体の把握試行の合成データセットを生成する。
このデータセットは、オンボードのRGBとディープカメラからのマルチモーダル入力を処理するU-Netのようなアーキテクチャで、カスタムCNNのトレーニングに使用された。
四脚ロボットの完全な枠組みを検証した。
論文 参考訳(メタデータ) (2025-08-24T17:47:56Z) - ARC-Calib: Autonomous Markerless Camera-to-Robot Calibration via Exploratory Robot Motions [15.004750210002152]
ARC-Calibはモデルベースのマーカーレスカメラ・ロボットキャリブレーションフレームワークである。
完全に自律的で、多様なロボットにまたがって一般化できる。
論文 参考訳(メタデータ) (2025-03-18T20:03:32Z) - Real-time Multi-view Omnidirectional Depth Estimation for Real Scenarios based on Teacher-Student Learning with Unlabeled Data [13.107135855680992]
本稿では,Rt-OmniMVS というエッジコンピューティングプラットフォームを対象とした全方向のリアルタイム深度推定手法を提案する。
実環境における高精度,堅牢性,一般化を実現するため,教師の学習戦略を導入する。
また,多視点魚眼カメラとエッジデバイスを用いた全方位深度センシングシステムであるHexaMODEを提案する。
論文 参考訳(メタデータ) (2024-09-12T08:44:35Z) - Neural Scene Representation for Locomotion on Structured Terrain [56.48607865960868]
本研究では,都市環境を横断する移動ロボットの局所的な地形を再構築する学習手法を提案する。
搭載されたカメラとロボットの軌道からの深度測定のストリームを用いて、ロボットの近傍の地形を推定する。
ノイズ測定とカメラ配置の盲点からの大量の欠落データにもかかわらず,シーンを忠実に再構築する3次元再構成モデルを提案する。
論文 参考訳(メタデータ) (2022-06-16T10:45:17Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Vision-driven Robotic
Grasping via Physics-based Metaverse Synthesis [78.26022688167133]
本稿では,物理に基づくメタバース合成による視覚駆動型ロボットグルーピングのための大規模ベンチマークデータセットを提案する。
提案するデータセットには,10万の画像と25種類のオブジェクトが含まれている。
また,オブジェクト検出とセグメンテーション性能を評価するためのデータセットとともに,新しいレイアウト重み付け性能指標を提案する。
論文 参考訳(メタデータ) (2021-12-29T17:23:24Z) - Nothing But Geometric Constraints: A Model-Free Method for Articulated
Object Pose Estimation [89.82169646672872]
本稿では,ロボットアームの関節構成を,モデルに先入観を持たずにRGBまたはRGB-D画像のシーケンスから推定する,教師なし視覚ベースシステムを提案する。
我々は,古典幾何学的定式化と深層学習を組み合わせることで,この課題を解決するために,極性多剛体制約を拡張した。
論文 参考訳(メタデータ) (2020-11-30T20:46:48Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。