論文の概要: Visual-RRT: Finding Paths toward Visual-Goals via Differentiable Rendering
- arxiv url: http://arxiv.org/abs/2604.16388v1
- Date: Fri, 27 Mar 2026 11:47:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.954265
- Title: Visual-RRT: Finding Paths toward Visual-Goals via Differentiable Rendering
- Title(参考訳): Visual-RRT: 微分レンダリングによる視覚目標への道を見つける
- Authors: Sebin Lee, Jumin Lee, Taeyeon Kim, Younju Na, Woobin Im, Sung-Eui Yoon,
- Abstract要約: 高速探索型ランダムツリー(RRT)は、その頑丈さと理論的保証のためにロボットの動き計画に広く採用されている。
既存のRTRベースのプランナは、数値的な関節角として指定された明確な目標設定を必要とする。
本稿では,視覚的ゴールプランナである視覚-RRTを提案する。
- 参考スコア(独自算出の注目度): 21.043662113128438
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rapidly-exploring random trees (RRTs) have been widely adopted for robot motion planning due to their robustness and theoretical guarantees. However, existing RRT-based planners require explicit goal configurations specified as numerical joint angles, while many practical applications provide goal specifications through visual observations such as images or demonstration videos where precise goal configurations are unavailable. In this paper, we propose visual-RRT (vRRT), a motion planner that enables visual-goal planning by unifying gradient-based exploitation from differentiable robot rendering with sampling-based exploration from RRTs. We further introduce (i) a frontier-based exploration-exploitation strategy that adaptively prioritizes visually promising search regions, and (ii) inertial gradient tree expansion that inherits optimization states across tree branches for momentum-consistent gradient exploitation. Extensive experiments across various robot manipulators including Franka, UR5e, and Fetch demonstrate that vRRT achieves effective visual-goal planning in both simulated and real-world settings, bridging the gap between sampling-based planning and vision-centric robot applications. Our code is available at https://sgvr.kaist.ac.kr/Visual-RRT.
- Abstract(参考訳): 高速探索型ランダムツリー(RRT)は、その頑丈さと理論的保証のためにロボットの動き計画に広く採用されている。
しかし、既存のRTRベースのプランナでは、数値的な関節角度として明示的な目標設定が必要であり、多くの実用的なアプリケーションは、正確な目標設定が利用できない画像やデモビデオのような視覚的な観察を通して目標仕様を提供する。
本稿では,RRTからのサンプリングに基づく探索により,微分可能なロボットレンダリングから勾配に基づく活用を統一し,視覚目標計画を可能にする視覚的RRT (vRRT) を提案する。
さらに紹介する
(i)視覚的に有望な探索領域を適応的に優先順位付けするフロンティアベースの探索探索戦略
(II)運動量に一貫性のある勾配推定のための木枝間の最適化状態を継承する慣性勾配木展開。
Franka、UR5e、Fetchなど、さまざまなロボットマニピュレータに対する大規模な実験は、vRRTがシミュレーションと実世界の両方の環境で効果的な視覚目標計画を実現し、サンプリングベースの計画と視覚中心のロボットアプリケーションとのギャップを埋めることを示した。
私たちのコードはhttps://sgvr.kaist.ac.kr/Visual-RRTで利用可能です。
関連論文リスト
- VisPCO: Visual Token Pruning Configuration Optimization via Budget-Aware Pareto-Frontier Learning for Vision-Language Models [74.05545957865228]
視覚言語モデル(VLM)における高解像度画像とビデオフレームの処理による2次計算成長を効果的に緩和する視覚トークンプルーニング法
パレート構成最適化問題として視覚トークンプルーニングを定式化して最適構成を自動的に識別する新しいフレームワークを提案する。
提案手法では, Augmented Lagrangian 法を用いて, 勾配に基づく探索を可能にするために, 連続緩和とストレートスルー推定を用いる。
論文 参考訳(メタデータ) (2026-04-16T16:21:05Z) - CeRLP: A Cross-embodiment Robot Local Planning Framework for Visual Navigation [12.047848283467019]
汎用視覚ナビゲーションのためのクロス・エボディメント・ロボット・ローカル・プランニング(CeRLP)フレームワークを提案する。
CeRLPは、視覚情報を統一された幾何学的定式化に抽象化し、異種ロボットに適用する。
シミュレーション環境での実験では、CeRLPは比較法よりも優れていた。
論文 参考訳(メタデータ) (2026-03-20T03:17:18Z) - A Unified Experimental Architecture for Informative Path Planning: from Simulation to Deployment with GuadalPlanner [69.43049144653882]
本稿では,車種別制御から高レベルの意思決定を分離する統一アーキテクチャを提案する。
提案アーキテクチャは、計画、センシング、車両実行の標準化されたインターフェースを定義するGuaralPlannerを通じて実現されている。
論文 参考訳(メタデータ) (2026-02-11T10:02:31Z) - Aerial Vision-Language Navigation with a Unified Framework for Spatial, Temporal and Embodied Reasoning [5.517595398768408]
本稿では,エゴ単分子RGB観測と自然言語命令のみで動作する航空VLNフレームワークを提案する。
このタスクは、低高度検査、サーチ・アンド・レスキュー、自律型空中輸送といった現実世界のアプリケーションに対して約束される。
論文 参考訳(メタデータ) (2025-12-09T14:25:24Z) - Unified Linear Parametric Map Modeling and Perception-aware Trajectory Planning for Mobile Robotics [1.7495208770207367]
本稿では,高次元空間にデータをマッピングする軽量な線形パラメトリックマップを提案する。
UAVでは,Euclidean Signed Distance Field (ESDF) マップを用いた。
UGVでは、モデルは地形を特徴づけ、クローズドフォーム勾配を提供し、オンラインプランニングによって大きな穴を回避できる。
論文 参考訳(メタデータ) (2025-07-12T16:39:19Z) - Open-World Drone Active Tracking with Goal-Centered Rewards [62.21394499788672]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATは,世界初となるエア・ツー・グラウンド・トラッキング・ベンチマークである。
また,複雑なシナリオにおけるドローン追跡目標の性能向上を目的としたGC-VATを提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z) - SCoTT: Strategic Chain-of-Thought Tasking for Wireless-Aware Robot Navigation in Digital Twins [78.53885607559958]
無線対応経路計画フレームワークであるSCoTTを提案する。
SCoTT は DP-WA* の2% 以内で経路ゲインを達成し, 連続的に短い軌道を生成できることを示す。
また,ガゼボシミュレーションにおいて,SCoTTをROSノードとして配置することにより,本手法の実用性を示す。
論文 参考訳(メタデータ) (2024-11-27T10:45:49Z) - Reinforcement Learning with Frontier-Based Exploration via Autonomous
Environment [0.0]
この研究は、ExploreORBとして知られる既存のVisual-Graph SLAMと強化学習を組み合わせたものである。
提案アルゴリズムは、フロンティアの探索プロセスを最適化し、より正確な地図を作成することにより、ExploreORBの効率と精度を向上させることを目的としている。
論文 参考訳(メタデータ) (2023-07-14T12:19:46Z) - Path Planning Followed by Kinodynamic Smoothing for Multirotor Aerial
Vehicles (MAVs) [61.94975011711275]
そこで本稿では,RRT*textquotedblrightのテキストを幾何学的にベースとした動き計画手法を提案する。
提案手法では,適応探索空間とステアリング機能を導入したオリジナルのRT*を改良した。
提案手法を様々なシミュレーション環境で検証した。
論文 参考訳(メタデータ) (2020-08-29T09:55:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。