論文の概要: G-MAPP: GPU-accelerated Multi-Agent Planning and Perception for Reactive Motion Generation
- arxiv url: http://arxiv.org/abs/2606.12579v1
- Date: Wed, 10 Jun 2026 18:28:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.40382
- Title: G-MAPP: GPU-accelerated Multi-Agent Planning and Perception for Reactive Motion Generation
- Title(参考訳): G-MAPP:GPUによるマルチエージェント計画とリアクティブモーション生成の認識
- Authors: Tanmay Bishnoi, Riddhiman Laha, Tobias Löw, Jose Alex Chandy, Luis F. C. Figueredo, Sami Haddadin,
- Abstract要約: 我々は,認識と計画のためのランタイム性能と世界表現を損なわないフレームワークを提案する。
我々のフレームワークはCPUバージョンの最大5倍のスピードアップを実現し、自明で困難な物理世界のシナリオの衝突を回避しています。
- 参考スコア(独自算出の注目度): 22.044839022400293
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reactive motion generation in unstructured environments remains an open challenge in robotics. Due to the computational complexity of collision-free motion generation, existing methods either generate global trajectories for static scenarios, or employ models that make conservative assumptions about the environment. This paper identifies the primary bottleneck as the runtime performance demand of planning on high-fidelity environments, and the temporal integration between the perception and planning modules. Therefore, we propose a framework that does not compromise on runtime performance and world representations for perception and planning by accelerating world modeling and vector-field based planning using the GPU. This allows us to achieve faster parallel state exploration for quasi-global trajectory planning, and tighter coupling of the perception-action loop in real-time for dynamic cluttered environments with off-the-shelf depth sensors. We quantitatively evaluate the computation-time and success rate differences for the CPU and GPU versions of our planner, and perform qualitative evaluations of our coupled framework using real-world experiments on a 7-DoF Franka Emika robot. Experimental results demonstrate that our GPU-based framework achieves up to a 5x speedup over the CPU version and successfully avoids collisions across both trivial and challenging physical world scenarios.
- Abstract(参考訳): 非構造環境における反応運動生成は、ロボット工学におけるオープンな課題である。
衝突のない運動生成の計算複雑性のため、既存の手法は静的シナリオのグローバルな軌跡を生成するか、環境を保守的に仮定するモデルを採用する。
本稿では,高忠実度環境における計画実行時の性能要求と,知覚と計画モジュールの時間的統合について述べる。
そこで本稿では,GPUを用いた世界モデリングとベクトル場に基づく計画の高速化により,実行時の性能や世界表現を損なわないフレームワークを提案する。
これにより、準球形軌道計画のための高速な並列状態探索と、オフザシェルフ深度センサを用いた動的乱れ環境における知覚-作用ループのより緊密な結合を実現することができる。
7-DoFのFranka Emikaロボットを用いて,CPU版とGPU版の計算時間と成功率の差を定量的に評価し,並列化フレームワークの定性評価を行った。
実験の結果、GPUベースのフレームワークはCPUバージョンの最大5倍のスピードアップを実現し、自明で困難な物理世界のシナリオの衝突を避けることができた。
関連論文リスト
- SCOPE: Skeleton Graph-Based Computation-Efficient Framework for Autonomous UAV Exploration [30.628401434735906]
SCOPEは、リアルタイム骨格グラフを漸進的に構築する新しいフレームワークであり、Implicit Unknown Region Analysisを導入している。
最先端のグローバルプランナーに匹敵する競争力のある探索性能を達成し、計算コストを平均86.9%削減する。
論文 参考訳(メタデータ) (2026-02-26T07:31:29Z) - Infinite-World: Scaling Interactive World Models to 1000-Frame Horizons via Pose-Free Hierarchical Memory [101.2076718776139]
複雑な実環境において,1000フレーム以上のコヒーレントな視覚記憶を維持することのできる,堅牢な対話型世界モデルを提案する。
我々は,歴史的潜水剤を固定予算の幾何学的表現に蒸留するpose-free Memory (HPMC)を導入する。
また,連続動作を三状態論理に識別する不確実性認識型アクションラベルモジュールを提案する。
論文 参考訳(メタデータ) (2026-02-02T17:52:56Z) - ParaMaP: Parallel Mapping and Collision-free Motion Planning for Reactive Robot Manipulation [17.260700135265267]
未知の環境でのロボット操作には、リアルタイムおよび衝突のないモーションプランニングが依然として困難である。
本研究では,Euclidean Distance Transform(EDT)に基づく環境表現をサンプリングベースモデル予測制御(SMPC)プランナと密に統合する並列マッピングと動作計画フレームワークを提案する。
提案手法の有効性は, 7-DoFロボットマニピュレータを用いた広範囲なシミュレーションと実世界の実験により検証した。
論文 参考訳(メタデータ) (2025-12-27T12:24:10Z) - Towards Robust and Generalizable Continuous Space-Time Video Super-Resolution with Events [71.2439653098351]
連続時空ビデオスーパーSTVSRは、高解像度で高フレームのビデオを任意の時間スケールで再構成する能力への関心が高まっている。
EvEnhancerは、イベントストリームにカプセル化された高時間および高ダイナミックレンジのユニークな特性を結合する新しいアプローチである。
提案手法は,OODスケールでの一般化性を維持しつつ,合成および実世界の両方のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2025-10-04T15:23:07Z) - FantasyHSI: Video-Generation-Centric 4D Human Synthesis In Any Scene through A Graph-based Multi-Agent Framework [10.386464385736842]
HSI(Human-Scene Interaction)は、複雑な環境の中で現実的な人間の行動を生成する。
HSIは、長期の高レベルのタスクの処理と、見えないシーンへの一般化において、課題に直面している。
本稿では,ビデオ生成とマルチエージェントシステムを中心とした新しいHSIフレームワークであるFantasyHSIを紹介する。
論文 参考訳(メタデータ) (2025-09-01T08:20:50Z) - Real-time Spatial-temporal Traversability Assessment via Feature-based Sparse Gaussian Process [15.756895046886406]
本研究では,自律型ロボットが複雑な地形を移動できるようにすることを目的とした,空間的時間的トラバーサビリティ評価手法を提案する。
我々の手法は精度と計算効率の両面でSOTAよりも優れている。
本研究では,移動可能性マップと統合された自律ナビゲーションフレームワークを開発し,複雑な屋外環境下での微分駆動車による検証を行う。
論文 参考訳(メタデータ) (2025-03-06T06:26:57Z) - Bench2Drive-R: Turning Real World Data into Reactive Closed-Loop Autonomous Driving Benchmark by Generative Model [63.336123527432136]
我々は,リアクティブ閉ループ評価を可能にする生成フレームワークであるBench2Drive-Rを紹介する。
既存の自動運転用ビデオ生成モデルとは異なり、提案された設計はインタラクティブなシミュレーションに適したものである。
我々は、Bench2Drive-Rの生成品質を既存の生成モデルと比較し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2024-12-11T06:35:18Z) - COPILOT: Human-Environment Collision Prediction and Localization from
Egocentric Videos [62.34712951567793]
エゴセントリックな観測から人間と環境の衝突を予測する能力は、VR、AR、ウェアラブルアシストロボットなどのアプリケーションにおける衝突回避を可能にするために不可欠である。
本稿では、ボディマウントカメラから撮影した多視点エゴセントリックビデオから、多様な環境における衝突を予測するという課題を紹介する。
衝突予測と局所化を同時に行うために,COPILOTと呼ばれるトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2022-10-04T17:49:23Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。