論文の概要: RAY-TOLD: Ray-Based Latent Dynamics for Dense Dynamic Obstacle Avoidance with TDMPC
- arxiv url: http://arxiv.org/abs/2604.27450v1
- Date: Thu, 30 Apr 2026 05:44:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.940984
- Title: RAY-TOLD: Ray-Based Latent Dynamics for Dense Dynamic Obstacle Avoidance with TDMPC
- Title(参考訳): RAY-TOLD:TDMPCを用いた高密度動的障害物回避のためのレイベース潜時ダイナミクス
- Authors: Seungho Han, Seokju Lee, Jeonguk Kang,
- Abstract要約: RAY-TOLDは、障害情報を潜在力学に統合するハイブリッド制御アーキテクチャである。
本稿では,MPPI候補人口を学習方針から派生した軌道で増加させる政策混合サンプリング戦略を提案する。
その結果、短時間の水平物理学に基づくロールアウトと学習された長い水平意図を組み合わせることで、ナビゲーションの信頼性と安全性が著しく向上することが確認された。
- 参考スコア(独自算出の注目度): 5.838266102141284
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dense, dynamic crowds pose a persistent challenge for autonomous mobile robots. Purely reactive planning methods, such as Model Predictive Path Integral (MPPI) control, often fail to escape local minima in complex scenarios due to their limited prediction horizon. To bridge this gap, we propose Ray-based Task-Oriented Latent Dynamics (RAY-TOLD), a hybrid control architecture that integrates obstacle information into latent dynamics and utilizes the robustness of physics-based MPPI with the long-horizon foresight of reinforcement learning. RAY-TOLD leverages a LiDAR-centric latent dynamics model to encode high-dimensional sensor data into a compact state representation, enabling the learning of a terminal value function and a policy prior. We introduce a policy mixture sampling strategy that augments the MPPI candidate population with trajectories derived from the learned policy, effectively guiding the planner towards the goal while maintaining kinematic feasibility. Extensive tests in a stochastic environment with high-density dynamic obstacles demonstrate that our method outperforms the MPPI baseline, reducing the collision rate. The results confirm that blending short-horizon physics-based rollouts with learned long-horizon intent significantly enhances navigation reliability and safety.
- Abstract(参考訳): 複雑な、ダイナミックな群衆は、自律的なモバイルロボットに永続的な挑戦をもたらす。
モデル予測経路積分(MPPI)制御のような純粋にリアクティブな計画手法は、予測の地平線が限られているため、複雑なシナリオで局所最小化から逃れることができないことが多い。
このギャップを埋めるために、レイベースタスク指向潜在ダイナミクス(RAY-TOLD)を提案する。これは、遅延力学に障害物情報を統合するハイブリッド制御アーキテクチャであり、物理ベースMPPIの堅牢性と強化学習の長期的展望を利用する。
RAY-TOLDは、LiDAR中心の潜在力学モデルを利用して、高次元センサデータをコンパクトな状態表現に符号化し、端末値関数と事前ポリシーの学習を可能にする。
本稿では,MPPI候補集団を学習方針から派生した軌道で強化し,運動可能性を維持しつつ,効果的に目標に向かってプランナーを誘導する政策混合サンプリング戦略を提案する。
高密度動的障害物を有する確率環境における過大な試験により,本手法がMPPIベースラインを上回り,衝突速度を低下させることが示された。
その結果、短時間の水平物理学に基づくロールアウトと学習された長い水平意図を組み合わせることで、ナビゲーションの信頼性と安全性が著しく向上することが確認された。
関連論文リスト
- Bypassing the CSI Bottleneck: MARL-Driven Spatial Control for Reflector Arrays [8.046649921554472]
本稿では,機械的に調整可能な金属リフレクタアレイを制御するための,完全自律型マルチエージェント強化学習(MARL)フレームワークを提案する。
動的非線形(NLOS)環境における高忠実光線トレーシングシミュレーションは、このマルチエージェントアプローチがユーザモビリティに迅速に適応することを示す。
これらの結果は,MARLによる空間抽象化の有効性を,AIを利用した無線ネットワークへのスケーラブルで実用的な経路として検証した。
論文 参考訳(メタデータ) (2026-04-06T20:47:50Z) - SPOT: Spatio-Temporal Obstacle-free Trajectory Planning for UAVs in an Unknown Dynamic Environment [1.9181913148426697]
我々は、視覚に基づくセーフフライト・コリドール(SFC)世代と統合した4次元プランナーを開発した。
シミュレーションおよび実世界のハードウェア実験において,本手法を広範囲に検証し,最先端の手法と比較した。
論文 参考訳(メタデータ) (2026-02-01T12:24:12Z) - Hybrid Motion Planning with Deep Reinforcement Learning for Mobile Robot Navigation [0.0]
深部強化学習(HMP-DRL)によるハイブリッド運動計画
状態空間と報酬関数の両方に符号化されたチェックポイントのシーケンスを通じて、局所DRLポリシーに統合されたパスを生成するグラフベースのグローバルプランナを提案する。
社会的コンプライアンスを確保するため、地域プランナーは、周辺エージェントのセマンティックタイプに基づいて、安全マージンと罰則を動的に調整するエンティティ対応報酬構造を採用する。
論文 参考訳(メタデータ) (2025-12-31T05:58:57Z) - Learning Terrain Aware Bipedal Locomotion via Reduced Dimensional Perceptual Representations [6.407946291544721]
本研究は、地形を意識した二足歩行の階層的戦略を導入する。
低次元表現を統合して、リアルタイム歩行生成のための強化学習(RL)に基づく高レベル(HL)ポリシーを強化する。
論文 参考訳(メタデータ) (2025-12-15T05:38:08Z) - HAD: Hierarchical Asymmetric Distillation to Bridge Spatio-Temporal Gaps in Event-Based Object Tracking [80.07224739976911]
イベントカメラは例外的な時間分解能と範囲(モード)を提供する
RGBカメラは高解像度でリッチテクスチャを捉えるのに優れていますが、イベントカメラは例外的な時間分解能とレンジ(モダル)を提供します。
論文 参考訳(メタデータ) (2025-10-22T13:15:13Z) - Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文 参考訳(メタデータ) (2025-05-23T03:28:25Z) - World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文 参考訳(メタデータ) (2025-05-03T06:23:18Z) - Simultaneous Multi-Robot Motion Planning with Projected Diffusion Models [57.45019514036948]
MRMP拡散(MRMP Diffusion, SMD)は, 制約付き最適化を拡散サンプリングプロセスに統合し, 衝突のない, キネマティックに実現可能な軌道を生成する新しい手法である。
本稿では, ロボット密度, 障害物の複雑度, 動作制約の異なるシナリオ間の軌道計画アルゴリズムを評価するための総合的MRMPベンチマークを提案する。
論文 参考訳(メタデータ) (2025-02-05T20:51:28Z) - Monte Carlo Tree Search with Velocity Obstacles for safe and efficient motion planning in dynamic environments [49.30744329170107]
本稿では,動的障害物に関する情報を最小限に抑えた最適オンライン動作計画手法を提案する。
提案手法は,モデルシミュレーションによるオンライン最適計画のためのモンテカルロ木探索 (MCTS) と障害物回避のためのVelocity Obstacles (VO) を組み合わせた。
我々は,非線形モデル予測制御(NMPC)を含む最先端のプランナーに対して,衝突速度,計算,タスク性能の向上の観点から,我々の方法論の優位性を示す。
論文 参考訳(メタデータ) (2025-01-16T16:45:08Z) - Trajectory Planning for Autonomous Vehicles Using Hierarchical
Reinforcement Learning [21.500697097095408]
不確実かつ動的条件下で安全な軌道を計画することは、自律運転問題を著しく複雑にする。
RRT(Rapidly Exploring Random Trees)のような現在のサンプリングベース手法は、高い計算コストのため、この問題には理想的ではない。
軌道計画のための階層型強化学習構造とPID(Proportional-Integral-Derivative)コントローラを提案する。
論文 参考訳(メタデータ) (2020-11-09T20:49:54Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。