論文の概要: Search-Based Task and Motion Planning for Hybrid Systems: Agile
Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2301.10384v1
- Date: Wed, 25 Jan 2023 02:18:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-26 16:05:53.495996
- Title: Search-Based Task and Motion Planning for Hybrid Systems: Agile
Autonomous Vehicles
- Title(参考訳): ハイブリッドシステムの探索に基づくタスクと動作計画: アジャイル自律走行車
- Authors: Zlatan Ajanovi\'c, Enrico Regolin, Barys Shyrokau, Hana \'Cati\'c,
Martin Horn, Antonella Ferrara
- Abstract要約: 車両力学では、複雑な力学を予測的に考える必要がある。
多くの著者が回路を分割し、いくつかのセグメントでドリフトを使用する規則を考案した。
これはタスク・アンド・モーション・プランニング(TAMP)問題のクラスであり、リアルタイムに最適な解決が難しいことが知られている。
本稿では,この問題を効果的に解決し,高次元状態空間での探索を効率的に行う検索手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To achieve optimal robot behavior in dynamic scenarios we need to consider
complex dynamics in a predictive manner. In the vehicle dynamics community, it
is well know that to achieve time-optimal driving on low surface, the vehicle
should utilize drifting. Hence many authors have devised rules to split
circuits and employ drifting on some segments. These rules are suboptimal and
do not generalize to arbitrary circuit shapes (e.g., S-like curves). So, the
question "When to go into which mode and how to drive in it?" remains
unanswered. To choose the suitable mode (discrete decision), the algorithm
needs information about the feasibility of the continuous motion in that mode.
This makes it a class of Task and Motion Planning (TAMP) problems, which are
known to be hard to solve optimally in real-time. In the AI planning community,
search methods are commonly used. However, they cannot be directly applied to
TAMP problems due to the continuous component. Here, we present a search-based
method that effectively solves this problem and efficiently searches in a
highly dimensional state space with nonlinear and unstable dynamics. The space
of the possible trajectories is explored by sampling different combinations of
motion primitives guided by the search. Our approach allows to use multiple
locally approximated models to generate motion primitives (e.g., learned models
of drifting) and effectively simplify the problem without losing accuracy. The
algorithm performance is evaluated in simulated driving on a mixed-track with
segments of different curvatures (right and left). Our code is available at
https://git.io/JenvB
- Abstract(参考訳): 動的シナリオにおけるロボットの最適動作を実現するためには,複雑なダイナミクスを予測的に検討する必要がある。
車両動力学のコミュニティでは、低表面での時間最適運転を実現するためには、漂流を利用する必要があることがよく知られている。
したがって、多くの著者は回路を分割し、いくつかのセグメントでドリフトを使用する規則を考案した。
これらの規則は準最適であり、任意の回路形状(例えばs様曲線)に一般化しない。
では、"どのモードで運転するか"という質問は、まだ答えがないままです。
適切なモード(離散決定)を選択するには、アルゴリズムはそのモードにおける連続運動の可能性に関する情報を必要とする。
これはタスク・アンド・モーション・プランニング(TAMP)問題のクラスであり、リアルタイムで最適な解決が難しいことが知られている。
AI計画コミュニティでは、検索手法が一般的に使用されている。
しかし、それらは連続成分のため、タンプ問題に直接適用することはできない。
本稿では, この問題を効果的に解決し, 非線形かつ不安定なダイナミックスを持つ高次元状態空間を効率的に探索する探索法を提案する。
可能な軌道の空間は、探索によって導かれる運動プリミティブの異なる組み合わせをサンプリングすることで探索される。
本手法では,複数の局所近似モデルを用いて運動プリミティブ(例えばドリフトの学習モデル)を生成し,精度を損なうことなく問題を効果的に単純化する。
アルゴリズムの性能は、異なる曲率(左右)のセグメントを持つ混合トラック上でのシミュレーション運転で評価される。
私たちのコードはhttps://git.io/JenvBで利用可能です。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - STAMP: Differentiable Task and Motion Planning via Stein Variational Gradient Descent [35.96763689715956]
シーケンシャルなロボティクスタスクの計画には、しばしば記号的および幾何学的推論を必要とする。
TAMPアルゴリズムは、運動学的および動的実現可能性を確認しながら、高レベルのタスクシーケンス上でツリーサーチを実行することで、これらの問題を解決するのが一般的である。
本稿では,ハイブリッド最適化問題を連続領域に緩和するSTAMP(Stein Task and Motion Planning)という新しいTAMP手法を提案する。
論文 参考訳(メタデータ) (2023-10-03T03:53:51Z) - Using Collision Momentum in Deep Reinforcement Learning Based
Adversarial Pedestrian Modeling [0.0]
本稿では,衝突を対象とする強化学習アルゴリズムを提案する。
我々のアルゴリズムは効率的で、より厳しい衝突を発生し、複雑で多様なシナリオにおける自律運転アルゴリズムの弱点の同定と修正を可能にする。
論文 参考訳(メタデータ) (2023-06-13T03:38:05Z) - Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。
本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。
現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文 参考訳(メタデータ) (2022-04-14T17:46:26Z) - Causal Imitative Model for Autonomous Driving [85.78593682732836]
慣性および衝突問題に対処するための因果Imitative Model (CIM)を提案する。
CIMは因果モデルを明確に発見し、ポリシーのトレーニングに利用します。
実験の結果,本手法は慣性および衝突速度において従来の手法よりも優れていたことがわかった。
論文 参考訳(メタデータ) (2021-12-07T18:59:15Z) - Model-based Decision Making with Imagination for Autonomous Parking [50.41076449007115]
提案アルゴリズムは,駐車前に結果を予測するための想像モデル,高速探索ランダムツリー(RRT)の改良,経路平滑化モジュールの3つの部分から構成される。
われわれのアルゴリズムは、実際のキネマティックな車両モデルに基づいており、実際の自動運転車にアルゴリズムを適用するのにより適している。
アルゴリズムの有効性を評価するため,3つの異なる駐車シナリオにおいて,従来のRTとアルゴリズムを比較した。
論文 参考訳(メタデータ) (2021-08-25T18:24:34Z) - Calibration of Human Driving Behavior and Preference Using Naturalistic
Traffic Data [5.926030548326619]
自然トラフィックデータからドライバの好みを推定するためにモデルをどのように反転させることができるかを示す。
我々のアプローチの際立った利点は、計算負担を大幅に削減することである。
論文 参考訳(メタデータ) (2021-05-05T01:20:03Z) - Multi-Agent Path Planning based on MPC and DDPG [14.793341914236166]
モデル予測制御(MPC)とDeep Deterministic Policy Gradient(DDPG)を組み合わせた新しいアルゴリズムを提案する。
ddpg with continuous action spaceは、ロボットに学習と自律的な意思決定機能を提供するように設計されている。
航空母艦デッキや四角形などの不確定な環境でのシミュレーション実験にunity 3dを用いる。
論文 参考訳(メタデータ) (2021-02-26T02:57:13Z) - Path Planning Followed by Kinodynamic Smoothing for Multirotor Aerial
Vehicles (MAVs) [61.94975011711275]
そこで本稿では,RRT*textquotedblrightのテキストを幾何学的にベースとした動き計画手法を提案する。
提案手法では,適応探索空間とステアリング機能を導入したオリジナルのRT*を改良した。
提案手法を様々なシミュレーション環境で検証した。
論文 参考訳(メタデータ) (2020-08-29T09:55:49Z) - Efficient Sampling-Based Maximum Entropy Inverse Reinforcement Learning
with Application to Autonomous Driving [35.44498286245894]
本稿では,効率的なサンプリングに基づく最大エントロピー逆強化学習(IRL)アルゴリズムを提案する。
提案アルゴリズムは,非対話的シナリオと対話的シナリオの両方を含む実運転データに基づいて評価する。
論文 参考訳(メタデータ) (2020-06-22T01:41:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。