論文の概要: TreeIRL: Safe Urban Driving with Tree Search and Inverse Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2509.13579v1
- Date: Tue, 16 Sep 2025 22:37:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.668069
- Title: TreeIRL: Safe Urban Driving with Tree Search and Inverse Reinforcement Learning
- Title(参考訳): TreeIRL: 木探索と逆強化学習による安全な都市運転
- Authors: Momchil S. Tomov, Sang Uk Lee, Hansford Hendrago, Jinwook Huh, Teawon Han, Forbes Howington, Rafael da Silva, Gianmarco Bernasconi, Marc Heim, Samuel Findler, Xiaonan Ji, Alexander Boule, Michael Napoli, Kuo Chen, Jesse Miller, Boaz Floor, Yunqing Hu,
- Abstract要約: TreeIRLはモンテカルロ木探索(MCTS)と逆強化学習(IRL)を組み合わせた自動運転のための新しいプランナーである
大規模シミュレーションでは古典的かつ最先端のプランナーと、ラスベガス大都市圏で500マイル以上を走行する現実の自動運転に対して、TreeIRLを評価した。
TreeIRLは、安全性、進歩性、快適性、人間らしくバランスをとることで、全体的なパフォーマンスを最高のものにします。
- 参考スコア(独自算出の注目度): 33.09377390664989
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present TreeIRL, a novel planner for autonomous driving that combines Monte Carlo tree search (MCTS) and inverse reinforcement learning (IRL) to achieve state-of-the-art performance in simulation and in real-world driving. The core idea is to use MCTS to find a promising set of safe candidate trajectories and a deep IRL scoring function to select the most human-like among them. We evaluate TreeIRL against both classical and state-of-the-art planners in large-scale simulations and on 500+ miles of real-world autonomous driving in the Las Vegas metropolitan area. Test scenarios include dense urban traffic, adaptive cruise control, cut-ins, and traffic lights. TreeIRL achieves the best overall performance, striking a balance between safety, progress, comfort, and human-likeness. To our knowledge, our work is the first demonstration of MCTS-based planning on public roads and underscores the importance of evaluating planners across a diverse set of metrics and in real-world environments. TreeIRL is highly extensible and could be further improved with reinforcement learning and imitation learning, providing a framework for exploring different combinations of classical and learning-based approaches to solve the planning bottleneck in autonomous driving.
- Abstract(参考訳): 本稿では,モンテカルロ木探索 (MCTS) と逆強化学習 (IRL) を組み合わせた自律走行のための新しいプランナーであるTreeIRLについて述べる。
その中核となる考え方は、MCTSを使って、有望な安全な候補軌道と深いIRLスコアリング機能を見つけ、その中の最も人間らしいものを選択することである。
大規模シミュレーションでは古典的かつ最先端のプランナーと、ラスベガス大都市圏で500マイル以上を走行する現実の自動運転に対して、TreeIRLを評価した。
テストシナリオには、密集した都市交通、適応的なクルーズコントロール、カットイン、信号機などが含まれる。
TreeIRLは、安全性、進歩性、快適性、人間らしくバランスをとることで、全体的なパフォーマンスを最高のものにします。
我々の知る限り、我々の研究は、MCTSベースの公共道路での計画の初めての実演であり、さまざまなメトリクスや実環境におけるプランナーの評価の重要性を強調している。
TreeIRLは拡張性が高く、強化学習と模倣学習によってさらに改善され、自律運転の計画ボトルネックを解決するための古典的および学習ベースのアプローチの異なる組み合わせを探索するためのフレームワークを提供する。
関連論文リスト
- Dream to Drive with Predictive Individual World Model [12.05377034777257]
本稿では,自律運転のための予測的個別世界モデル(PIWM)を用いたモデルベース強化学習(MBRL)手法を提案する。
PIWMは、運転環境を個人レベルで記述し、車両の対話的関係と意図を捉える。
PIWMの想像力で訓練され、意図を意識した潜伏状態を活用する都市運転シーンで効果的にナビゲートする。
論文 参考訳(メタデータ) (2025-01-28T06:18:29Z) - Enhancing End-to-End Autonomous Driving with Latent World Model [78.22157677787239]
本稿では,LAW(Latent World Model)を用いたエンドツーエンド運転のための自己教師型学習手法を提案する。
LAWは、現在の特徴とエゴ軌道に基づいて将来のシーン機能を予測する。
この自己監督タスクは、知覚のない、知覚に基づくフレームワークにシームレスに統合することができる。
論文 参考訳(メタデータ) (2024-06-12T17:59:21Z) - Driving into the Future: Multiview Visual Forecasting and Planning with
World Model for Autonomous Driving [56.381918362410175]
Drive-WMは、既存のエンド・ツー・エンドの計画モデルと互換性のある世界初のドライビングワールドモデルである。
ドライビングシーンで高忠実度マルチビュー映像を生成する。
論文 参考訳(メタデータ) (2023-11-29T18:59:47Z) - Sim-to-Real via Sim-to-Seg: End-to-end Off-road Autonomous Driving
Without Real Data [56.49494318285391]
我々は、オフロード自動運転の視覚的現実的ギャップを横断するRCANを再想像するSim2Segを紹介する。
これは、ランダム化されたシミュレーション画像をシミュレートされたセグメンテーションと深さマップに変換する学習によって行われる。
これにより、シミュレーションでエンドツーエンドのRLポリシーをトレーニングし、現実世界に直接デプロイできます。
論文 参考訳(メタデータ) (2022-10-25T17:50:36Z) - Driving in Real Life with Inverse Reinforcement Learning [4.366642479205039]
Inverse Reinforcement Learning (IRL) を用いた密集都市交通における自動車運転のための学習ベースプランナーについて紹介する。
DriveIRLは多種多様な軌道提案を生成し、これらを軽量で解釈可能な安全フィルタでフィルタし、学習モデルを使用して各軌道をスコアする。
ラスベガス・ストリップ(Las Vegas Strip)でDriveIRLを検証し,大量の交通量で完全自律運転を実証した。
論文 参考訳(メタデータ) (2022-06-07T04:36:46Z) - CADRE: A Cascade Deep Reinforcement Learning Framework for Vision-based
Autonomous Urban Driving [43.269130988225605]
複雑な都市環境と運転行動のダイナミクスのため、高密度交通における視覚に基づく自律走行は極めて困難である。
本稿では,モデルフリーな視覚に基づく自律型都市走行を実現するために,新しいCAscade Deep Reinforcement LearningフレームワークCADREを提案する。
論文 参考訳(メタデータ) (2022-02-17T10:07:16Z) - Vision-Based Autonomous Car Racing Using Deep Imitative Reinforcement
Learning [13.699336307578488]
深層模倣強化学習(DIRL)は、視覚入力を使用してアジャイルな自律レースを実現する。
我々は,高忠実性運転シミュレーションと実世界の1/20スケールRC-car上での車載計算の制限により,本アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-18T00:00:48Z) - Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。
世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。
提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文 参考訳(メタデータ) (2021-05-03T05:55:30Z) - Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文 参考訳(メタデータ) (2020-01-03T11:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。