論文の概要: Learning to Drive in New Cities Without Human Demonstrations
- arxiv url: http://arxiv.org/abs/2602.15891v1
- Date: Mon, 09 Feb 2026 00:31:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.361962
- Title: Learning to Drive in New Cities Without Human Demonstrations
- Title(参考訳): 人間の説明なしに新しい都市でドライブを学べる
- Authors: Zilin Wang, Saeed Rahmani, Daphne Cornelisse, Bidipta Sarkar, Alexander David Goldie, Jakob Nicolaus Foerster, Shimon Whiteson,
- Abstract要約: 自己学習型マルチエージェント強化学習は,地図とメタ情報のみを用いて,運転方針をほぼ異なる目標都市に適応させることができることを示す。
本研究では,NOデータマップをベースとした自律運転用セルフプレイ(NOMAD)を導入し,目標都市マップに基づいて構築されたシミュレータにおけるポリシー適応を実現する。
- 参考スコア(独自算出の注目度): 66.37858021482741
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While autonomous vehicles have achieved reliable performance within specific operating regions, their deployment to new cities remains costly and slow. A key bottleneck is the need to collect many human demonstration trajectories when adapting driving policies to new cities that differ from those seen in training in terms of road geometry, traffic rules, and interaction patterns. In this paper, we show that self-play multi-agent reinforcement learning can adapt a driving policy to a substantially different target city using only the map and meta-information, without requiring any human demonstrations from that city. We introduce NO data Map-based self-play for Autonomous Driving (NOMAD), which enables policy adaptation in a simulator constructed based on the target-city map. Using a simple reward function, NOMAD substantially improves both task success rate and trajectory realism in target cities, demonstrating an effective and scalable alternative to data-intensive city-transfer methods. Project Page: https://nomaddrive.github.io/
- Abstract(参考訳): 自動運転車は特定の運転エリアで信頼性の高い性能を達成したが、新しい都市への展開はコストがかかり、遅いままだ。
重要なボトルネックは、道路形状、交通ルール、相互作用パターンの点でトレーニングで見られるものとは異なる新しい都市に、運転ポリシーを適用する際に、多くの人間の実証軌道を集める必要があることである。
本稿では,自己学習型マルチエージェント強化学習が,地図とメタ情報のみを用いて,その都市から人間による実演を必要とせず,運転方針をかなり異なる目標都市に適応させることができることを示す。
本研究では,NOデータマップをベースとした自律運転用セルフプレイ(NOMAD)を導入し,目標都市マップに基づいて構築されたシミュレータにおけるポリシー適応を実現する。
単純な報酬関数を用いることで、NOMADは目標都市におけるタスク成功率とトラジェクティブリアリズムの両方を大幅に改善し、データ集約型都市移動法に代わる効果的でスケーラブルな代替手段を示す。
Project Page: https://nomaddrive.github.io/
関連論文リスト
- SPACeR: Self-Play Anchoring with Centralized Reference Models [50.55045557371374]
Simエージェントポリシーは、現実的で、人間らしく、高速で、マルチエージェント設定でスケーラブルである。
大規模な拡散モデルやトークン化モデルを用いた模倣学習の最近の進歩は、人間の運転データから直接行動を把握することができることを示している。
本研究では,事前訓練されたトークン化自己回帰運動モデルを利用したSPACeRを提案する。
論文 参考訳(メタデータ) (2025-10-20T19:53:02Z) - MetaUrban: An Embodied AI Simulation Platform for Urban Micromobility [52.0930915607703]
最近のロボティクスとエンボディードAIの進歩により、公共の都市空間はもはや人間専用ではない。
公共の都市空間における短距離移動のためのAIによって実現されるマイクロモビリティは、将来の交通システムにおいて重要な要素である。
本稿では,AI駆動型都市マイクロモビリティ研究のための構成シミュレーションプラットフォームであるMetaUrbanを紹介する。
論文 参考訳(メタデータ) (2024-07-11T17:56:49Z) - Prompt to Transfer: Sim-to-Real Transfer for Traffic Signal Control with
Prompt Learning [4.195122359359966]
大規模言語モデル(LLM)は大量知識に基づいて訓練されており、驚くべき推論能力を備えていることが判明した。
本研究では,LLMを利用してシステムダイナミクスの理解と解析を行う。
論文 参考訳(メタデータ) (2023-08-28T03:49:13Z) - Model-Based Imitation Learning for Urban Driving [26.782783239210087]
MILE: 世界のモデルと自律運転のポリシーを共同で学習するためのモデルに基づくImitation LEarningアプローチを提案する。
本モデルでは, 都市運転データのオフラインコーパスを用いて, 環境とのオンラインインタラクションを伴わない訓練を行った。
我々のアプローチは、都市運転環境における静的シーン、ダイナミックシーン、エゴビヘイビアをモデル化する最初のカメラのみの手法である。
論文 参考訳(メタデータ) (2022-10-14T11:59:46Z) - GINK: Graph-based Interaction-aware Kinodynamic Planning via
Reinforcement Learning for Autonomous Driving [10.782043595405831]
都市部などの構造環境下での自律運転に深部強化学習(D)を適用するには,多くの課題がある。
本稿では,グラフに基づく意図表現と動的計画のための強化学習を効果的に組み合わせた新しいフレームワークを提案する。
この実験は,既存のベースラインと比較して,我々のアプローチの最先端性能を示すものである。
論文 参考訳(メタデータ) (2022-06-03T10:37:25Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Urban Driver: Learning to Drive from Real-world Demonstrations Using
Policy Gradients [7.58363583085932]
本研究では,実世界における大規模な実証実験から,複雑な都市交通の模倣政策を学習するためのオフラインポリシー手法を提案する。
これは、知覚出力と高忠実度HDマップの上に、微分可能なデータ駆動シミュレータを構築することで実現される。
提案手法は,都市道路における100時間にわたる専門家による実証実験に基づいて学習し,複雑な運転方針を学習し,多種多様な運転操作を行えることを示す。
論文 参考訳(メタデータ) (2021-09-27T20:19:18Z) - Scalable Multiagent Driving Policies For Reducing Traffic Congestion [32.08636346620938]
過去の研究では、AVと人間駆動車両の両方で小規模の混合交通シナリオでは、制御されたマルチエージェント運転ポリシーを実行する少数のAVが混雑を緩和できることを示しています。
本稿では,既存のアプローチをスケールアップし,より複雑なシナリオにおいてavのための新しいマルチエージェント駆動ポリシを開発する。
論文 参考訳(メタデータ) (2021-02-26T21:29:55Z) - End-to-end Interpretable Neural Motion Planner [78.69295676456085]
複雑な都市環境での自律走行学習のためのニューラルモーションプランナー(NMP)を提案する。
我々は,生lidarデータとhdマップを入力とし,解釈可能な中間表現を生成する全体モデルを設計した。
北米のいくつかの都市で収集された実世界の運転データにおける我々のアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-01-17T14:16:12Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。