論文の概要: BIDA: A Bi-level Interaction Decision-making Algorithm for Autonomous Vehicles in Dynamic Traffic Scenarios
- arxiv url: http://arxiv.org/abs/2506.16546v1
- Date: Thu, 19 Jun 2025 19:03:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.222855
- Title: BIDA: A Bi-level Interaction Decision-making Algorithm for Autonomous Vehicles in Dynamic Traffic Scenarios
- Title(参考訳): BIDA:動的交通シナリオにおける自律走行車両の双方向インタラクション決定アルゴリズム
- Authors: Liyang Yu, Tianyi Wang, Junfeng Jiao, Fengwu Shan, Hongqing Chu, Bingzhao Gao,
- Abstract要約: 対話型モンテカルロ木探索(MCTS)と深部強化学習(DRL)を統合した双方向インタラクション意思決定アルゴリズム(BIDA)を設計する。
具体的には、3種類のDRLアルゴリズムを用いて、インタラクティブMCTSのオンライン推論プロセスをガイドする信頼性の高い価値ネットワークとポリシーネットワークを構築する。
実験により, BIDAは対話型推論を向上し, 計算コストを低減させるだけでなく, 最新のベンチマークよりも優れていることが示された。
- 参考スコア(独自算出の注目度): 5.193590097161461
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In complex real-world traffic environments, autonomous vehicles (AVs) need to interact with other traffic participants while making real-time and safety-critical decisions accordingly. The unpredictability of human behaviors poses significant challenges, particularly in dynamic scenarios, such as multi-lane highways and unsignalized T-intersections. To address this gap, we design a bi-level interaction decision-making algorithm (BIDA) that integrates interactive Monte Carlo tree search (MCTS) with deep reinforcement learning (DRL), aiming to enhance interaction rationality, efficiency and safety of AVs in dynamic key traffic scenarios. Specifically, we adopt three types of DRL algorithms to construct a reliable value network and policy network, which guide the online deduction process of interactive MCTS by assisting in value update and node selection. Then, a dynamic trajectory planner and a trajectory tracking controller are designed and implemented in CARLA to ensure smooth execution of planned maneuvers. Experimental evaluations demonstrate that our BIDA not only enhances interactive deduction and reduces computational costs, but also outperforms other latest benchmarks, which exhibits superior safety, efficiency and interaction rationality under varying traffic conditions.
- Abstract(参考訳): 複雑な現実世界の交通環境では、自動運転車(AV)は他の交通参加者と対話し、それに応じてリアルタイムおよび安全クリティカルな決定を行う必要がある。
人間の行動の予測不可能性は、特にマルチレーンハイウェイや符号なしのT区間のような動的なシナリオにおいて、重大な課題を生じさせる。
このギャップに対処するために,対話型モンテカルロ木探索(MCTS)と深部強化学習(DRL)を統合した双方向インタラクション意思決定アルゴリズム(BIDA)を設計し,動的キートラフィックシナリオにおけるAVの相互作用合理性,効率,安全性を向上させることを目的とした。
具体的には、3種類のDRLアルゴリズムを用いて信頼性の高い価値ネットワークとポリシーネットワークを構築し、価値更新とノード選択の支援により対話型MCTSのオンライン推論プロセスを導出する。
次に、動的軌道プランナと軌道追従制御装置をCARLAに設計、実装し、計画された操作の円滑な実行を保証する。
実験により, BIDAは対話型推論を強化し, 計算コストを削減するだけでなく, 各種交通条件下での安全性, 効率, 相互作用合理性を向上した他のベンチマークよりも優れていることが示された。
関連論文リスト
- SOLVE: Synergy of Language-Vision and End-to-End Networks for Autonomous Driving [51.47621083057114]
SOLVEは、ビジョンランゲージモデルとエンド・ツー・エンド(E2E)モデルを相乗化して自動運転車の計画を強化する革新的なフレームワークである。
提案手法は,VLMとE2Eコンポーネント間の包括的インタラクションを実現するために,共有ビジュアルエンコーダによる機能レベルでの知識共有を重視している。
論文 参考訳(メタデータ) (2025-05-22T15:44:30Z) - AI2-Active Safety: AI-enabled Interaction-aware Active Safety Analysis with Vehicle Dynamics [8.557684007368046]
本稿では,AIを利用した対話型アクティブ安全分析フレームワークを提案する。
このフレームワークは、道路勾配を考慮した自転車モデルを用いて、車両のダイナミクスを正確に捉える。
並行して、ハイパーグラフベースのAIモデルが開発され、環境トラフィックの確率的軌跡を予測する。
論文 参考訳(メタデータ) (2025-05-01T05:46:34Z) - DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous Driving [62.62464518137153]
DriveTransformerは、スケールアップを簡単にするためのシンプルなE2E-ADフレームワークである。
タスク・セルフ・アテンション、センサー・クロス・アテンション、時間的クロス・アテンションという3つの統合された操作で構成されている。
シミュレーションされたクローズドループベンチマークBench2Driveと、FPSの高い実世界のオープンループベンチマークnuScenesの両方で、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-07T11:41:18Z) - SPformer: A Transformer Based DRL Decision Making Method for Connected Automated Vehicles [9.840325772591024]
本稿ではトランスフォーマーと強化学習アルゴリズムに基づくCAV意思決定アーキテクチャを提案する。
学習可能なポリシートークンは、多車連携ポリシーの学習媒体として使用される。
我々のモデルは交通シナリオにおける車両の全ての状態情報をうまく活用することができる。
論文 参考訳(メタデータ) (2024-09-23T15:16:35Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Deep Reinforcement Learning for Autonomous Vehicle Intersection
Navigation [0.24578723416255746]
強化学習アルゴリズムは、これらの課題に対処するための有望なアプローチとして登場した。
そこで本研究では,低コスト単一エージェントアプローチを用いて,T断面積を効率よく安全にナビゲートする問題に対処する。
提案手法により,AVはT断面積を効果的にナビゲートし,走行遅延,衝突最小化,総コストの面で従来の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2023-09-30T10:54:02Z) - Learning Interaction-aware Guidance Policies for Motion Planning in
Dense Traffic Scenarios [8.484564880157148]
本稿では,高密度交通シナリオにおける対話型モーションプランニングのための新しい枠組みを提案する。
我々は,他車両の協調性に関する国際的ガイダンスを提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
学習されたポリシーは、ローカル最適化ベースのプランナーを推論し、対話的な振る舞いで誘導し、他の車両が収まらない場合に安全を維持しながら、密集したトラフィックに積極的にマージする。
論文 参考訳(メタデータ) (2021-07-09T16:43:12Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。