Fugu-MT 論文翻訳(概要): Behaviorally Diverse Traffic Simulation via Reinforcement Learning

論文の概要: Behaviorally Diverse Traffic Simulation via Reinforcement Learning

arxiv url: http://arxiv.org/abs/2011.05741v1
Date: Wed, 11 Nov 2020 12:49:11 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-27 01:00:34.158280
Title: Behaviorally Diverse Traffic Simulation via Reinforcement Learning
Title（参考訳）: 強化学習による挙動異種交通シミュレーション
Authors: Shinya Shiroshita, Shirou Maruyama, Daisuke Nishiyama, Mario Ynocente Castro, Karim Hamzaoui, Guy Rosman, Jonathan DeCastro, Kuan-Hui Lee, Adrien Gaidon
Abstract要約: 本稿では,自律運転エージェントのための簡易なポリシー生成アルゴリズムを提案する。提案アルゴリズムは,深層強化学習の表現能力と探索能力を活用することで,多様性と運転能力のバランスをとる。本手法の有効性を,いくつかの挑戦的な交差点シーンにおいて実験的に示す。
参考スコア（独自算出の注目度）: 16.99423598448411
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Traffic simulators are important tools in autonomous driving development. While continuous progress has been made to provide developers more options for modeling various traffic participants, tuning these models to increase their behavioral diversity while maintaining quality is often very challenging. This paper introduces an easily-tunable policy generation algorithm for autonomous driving agents. The proposed algorithm balances diversity and driving skills by leveraging the representation and exploration abilities of deep reinforcement learning via a distinct policy set selector. Moreover, we present an algorithm utilizing intrinsic rewards to widen behavioral differences in the training. To provide quantitative assessments, we develop two trajectory-based evaluation metrics which measure the differences among policies and behavioral coverage. We experimentally show the effectiveness of our methods on several challenging intersection scenes.
Abstract（参考訳）: 交通シミュレーターは自動運転開発において重要なツールである。さまざまなトラフィック参加者をモデリングするための選択肢を開発者に提供するための継続的な進歩がある一方で、これらのモデルを調整して、品質を維持しながら振る舞いの多様性を向上させることは、しばしば非常に難しい。本稿では,自律運転エージェントのポリシー生成アルゴリズムを提案する。提案アルゴリズムは、異なるポリシーセットセレクタを介して深層強化学習の表現と探索能力を活用することにより、多様性と運転能力のバランスをとる。さらに,学習における行動の差異を広めるために,内在的な報酬を生かしたアルゴリズムを提案する。定量的評価のために,政策と行動カバレッジの違いを測定する2つの軌跡に基づく評価指標を開発した。本手法の有効性を,いくつかの挑戦的な交差点シーンにおいて実験的に示す。

関連論文リスト

Cooperative Autonomous Driving in Diverse Behavioral Traffic: A Heterogeneous Graph Reinforcement Learning Approach [11.908271732607295]
多様な運転スタイルで異種交通環境をナビゲートすることは、自動運転車にとって大きな課題となる。本稿では、自動運転車の意思決定性能を向上させるためのエキスパートシステムにより強化された異種グラフ強化学習フレームワークを提案する。
論文参考訳（メタデータ） (2025-09-30T04:12:57Z)
Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文参考訳（メタデータ） (2025-09-24T13:35:15Z)
HAD-Gen: Human-like and Diverse Driving Behavior Modeling for Controllable Scenario Generation [13.299893784290733]
HAD-Genは、多様な人間のような運転行動をシミュレートする現実的な交通シナリオ生成のためのフレームワークである。提案手法は, 目標達成率90.96%, オフロードレート2.08%, 衝突速度6.91%を達成する。
論文参考訳（メタデータ） (2025-03-19T09:38:45Z)
Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving [18.624545462468642]
本研究では,既存の運転データから,コントラスト学習を利用して運転スタイルの辞書を抽出する手法を提案する。我々の経験的評価は、我々のアプローチが生み出す行動が、機械学習ベースのベースライン手法よりも安全かつ人間的であることを確認した。
論文参考訳（メタデータ） (2025-03-07T08:26:04Z)
Hybrid Action Based Reinforcement Learning for Multi-Objective Compatible Autonomous Driving [9.39122455540358]
強化学習(Reinforcement Learning, RL)は, 自律運転における意思決定と制御の問題を解く上で, 優れた性能を示した。ドライビングは多属性問題であり、現在のRL法における多目的互換性を実現する上での課題となっている。マルチオブジェクト対応自律運転のためのハイブリッドパラメタライズアクションを用いた多目的アンサンブル・クリティカル強化学習法を提案する。
論文参考訳（メタデータ） (2025-01-14T13:10:13Z)
Looking for a better fit? An Incremental Learning Multimodal Object Referencing Framework adapting to Individual Drivers [0.0]
自動車産業の急速な進歩により、タッチベースや音声コマンドシステムといった従来の車両のインタラクション方法は、車両外の物体を参照するなど、幅広い非運転関連のタスクには不十分である。 textitIcRegressは、オブジェクトの駆動と参照という2つのタスクに携わるドライバーの振る舞いや特徴に適応する、新しい回帰に基づく漸進的学習手法である。
論文参考訳（メタデータ） (2024-01-29T12:48:56Z)
Beyond One Model Fits All: Ensemble Deep Learning for Autonomous Vehicles [16.398646583844286]
本研究では,Mediated Perception, Behavior Reflex, Direct Perceptionの3つの異なるニューラルネットワークモデルを紹介する。我々のアーキテクチャは、グローバルなルーティングコマンドを使用して、ベース、将来の潜伏ベクトル予測、補助タスクネットワークからの情報を融合し、適切なアクションサブネットワークを選択する。
論文参考訳（メタデータ） (2023-12-10T04:40:02Z)
Interactive Autonomous Navigation with Internal State Inference and Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-11-27T18:57:42Z)
Visual Exemplar Driven Task-Prompting for Unified Perception in Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文参考訳（メタデータ） (2023-03-03T08:54:06Z)
Exploring the trade off between human driving imitation and safety for traffic simulation [0.34410212782758043]
運転方針の学習において,人間の運転の模倣と安全維持との間にはトレードオフが存在することを示す。両目的を協調的に改善する多目的学習アルゴリズム(MOPPO)を提案する。
論文参考訳（メタデータ） (2022-08-09T14:30:19Z)
Learning to Walk Autonomously via Reset-Free Quality-Diversity [73.08073762433376]
品質多様性アルゴリズムは、多様かつ高いパフォーマンスのスキルからなる大規模で複雑な行動レパートリーを発見することができる。既存のQDアルゴリズムは、手動による人間の監督と介入を必要とするエピソードリセットと同様に、多数の評価を必要とする。本稿では,オープンエンド環境におけるロボットの自律学習に向けたステップとして,リセットフリー品質多様性最適化(RF-QD)を提案する。
論文参考訳（メタデータ） (2022-04-07T14:07:51Z)
Transferable and Adaptable Driving Behavior Prediction [34.606012573285554]
本研究では,運転行動に対して高品質で伝達可能で適応可能な予測を生成する階層型フレームワークであるHATNを提案する。我々は,交差点における実交通データの軌跡予測と,インターActionデータセットからのラウンドアバウンドのタスクにおいて,我々のアルゴリズムを実証する。
論文参考訳（メタデータ） (2022-02-10T16:46:24Z)
Evaluating the Robustness of Deep Reinforcement Learning for Autonomous Policies in a Multi-agent Urban Driving Environment [3.8073142980733]
視覚に基づく自律運転における深層強化学習の比較のためのベンチマークフレームワークを提案する。この実験は、視覚のみの高忠実度都市運転模擬環境で実施する。その結果, 深層強化学習アルゴリズムのいくつかは, シングルエージェントとマルチエージェントのシナリオで一貫した性能向上を実現していることがわかった。
論文参考訳（メタデータ） (2021-12-22T15:14:50Z)
Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文参考訳（メタデータ） (2021-11-23T20:14:02Z)
Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文参考訳（メタデータ） (2021-04-16T17:58:56Z)
Improving Robustness of Learning-based Autonomous Steering Using Adversarial Images [58.287120077778205]
自動運転用画像入力における学習アルゴリズムw.r.tの堅牢性を解析するためのフレームワークについて紹介する。感度分析の結果を用いて, 「操縦への学習」タスクの総合的性能を向上させるアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-02-26T02:08:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。