論文の概要: PeRP: Personalized Residual Policies For Congestion Mitigation Through
Co-operative Advisory Systems
- arxiv url: http://arxiv.org/abs/2308.00864v1
- Date: Tue, 1 Aug 2023 22:25:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-03 14:19:19.849196
- Title: PeRP: Personalized Residual Policies For Congestion Mitigation Through
Co-operative Advisory Systems
- Title(参考訳): PeRP: 協調諮問システムによる混雑軽減のための個人化残留政策
- Authors: Aamir Hasan, Neeloy Chakraborty, Haonan Chen, Jung-Hoon Cho, Cathy Wu,
Katherine Driggs-Campbell
- Abstract要約: Piecewise Constant (PC) Policiesは、交通渋滞を軽減するために、人間の運転の類似性を構造的にモデル化することで問題に対処する。
我々はPersonalized Residual Policy, PeRPを用いたPCポリシに基づく協調アドバイザリシステムの開発を行った。
提案手法は,運転者の行動に適応しながら,渋滞を軽減し,ベースラインよりも平均速度が4~22%向上したことを示す。
- 参考スコア(独自算出の注目度): 7.102496364263176
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intelligent driving systems can be used to mitigate congestion through simple
actions, thus improving many socioeconomic factors such as commute time and gas
costs. However, these systems assume precise control over autonomous vehicle
fleets, and are hence limited in practice as they fail to account for
uncertainty in human behavior. Piecewise Constant (PC) Policies address these
issues by structurally modeling the likeness of human driving to reduce traffic
congestion in dense scenarios to provide action advice to be followed by human
drivers. However, PC policies assume that all drivers behave similarly. To this
end, we develop a co-operative advisory system based on PC policies with a
novel driver trait conditioned Personalized Residual Policy, PeRP. PeRP advises
drivers to behave in ways that mitigate traffic congestion. We first infer the
driver's intrinsic traits on how they follow instructions in an unsupervised
manner with a variational autoencoder. Then, a policy conditioned on the
inferred trait adapts the action of the PC policy to provide the driver with a
personalized recommendation. Our system is trained in simulation with novel
driver modeling of instruction adherence. We show that our approach
successfully mitigates congestion while adapting to different driver behaviors,
with 4 to 22% improvement in average speed over baselines.
- Abstract(参考訳): インテリジェントな運転システムは単純な行動を通じて渋滞を緩和し、通勤時間やガスコストといった社会経済的要因を改善できる。
しかし、これらのシステムは、自律車両群を正確に制御しており、人間の行動の不確実性を考慮していないため、実際には制限されている。
Piecewise Constant (PC) Policiesは、密集したシナリオにおける交通渋滞を減らすために、人間の運転に追従するアクションアドバイスを提供するために、人間の運転の類似性を構造的にモデル化することで、これらの問題に対処する。
しかし、PCのポリシーは全てのドライバーが同じように振る舞うと仮定している。
そこで本研究では,pc政策に基づく協調型アドバイザリーシステムを開発し,ドライバ特性条件付きパーソナライズド残余ポリシーperpを開発した。
PeRPは、交通渋滞を軽減する方法でドライバに振る舞うようにアドバイスする。
まず,変分オートエンコーダを用いた教師なしの命令の追従方法について,ドライバの固有特性を推定する。
そして、推定形質に規定されたポリシーがPCポリシーの動作に適応し、ドライバにパーソナライズされたレコメンデーションを提供する。
本システムでは,新しいドライバモデルによる命令遵守のシミュレーションを行う。
提案手法は,運転者の行動に適応しながら渋滞を軽減し,ベースラインよりも平均速度が4~22%向上することを示す。
関連論文リスト
- GPT-Augmented Reinforcement Learning with Intelligent Control for Vehicle Dispatching [82.19172267487998]
GARLIC: GPT拡張強化学習のフレームワーク。
本稿では,GPT強化強化学習とインテリジェント制御のフレームワークであるGARLICについて紹介する。
論文 参考訳(メタデータ) (2024-08-19T08:23:38Z) - Cooperative Advisory Residual Policies for Congestion Mitigation [11.33450610735004]
我々は協調的な諮問システムに利用できる学習済みの残留政策のクラスを開発する。
当社のポリシーは、多様なドライバーの振る舞いを考慮に入れながら、交通渋滞を軽減する方法でドライバーに振る舞うことを推奨している。
我々のアプローチは、異なるドライバーの行動に適応しながら、渋滞を軽減することに成功しました。
論文 参考訳(メタデータ) (2024-06-30T01:10:13Z) - Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - Studying the Impact of Semi-Cooperative Drivers on Overall Highway Flow [76.38515853201116]
半協調行動は、人間ドライバーの本質的な性質であり、自律運転には考慮すべきである。
新たな自律型プランナーは、社会的に準拠した軌道を生成するために、人間のドライバーの社会的価値指向(SVO)を考慮することができる。
エージェントが反復的最適応答のゲーム理論バージョンをデプロイする暗黙的な半協調運転について検討する。
論文 参考訳(メタデータ) (2023-04-23T16:01:36Z) - Towards Co-operative Congestion Mitigation [5.358968214341347]
一定の運転ポリシーは、シミュレーション環境における交通渋滞を緩和する上で有望であることを示している。
運転者との協調実験において,共有制御フレームワークを用いてこれらのポリシーを評価することを提案する。
論文 参考訳(メタデータ) (2023-02-17T21:08:55Z) - Residual Policy Learning for Powertrain Control [2.064612766965483]
本稿では、リザーブポリシー学習(RPL)エージェントを使用して、デフォルトのパワートレインコントローラにリザーブアクションを提供するアクティブドライバ支援手法の概要を述べる。
各種の自動車追従シナリオにおける模擬商用車両の実装により,RPLエージェントは,ベースラインのソースポリシーと比較して急速に改善されたポリシーを学習することがわかった。
論文 参考訳(メタデータ) (2022-12-15T04:22:21Z) - Learning Latent Traits for Simulated Cooperative Driving Tasks [10.009803620912777]
我々は,人間の行動や嗜好の観点から,人間のコンパクトな潜在表現を捉えることのできるフレームワークを構築した。
そして、注意を散らす運転行動の1形態をモデル化するための軽量なシミュレーション環境、HMIway-envを構築します。
最終的にこの環境を利用して、ドライバを識別する能力と介入ポリシーの有効性の両方を定量化します。
論文 参考訳(メタデータ) (2022-07-20T02:27:18Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Equilibrium Inverse Reinforcement Learning for Ride-hailing Vehicle
Network [1.599072005190786]
疎結合グラフにおける客車マッチングの問題を定式化する。
マルチエージェント環境における平衡ポリシを導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-13T03:18:44Z) - Learning from Simulation, Racing in Reality [126.56346065780895]
ミニチュアレースカープラットフォーム上で自律的なレースを行うための強化学習ベースのソリューションを提案する。
シミュレーションで純粋に訓練されたポリシーは、実際のロボットのセットアップにうまく移行できることを示す。
論文 参考訳(メタデータ) (2020-11-26T14:58:49Z) - Emergent Road Rules In Multi-Agent Driving Environments [84.82583370858391]
運転環境の要素が道路ルールの出現の原因となるかを分析する。
2つの重要な要因が雑音知覚とエージェントの空間密度であることがわかった。
我々の結果は、世界中の国々が安全で効率的な運転で合意した社会道路規則を実証的に支持する。
論文 参考訳(メタデータ) (2020-11-21T09:43:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。