論文の概要: Self-Interest and Systemic Benefits: Emergence of Collective Rationality in Mixed Autonomy Traffic Through Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2511.04883v1
- Date: Fri, 07 Nov 2025 00:03:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.622911
- Title: Self-Interest and Systemic Benefits: Emergence of Collective Rationality in Mixed Autonomy Traffic Through Deep Reinforcement Learning
- Title(参考訳): 自己関心とシステム的利益:深層強化学習による混合自律神経交通における集合的連帯性の出現
- Authors: Di Chen, Jia Li, Michael Zhang,
- Abstract要約: 自動運転車(AV)は近い将来、商用化される見込みだ。
本研究の目的は、混合自律交通システムにおいて、自己関心のAVが全ての運転エージェントに利益をもたらすかどうかを理解することである。
- 参考スコア(独自算出の注目度): 16.693735852276074
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous vehicles (AVs) are expected to be commercially available in the near future, leading to mixed autonomy traffic consisting of both AVs and human-driven vehicles (HVs). Although numerous studies have shown that AVs can be deployed to benefit the overall traffic system performance by incorporating system-level goals into their decision making, it is not clear whether the benefits still exist when agents act out of self-interest -- a trait common to all driving agents, both human and autonomous. This study aims to understand whether self-interested AVs can bring benefits to all driving agents in mixed autonomy traffic systems. The research is centered on the concept of collective rationality (CR). This concept, originating from game theory and behavioral economics, means that driving agents may cooperate collectively even when pursuing individual interests. Our recent research has proven the existence of CR in an analytical game-theoretical model and empirically in mixed human-driven traffic. In this paper, we demonstrate that CR can be attained among driving agents trained using deep reinforcement learning (DRL) with a simple reward design. We examine the extent to which self-interested traffic agents can achieve CR without directly incorporating system-level objectives. Results show that CR consistently emerges in various scenarios, which indicates the robustness of this property. We also postulate a mechanism to explain the emergence of CR in the microscopic and dynamic environment and verify it based on simulation evidence. This research suggests the possibility of leveraging advanced learning methods (such as federated learning) to achieve collective cooperation among self-interested driving agents in mixed-autonomy systems.
- Abstract(参考訳): 自動運転車(AV)は近い将来、商用化が期待されており、AVとHV(Human-driven Vehicle)が混在する自律交通に繋がる。
多くの研究が、システムレベルの目標を意思決定に組み込むことで、交通システム全体のパフォーマンス向上のためにAVを配備できることを示したが、エージェントが自己関心から外れた時に、そのメリットがまだ存在するかどうかは、人間と自律の両方で、すべての運転エージェントに共通する特性である。
本研究の目的は、混合自律交通システムにおいて、自己関心のAVが全ての運転エージェントに利益をもたらすかどうかを理解することである。
この研究は、集合的合理性(CR)の概念を中心にしている。
この概念はゲーム理論と行動経済学から派生したもので、運転エージェントは個人の興味を追求しても一括して協力することができる。
我々の最近の研究は、解析ゲーム理論モデルにおけるCRの存在を実証し、人間による混在交通を実証している。
本稿では, 深部強化学習(DRL)を用いて訓練した駆動エージェント間でCRを簡便な報酬設計で達成できることを実証する。
システムレベルの目的を直接組み込まずに、自己関心の交通機関がCRを達成できる範囲について検討する。
結果は、CRが様々なシナリオで一貫して現れることを示し、この性質の堅牢性を示している。
また、顕微鏡および動的環境におけるCRの出現を説明するメカニズムを仮定し、シミュレーションエビデンスに基づいて検証する。
本研究は,統合学習のような先進的な学習手法を活用することで,混合自律システムにおける自己関心駆動エージェント間の協調的な連携を実現する可能性を示唆している。
関連論文リスト
- DriveAgent-R1: Advancing VLM-based Autonomous Driving with Active Perception and Hybrid Thinking [33.98300989562812]
本稿では,計画のためのアクティブな認識が可能な最初の自律運転エージェントであるDriveAgent-R1を紹介する。
複雑なシナリオでは、DriveAgent-R1は視覚的推論を行うためのツールを積極的に呼び出し、その決定を視覚的証拠にしっかりと基礎づける。
本稿では,人間ドライバーの認知パターンにインスパイアされたハイブリッド思考フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-28T14:33:15Z) - Confidence-Regulated Generative Diffusion Models for Reliable AI Agent Migration in Vehicular Metaverses [55.70043755630583]
車両用AIエージェントには、環境認識、意思決定、行動実行能力が与えられている。
本稿では、信頼性の高い車両用AIエージェントマイグレーションフレームワークを提案し、信頼性の高い動的マイグレーションと効率的なリソーススケジューリングを実現する。
我々は,AIエージェントのマイグレーション決定を効率的に生成する信頼性制御型生成拡散モデル(CGDM)を開発した。
論文 参考訳(メタデータ) (2025-05-19T05:04:48Z) - Evidence and quantification of cooperation of driving agents in mixed traffic flow [21.67640928933297]
協力は、多くの自然、社会的、工学的なシステムにおいて、複数のエージェントを持つユビキタスな現象である。
実験データから運転エージェントの協調性を定義・同定する方法は曖昧に思われる。
駆動エージェントの集合的協調性を同定するための統合概念的枠組みを提案する。
論文 参考訳(メタデータ) (2024-07-31T00:15:54Z) - Work-in-Progress: Crash Course: Can (Under Attack) Autonomous Driving Beat Human Drivers? [60.51287814584477]
本稿では,現在のAVの状況を調べることによって,自律運転における本質的なリスクを評価する。
AVの利点と、現実のシナリオにおける潜在的なセキュリティ課題との微妙なバランスを強調した、特定のクレームを開発する。
論文 参考訳(メタデータ) (2024-05-14T09:42:21Z) - Reason2Drive: Towards Interpretable and Chain-based Reasoning for Autonomous Driving [38.28159034562901]
Reason2Driveは600万以上のビデオテキストペアを備えたベンチマークデータセットである。
我々は、自律運転プロセスが知覚、予測、推論ステップの逐次的な組み合わせであると特徴付けている。
本稿では,自律システムにおける連鎖型推論性能を評価するための新しい集計評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-06T18:32:33Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Social Interaction-Aware Dynamical Models and Decision Making for
Autonomous Vehicles [20.123965317836106]
IAAD(Interaction-Aware Autonomous Driving)は、急速に成長する研究分野である。
それは、人間の道路利用者と安全かつ効率的に対話できる自動運転車の開発に焦点を当てている。
これは、自動運転車が人間の道路利用者の行動を理解し予測できることを要求するため、困難な作業である。
論文 参考訳(メタデータ) (2023-10-29T03:43:50Z) - RCAgent: Cloud Root Cause Analysis by Autonomous Agents with Tool-Augmented Large Language Models [46.476439550746136]
近年,クラウド根本原因分析(RCA)における言語モデル (LLM) の適用が活発に検討されている。
RCAgentは、実用的でプライバシに配慮した産業RCA利用のためのツール強化LDM自律エージェントフレームワークである。
RCAgentはGPTファミリではなく、内部的にデプロイされたモデル上で動作し、フリーフォームのデータ収集とツールによる包括的な分析を行うことができる。
論文 参考訳(メタデータ) (2023-10-25T03:53:31Z) - Studying the Impact of Semi-Cooperative Drivers on Overall Highway Flow [76.38515853201116]
半協調行動は、人間ドライバーの本質的な性質であり、自律運転には考慮すべきである。
新たな自律型プランナーは、社会的に準拠した軌道を生成するために、人間のドライバーの社会的価値指向(SVO)を考慮することができる。
エージェントが反復的最適応答のゲーム理論バージョンをデプロイする暗黙的な半協調運転について検討する。
論文 参考訳(メタデータ) (2023-04-23T16:01:36Z) - Vehicular Cooperative Perception Through Action Branching and Federated
Reinforcement Learning [101.64598586454571]
強化学習に基づく車両関連、リソースブロック(RB)割り当て、協調認識メッセージ(CPM)のコンテンツ選択を可能にする新しいフレームワークが提案されている。
車両全体のトレーニングプロセスをスピードアップするために、フェデレーションRLアプローチが導入されます。
その結果、フェデレーションRLはトレーニングプロセスを改善し、非フェデレーションアプローチと同じ時間内により良いポリシーを達成できることが示された。
論文 参考訳(メタデータ) (2020-12-07T02:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。