論文の概要: MILD: Mediator Agent System with Bidirectional Perception and Multi-Layered Alignment for Human-Vehicle Collaboration
- arxiv url: http://arxiv.org/abs/2605.01507v1
- Date: Sat, 02 May 2026 15:56:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.809199
- Title: MILD: Mediator Agent System with Bidirectional Perception and Multi-Layered Alignment for Human-Vehicle Collaboration
- Title(参考訳): MILD: 双方向認識と多層アライメントを用いた人車連携のためのメディエータエージェントシステム
- Authors: Jiyao Wang, Yunbiao Wang, Yubo Jiao, Xiao Yang, Dengbo He, Sasan Jafarnejad, Luis Miranda-Moreno, Raphael Frank, Jiangbo Yu,
- Abstract要約: エージェントシステムアーキテクチャに基づくMILD(Mediator-in-the-Loop-Driving)システムを導入する。
MILDは、共同キャビンとアウト・オブ・キャビンの理解のための知覚エージェントと、コンプライアンスと説明可能なアクション提案を生成する軽量な戦略エージェントを統合する。
ECPOは自動検証器を利用して、エージェントを正確であるだけでなく、構造的にも完全であり、証拠によって裏付けられ、制約違反のない行動に向けて操る。
- 参考スコア(独自算出の注目度): 10.683140163408858
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prior studies report that partial driving automation can increase the cognitive demands on human drivers. This effect largely arises from human drivers' lack of transparent insight into the vehicle's intentions and decision logic, as well as from automated systems' limited awareness of the driver's dynamic state and preferences. This bidirectional misalignment undermines shared situational awareness and exacerbates coordination failures in human-vehicle interaction. To address these limitations, we argue for a paradigm shift that elevates the human role from passive supervisor to active manager. We introduce the Mediator-in-the-Loop-Driving (MILD) system, based on an agentic system architecture to facilitate synergistic human-vehicle collaboration. MILD integrates a perception agent for joint in-cabin and out-of-cabin understanding with a lightweight strategy agent that generates compliant and explainable action suggestions. To ensure these strategies are strictly aligned with safety regulations and human values, we develop Evidence- and Constraint-weighted Policy Optimization (ECPO). ECPO leverages automatic validators to steer the agent toward behaviors that are not only accurate but also structurally complete, substantiated by evidence, and free from constraint violations. Furthermore, a retrieval-augmented generation module dynamically incorporates constraints from traffic regulations, speed recommendations, and driver preferences into the decision loop. Field experiments across three open datasets demonstrate that MILD consistently outperforms baselines in both perception accuracy and strategy quality under auditable offline metrics, and yields higher human-rated policy adequacy, comfort, and explanation than baselines. This work offers a practical pathway for building auditable and aligned agents for human-vehicle collaborative driving.
- Abstract(参考訳): 以前の研究では、部分的な運転自動化は人間のドライバーに対する認知的要求を増加させる可能性があると報告されていた。
この効果は、人間のドライバーが車両の意図や決定論理について透過的な洞察を欠いていることや、自動システムのドライバーの動的状態や嗜好に対する認識が限られていることから生じる。
この双方向のミスアライメントは、状況認識の共有を損なうとともに、人間と車両の相互作用における協調の失敗を悪化させる。
これらの制限に対処するため、我々は、受動的監督からアクティブマネージャへの人間の役割を増大させるパラダイムシフトを論じる。
エージェントシステムアーキテクチャに基づくMILD(Mediator-in-the-Loop-Driving)システムを導入する。
MILDは、共同キャビンとアウト・オブ・キャビンの理解のための知覚エージェントと、コンプライアンスと説明可能なアクション提案を生成する軽量な戦略エージェントを統合する。
これらの戦略が安全規制や人的価値と厳格に整合していることを保証するため、エビデンス・アンド・制約重み付け政策最適化(ECPO)を開発する。
ECPOは自動検証器を利用して、エージェントを正確であるだけでなく、構造的にも完全であり、証拠によって裏付けられ、制約違反のない行動に向けて操る。
さらに、検索拡張生成モジュールは、交通規制、スピードレコメンデーション、ドライバーの選好といった制約を動的に決定ループに組み込む。
3つのオープンデータセットにわたるフィールド実験により、MILDは監査可能なオフラインメトリクスの下で、認識精度と戦略品質の両方でベースラインを一貫して上回り、ベースラインよりも高い人格のポリシー適合性、快適性、説明力が得られることが示された。
この研究は、人間と車両の協調運転のための監査および調整可能なエージェントを構築するための実践的な経路を提供する。
関連論文リスト
- Dual-Interaction-Aware Cooperative Control Strategy for Alleviating Mixed Traffic Congestion [36.780597614300504]
コネクテッド・アンド・オートマチック・ビークル(CAV)は、協調戦略による交通渋滞を著しく低減することが期待されている。
混在交通環境における人間適応型人間駆動車(HDV)の挙動の不確かさと多様性は、CAV協力にとって大きな課題である。
本稿では、局所的およびグローバルな相互作用知覚を両立させるDIACC(Dual-Interaction-Aware Cooperative Control)戦略を提案する。
論文 参考訳(メタデータ) (2026-03-04T09:00:49Z) - Large Multimodal Models for Embodied Intelligent Driving: The Next Frontier in Self-Driving? [68.82027978227008]
この記事では、この課題に取り組むために、新しいセマンティクスとポリシーの二重駆動型ハイブリッド決定フレームワークを紹介します。
このフレームワークは、意味理解と認知表現のためのLMMと、リアルタイムポリシー最適化のための深層強化学習(DRL)を統合している。
本研究は,車線変更計画作業におけるフレームワークの性能優位性を検証するための事例研究である。
論文 参考訳(メタデータ) (2026-01-13T11:05:12Z) - A Human-Oriented Cooperative Driving Approach: Integrating Driving Intention, State, and Conflict [50.983743505985956]
我々は,より自然で効果的な人間-車間相互作用を確立するために,Human-Oriented Cooperative Driving (HOCD) アプローチを提案する。
実装においては、シームレスな人車連携を確保するため、戦術レベルと運用レベルを考慮に入れます。
他の協調運転法と比較して,提案手法は運転性能を著しく向上し,人間と機械の衝突を緩和する。
論文 参考訳(メタデータ) (2025-12-29T05:51:00Z) - DriveAgent-R1: Advancing VLM-based Autonomous Driving with Active Perception and Hybrid Thinking [33.98300989562812]
本稿では,計画のためのアクティブな認識が可能な最初の自律運転エージェントであるDriveAgent-R1を紹介する。
複雑なシナリオでは、DriveAgent-R1は視覚的推論を行うためのツールを積極的に呼び出し、その決定を視覚的証拠にしっかりと基礎づける。
本稿では,人間ドライバーの認知パターンにインスパイアされたハイブリッド思考フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-28T14:33:15Z) - ReAL-AD: Towards Human-Like Reasoning in End-to-End Autonomous Driving [27.75047397292818]
エンドツーエンドの自動運転は、単一のフレームワーク内で認識、予測、計画を統合するための有望なアプローチとして現れています。
本稿では,3階層の認知モデルに基づいて自律運転における意思決定を構造化するReAL-ADを提案する。
我々のフレームワークを統合することで、計画の正確さと安全性が30%以上向上し、エンドツーエンドの自動運転がより解釈可能になり、人間のような階層的推論に適合することを示します。
論文 参考訳(メタデータ) (2025-07-16T02:23:24Z) - Confidence-Regulated Generative Diffusion Models for Reliable AI Agent Migration in Vehicular Metaverses [55.70043755630583]
車両用AIエージェントには、環境認識、意思決定、行動実行能力が与えられている。
本稿では、信頼性の高い車両用AIエージェントマイグレーションフレームワークを提案し、信頼性の高い動的マイグレーションと効率的なリソーススケジューリングを実現する。
我々は,AIエージェントのマイグレーション決定を効率的に生成する信頼性制御型生成拡散モデル(CGDM)を開発した。
論文 参考訳(メタデータ) (2025-05-19T05:04:48Z) - Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [87.7482313774741]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。