論文の概要: KoMA: Knowledge-driven Multi-agent Framework for Autonomous Driving with Large Language Models
- arxiv url: http://arxiv.org/abs/2407.14239v1
- Date: Fri, 19 Jul 2024 12:13:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 17:44:33.961215
- Title: KoMA: Knowledge-driven Multi-agent Framework for Autonomous Driving with Large Language Models
- Title(参考訳): KoMA: 大規模言語モデルを用いた自律走行のための知識駆動型マルチエージェントフレームワーク
- Authors: Kemou Jiang, Xuan Cai, Zhiyong Cui, Aoyong Li, Yilong Ren, Haiyang Yu, Hao Yang, Daocheng Fu, Licheng Wen, Pinlong Cai,
- Abstract要約: 自律エージェントとしての大規模言語モデル(LLM)は、知識駆動的な方法で現実の課題に取り組むための新しい道筋を提供する。
我々は,マルチエージェントインタラクション,マルチステップ計画,共有メモリ,ランキングベースのリフレクションモジュールからなるKoMAフレームワークを提案する。
- 参考スコア(独自算出の注目度): 15.951550445568605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) as autonomous agents offer a novel avenue for tackling real-world challenges through a knowledge-driven manner. These LLM-enhanced methodologies excel in generalization and interpretability. However, the complexity of driving tasks often necessitates the collaboration of multiple, heterogeneous agents, underscoring the need for such LLM-driven agents to engage in cooperative knowledge sharing and cognitive synergy. Despite the promise of LLMs, current applications predominantly center around single agent scenarios. To broaden the horizons of knowledge-driven strategies and bolster the generalization capabilities of autonomous agents, we propose the KoMA framework consisting of multi-agent interaction, multi-step planning, shared-memory, and ranking-based reflection modules to enhance multi-agents' decision-making in complex driving scenarios. Based on the framework's generated text descriptions of driving scenarios, the multi-agent interaction module enables LLM agents to analyze and infer the intentions of surrounding vehicles, akin to human cognition. The multi-step planning module enables LLM agents to analyze and obtain final action decisions layer by layer to ensure consistent goals for short-term action decisions. The shared memory module can accumulate collective experience to make superior decisions, and the ranking-based reflection module can evaluate and improve agent behavior with the aim of enhancing driving safety and efficiency. The KoMA framework not only enhances the robustness and adaptability of autonomous driving agents but also significantly elevates their generalization capabilities across diverse scenarios. Empirical results demonstrate the superiority of our approach over traditional methods, particularly in its ability to handle complex, unpredictable driving environments without extensive retraining.
- Abstract(参考訳): 自律エージェントとしての大規模言語モデル(LLM)は、知識駆動的な方法で現実の課題に取り組むための新しい道筋を提供する。
これらのLCM強化手法は一般化と解釈可能性に優れる。
しかし、運転タスクの複雑さは、複数の異種エージェントの協調を必要とすることが多く、協調的な知識共有と認知シナジーに携わるLLM駆動エージェントの必要性を浮き彫りにする。
LLMの約束にもかかわらず、現在のアプリケーションは主に単一のエージェントシナリオを中心にしている。
知識駆動型戦略の地平を広げ、自律エージェントの一般化能力を高めるために、複雑な運転シナリオにおけるマルチエージェントの意思決定を強化するために、マルチエージェントインタラクション、マルチステップ計画、共有メモリ、ランキングベースのリフレクションモジュールからなるKoMAフレームワークを提案する。
フレームワークが生成した運転シナリオのテキスト記述に基づいて、マルチエージェントインタラクションモジュールは、LLMエージェントが人間の認識に似た、周囲の車両の意図を分析し、推測することを可能にする。
マルチステップ計画モジュールは、LLMエージェントが最終アクション決定層を層ごとに分析して取得し、短期アクション決定のための一貫した目標を確実にすることを可能にする。
共有メモリモジュールは、集合的な経験を蓄積し、優れた意思決定を行うことができ、ランキングベースのリフレクションモジュールは、運転安全性と効率を向上させることを目的として、エージェントの動作を評価し改善することができる。
KoMAフレームワークは、自律運転エージェントの堅牢性と適応性を向上するだけでなく、さまざまなシナリオにまたがる一般化能力を著しく高めている。
実証実験の結果、従来の手法よりも、特に複雑な予測不可能な運転環境を広範囲に再訓練することなく扱えるという点において、我々のアプローチが優れていることが示された。
関連論文リスト
- From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning [62.54484062185869]
本稿では,エージェントの強化学習プロセスの最適化にステップワイド報酬を利用するStepAgentを紹介する。
エージェント反射とポリシー調整を容易にする暗黙の逆・逆の強化学習手法を提案する。
論文 参考訳(メタデータ) (2024-11-06T10:35:11Z) - CoMAL: Collaborative Multi-Agent Large Language Models for Mixed-Autonomy Traffic [11.682456863110767]
CoMALは、交通の流れを最適化するために、自動運転車間のコラボレーションによって、混在する自律交通問題に対処するために設計されたフレームワークである。
CoMALは大きな言語モデル上に構築されており、対話的な交通シミュレーション環境で動作する。
論文 参考訳(メタデータ) (2024-10-18T10:53:44Z) - Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Optimizing Collaboration of LLM based Agents for Finite Element Analysis [1.5039745292757671]
本稿では,Large Language Models (LLM) 内の複数のエージェント間の相互作用について,プログラミングおよびコーディングタスクの文脈で検討する。
我々はAutoGenフレームワークを利用してエージェント間の通信を容易にし、各セットアップの40のランダムランからの成功率に基づいて異なる構成を評価する。
論文 参考訳(メタデータ) (2024-08-23T23:11:08Z) - AgentsCoMerge: Large Language Model Empowered Collaborative Decision Making for Ramp Merging [46.69777653051523]
ランプの合流は交通システムのボトルネックの1つであり、交通渋滞、事故、深刻な二酸化炭素排出を引き起こすのが普通である。
我々は,大規模言語モデル(LLM)を活用するための新しい協調的意思決定フレームワーク,AgentsCoMergeを提案する。
論文 参考訳(メタデータ) (2024-08-07T08:34:48Z) - Agent-Pro: Learning to Evolve via Policy-Level Reflection and Optimization [53.510942601223626]
大規模言語モデル(LLM)は多様なタスクに対して堅牢な問題解決能力を示す。
これらのタスクソルバは、タスクルールを通知し、行動を調整するために手作業によるプロンプトを必要とする。
本稿では,ポリシーレベルのリフレクションと最適化を備えた LLM ベースのエージェントである Agent-Pro を提案する。
論文 参考訳(メタデータ) (2024-02-27T15:09:20Z) - Large Multimodal Agents: A Survey [78.81459893884737]
大規模言語モデル(LLM)は、テキストベースのAIエージェントのパワーで優れたパフォーマンスを実現している。
LLMを利用したAIエージェントをマルチモーダルドメインに拡張することに焦点を当てた、新たな研究トレンドがある。
本総説は, この急速に発展する分野において, 今後の研究に有用な洞察とガイドラインを提供することを目的としている。
論文 参考訳(メタデータ) (2024-02-23T06:04:23Z) - LanguageMPC: Large Language Models as Decision Makers for Autonomous
Driving [87.1164964709168]
この作業では、複雑な自律運転シナリオの意思決定コンポーネントとして、Large Language Models(LLM)を採用している。
大規模実験により,提案手法は単車載タスクのベースラインアプローチを一貫して超えるだけでなく,複数車載コーディネートにおいても複雑な運転動作の処理にも有効であることが示された。
論文 参考訳(メタデータ) (2023-10-04T17:59:49Z) - An Introduction to Multi-Agent Reinforcement Learning and Review of its
Application to Autonomous Mobility [1.496194593196997]
マルチエージェント強化学習(MARL、Multi-Agent Reinforcement Learning)は、複数のエージェントが相互に相互作用する最適な解を見つけることを目的とした研究分野である。
この研究は、自律移動の研究者にこの分野の概要を提供することを目的としている。
論文 参考訳(メタデータ) (2022-03-15T06:40:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。