論文の概要: OpenCity: A Scalable Platform to Simulate Urban Activities with Massive LLM Agents
- arxiv url: http://arxiv.org/abs/2410.21286v1
- Date: Fri, 11 Oct 2024 13:52:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-03 08:19:32.757385
- Title: OpenCity: A Scalable Platform to Simulate Urban Activities with Massive LLM Agents
- Title(参考訳): OpenCity: 大規模LLMエージェントで都市活動をシミュレートするスケーラブルなプラットフォーム
- Authors: Yuwei Yan, Qingbin Zeng, Zhiheng Zheng, Jingzhe Yuan, Jie Feng, Jun Zhang, Fengli Xu, Yong Li,
- Abstract要約: 大規模言語モデル(LLM)は、前例のないリアリズムで都市活動をシミュレートできるLLMエージェントの開発につながっている。
システムと迅速な効率の両方に最適化されたスケーラブルなシミュレーションプラットフォームであるOpenCityを提案する。
OpenCityは、エージェント毎の600倍のシミュレーション時間、LLM要求の70%の削減、トークン使用の50%の削減を実現している。
- 参考スコア(独自算出の注目度): 10.919679349212426
- License:
- Abstract: Agent-based models (ABMs) have long been employed to explore how individual behaviors aggregate into complex societal phenomena in urban space. Unlike black-box predictive models, ABMs excel at explaining the micro-macro linkages that drive such emergent behaviors. The recent rise of Large Language Models (LLMs) has led to the development of LLM agents capable of simulating urban activities with unprecedented realism. However, the extreme high computational cost of LLMs presents significant challenges for scaling up the simulations of LLM agents. To address this problem, we propose OpenCity, a scalable simulation platform optimized for both system and prompt efficiencies. Specifically, we propose a LLM request scheduler to reduce communication overhead by parallelizing requests through IO multiplexing. Besides, we deisgn a "group-and-distill" prompt optimization strategy minimizes redundancy by clustering agents with similar static attributes. Through experiments on six global cities, OpenCity achieves a 600-fold acceleration in simulation time per agent, a 70% reduction in LLM requests, and a 50% reduction in token usage. These improvements enable the simulation of 10,000 agents' daily activities in 1 hour on commodity hardware. Besides, the substantial speedup of OpenCity allows us to establish a urban simulation benchmark for LLM agents for the first time, comparing simulated urban activities with real-world data in 6 major cities around the globe. We believe our OpenCity platform provides a critical infrastructure to harness the power of LLMs for interdisciplinary studies in urban space, fostering the collective efforts of broader research communities. Code repo is available at https://anonymous.4open.science/r/Anonymous-OpenCity-42BD.
- Abstract(参考訳): エージェントベースモデル(ABM)は、都市空間における複雑な社会現象に個人の行動がどのように集約されるかを研究するために長い間使われてきた。
ブラックボックス予測モデルとは異なり、ABMはそのような創発的な振る舞いを駆動するマイクロマクロリンクを説明するのが得意である。
近年のLarge Language Models(LLMs)の台頭により、都市活動と前例のないリアリズムをシミュレートできるLLMエージェントの開発が進められている。
しかし, LLMの計算コストが極端に高いことは, LLMエージェントのシミュレーションをスケールアップする上で大きな課題となる。
この問題に対処するために,システムと迅速な効率の両方に最適化されたスケーラブルなシミュレーションプラットフォームであるOpenCityを提案する。
具体的には、IO多重化による要求の並列化により通信オーバヘッドを低減するLLM要求スケジューラを提案する。
さらに,静的な属性を持つクラスタリングエージェントによる冗長性を最小限に抑える「グループ・アンド・ディスティル」プロンプト最適化手法を提案する。
6つの大都市での実験を通じて、OpenCityはエージェントごとのシミュレーション時間の600倍の加速、LSM要求の70%の削減、トークン使用量の50%の削減を実現している。
これらの改善により、コモディティハードウェア上で1時間に1万人のエージェントの日々の活動のシミュレーションが可能になる。
さらに、OpenCityの大幅なスピードアップにより、世界中の6大都市でシミュレーションされた都市活動と実世界のデータを比較することで、LLMエージェントの都市シミュレーションベンチマークを初めて確立できます。
我々のOpenCityプラットフォームは、都市空間における学際的な研究にLLMの力を利用するための重要なインフラを提供し、より広い研究コミュニティの集合的な努力を育むことができると信じています。
コードリポジトリはhttps://anonymous.4open.science/r/Anonymous-OpenCity-42BDで公開されている。
関連論文リスト
- Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。
人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:49:25Z) - MASTER: A Multi-Agent System with LLM Specialized MCTS [11.780059513577848]
大規模言語モデル(LLM)は、問題解決のためにますます研究されている。
MCTSは、真の報酬分布を近似するために、広範囲なサンプリングシミュレーションに依存している。
LLM専門MCTSによるエージェント採用とコミュニケーションを協調する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-24T08:01:11Z) - AI Metropolis: Scaling Large Language Model-based Multi-Agent Simulation with Out-of-order Execution [15.596642151634319]
AI Metropolisは、注文外実行スケジューリングを導入することで、LLMエージェントシミュレーションの効率を改善するシミュレーションエンジンである。
我々の評価では,グローバル同期を用いた標準並列シミュレーションにより,AI Metropolisは1.3倍から4.15倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-11-05T21:54:14Z) - Synthesizing Post-Training Data for LLMs through Multi-Agent Simulation [51.20656279478878]
MATRIXは、様々なテキストベースのシナリオを自動的に生成するマルチエージェントシミュレータである。
制御可能でリアルなデータ合成のためのMATRIX-Genを紹介する。
AlpacaEval 2 と Arena-Hard のベンチマークでは、Llama-3-8B-Base が、MATRIX-Gen によって合成されたデータセット上で、たった 20K の命令応答ペアで、Meta の Llama-3-8B-Instruct モデルより優れています。
論文 参考訳(メタデータ) (2024-10-18T08:01:39Z) - GenSim: A General Social Simulation Platform with Large Language Model based Agents [111.00666003559324]
我々はtextitGenSim と呼ばれる新しい大規模言語モデル (LLM) ベースのシミュレーションプラットフォームを提案する。
我々のプラットフォームは10万のエージェントをサポートし、現実世界のコンテキストで大規模人口をシミュレートする。
我々の知る限り、GenSimは汎用的で大規模で修正可能な社会シミュレーションプラットフォームに向けた最初の一歩である。
論文 参考訳(メタデータ) (2024-10-06T05:02:23Z) - On the limits of agency in agent-based models [13.130587222524305]
エージェントベースモデリングは複雑なシステムに対する強力な洞察を提供するが、その実用性は計算の制約によって制限されている。
大規模言語モデル(LLM)の最近の進歩は、適応エージェントによるABMを強化する可能性があるが、大規模なシミュレーションへの統合は依然として困難である。
大規模シミュレーションにおいて,行動複雑性と計算効率のバランスをとる手法であるLSMアーチタイプを提案する。
論文 参考訳(メタデータ) (2024-09-14T04:17:24Z) - OpenCity: Open Spatio-Temporal Foundation Models for Traffic Prediction [29.514461050436932]
多様なデータ特性から、基盤となる見えない時間パターンを効果的にキャプチャし、正規化できる、OpenCityという新しい基盤モデルを導入する。
OpenCityはTransformerアーキテクチャとグラフニューラルネットワークを統合して、トラフィックデータの複雑な時間依存性をモデル化する。
実験の結果、OpenCityは例外的なゼロショット性能を示した。
論文 参考訳(メタデータ) (2024-08-16T15:20:36Z) - CityGPT: Empowering Urban Spatial Cognition of Large Language Models [7.40606412920065]
強力な言語生成と推論機能を備えた大規模言語モデル(LLM)は、すでに多くのドメインで成功している。
しかし、物理世界のコーパスが不足し、訓練中に知識が不足しているため、都市空間における多くの現実的なタスクを解決できないのが普通である。
都市空間の理解と関連する都市課題の解決におけるLCMの能力向上のための体系的枠組みであるCityGPTを提案する。
論文 参考訳(メタデータ) (2024-06-20T02:32:16Z) - Towards Efficient LLM Grounding for Embodied Multi-Agent Collaboration [70.09561665520043]
本稿では,多エージェント協調のための新しいフレームワークを提案する。これは,効率的な自己調整のための強化アドバンテージフィードバック(Reinforced Advantage feedback, ReAd)を導入する。
強化学習における重み付き回帰を多エージェントシステムに拡張して理論的解析を行う。
Over-AIと難解なRoCoBenchの実験は、ReAdが成功率のベースラインを超え、エージェントの相互作用ステップを著しく減少させることを示している。
論文 参考訳(メタデータ) (2024-05-23T08:33:19Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - BOLAA: Benchmarking and Orchestrating LLM-augmented Autonomous Agents [103.28404907655542]
大規模言語モデル(LLM)は、自律エージェント(LAA)の新たな探索に繋がった。
本稿では,エージェントアーキテクチャとLLMバックボーンの両方の観点から,LAAの包括的な比較を行う。
我々は、複数のLAAを編成する新しい戦略を提案し、各LAAは、複数のエージェント間の通信を管理する制御器であるテキストティティ(textiti.e. BOLAA)に焦点をあてる。
論文 参考訳(メタデータ) (2023-08-11T06:37:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。