論文の概要: SimWorld: An Open-ended Realistic Simulator for Autonomous Agents in Physical and Social Worlds
- arxiv url: http://arxiv.org/abs/2512.01078v1
- Date: Sun, 30 Nov 2025 20:58:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.571487
- Title: SimWorld: An Open-ended Realistic Simulator for Autonomous Agents in Physical and Social Worlds
- Title(参考訳): SimWorld: 物理と社会の世界における自律エージェントのためのオープンなリアルなシミュレータ
- Authors: Jiawei Ren, Yan Zhuang, Xiaokang Ye, Lingjun Mao, Xuhong He, Jianzhi Shen, Mrinaal Dogra, Yiming Liang, Ruixuan Zhang, Tianai Yue, Yiqing Yang, Eric Liu, Ryan Wu, Kevin Benavente, Rajiv Mandya Nagaraju, Muhammad Faayez, Xiyan Zhang, Dhruv Vivek Sharma, Xianrui Zhong, Ziqiao Ma, Tianmin Shu, Zhiting Hu, Lianhui Qin,
- Abstract要約: 我々は,AIエージェントの開発と評価を目的とした,Unreal Engine 5上に構築された新しいシミュレータであるSimWorldを紹介する。
SimWorldはリアルでオープンな世界シミュレーションを提供する。
戦略的協力と競争を含む長期マルチエージェント配信タスクにLLMエージェントを配置することで、SimWorldを実証する。
- 参考スコア(独自算出の注目度): 31.504258822495768
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While LLM/VLM-powered AI agents have advanced rapidly in math, coding, and computer use, their applications in complex physical and social environments remain challenging. Building agents that can survive and thrive in the real world (for example, by autonomously earning income or running a business) requires massive-scale interaction, reasoning, training, and evaluation across diverse embodied scenarios. However, existing world simulators for such development fall short: they often rely on limited hand-crafted environments, simulate simplified game-like physics and social rules, and lack native support for LLM/VLM agents. We introduce SimWorld, a new simulator built on Unreal Engine 5, designed for developing and evaluating LLM/VLM agents in rich, real-world-like settings. SimWorld offers three core capabilities: (1) realistic, open-ended world simulation, including accurate physical and social dynamics and language-driven procedural environment generation; (2) a rich interface for LLM/VLM agents, with multimodal world inputs and open-vocabulary actions at varying levels of abstraction; and (3) diverse and extensible physical and social reasoning scenarios that are easily customizable by users. We demonstrate SimWorld by deploying frontier LLM agents (e.g., GPT-4o, Gemini-2.5-Flash, Claude-3.5, and DeepSeek-Prover-V2) on long-horizon multi-agent delivery tasks involving strategic cooperation and competition. The results reveal distinct reasoning patterns and limitations across models. We open-source SimWorld and hope it becomes a foundational platform for advancing real-world agent intelligence across disciplines: https://simworld.org.
- Abstract(参考訳): LLM/VLMを利用したAIエージェントは、数学、コーディング、コンピュータ利用において急速に進歩しているが、複雑な物理的および社会的環境におけるそれらの応用は依然として困難である。
現実世界で生き残り、繁栄できるエージェント(例えば、収入を自律的に獲得したり、ビジネスを運営することで)を構築するには、様々な実施シナリオにわたる大規模な相互作用、推論、トレーニング、評価が必要である。
しかし、そのような開発のための既存の世界シミュレータは、しばしば手作りの限られた環境に依存し、単純化されたゲームライクな物理や社会ルールをシミュレートし、LLM/VLMエージェントのネイティブサポートを欠いている。
我々は,Unreal Engine 5上に構築された新しいシミュレータであるSimWorldを紹介した。
シムワールドは,(1)正確な物理的・社会的ダイナミックスと言語駆動の手続き環境生成を含む現実的でオープンな世界シミュレーション,(2)多モーダル世界入力と様々な抽象レベルでのオープン語彙アクションを備えたLLM/VLMエージェントのリッチインターフェース,(3)ユーザが容易にカスタマイズ可能な多様で拡張可能な物理的・社会的推論シナリオ,の3つのコア機能を提供する。
我々は,戦略的協力と競争を伴う長期マルチエージェント配信タスクに,フロンティアLDMエージェント(例えば,GPT-4o,Gemini-2.5-Flash,Claude-3.5,DeepSeek-Prover-V2)を配置することで,SimWorldを実証する。
その結果、モデル間での明確な推論パターンと制限が明らかになった。
われわれはSimWorldをオープンソースとして公開し、現実世界のエージェントインテリジェンスを促進するための基盤となることを願っている。
関連論文リスト
- Dyna-Mind: Learning to Simulate from Experience for Better AI Agents [62.21219817256246]
私たちは、現在のAIエージェントは、行動する前に、別の未来を精神的にシミュレートする能力である「悪意ある試行錯誤」を必要としていると論じます。
我々は、(V)LMエージェントに対して、そのようなシミュレーションを推論に組み込むように明示的に教える2段階のトレーニングフレームワークであるDyna-Mindを紹介した。
論文 参考訳(メタデータ) (2025-10-10T17:30:18Z) - SimPRIVE: a Simulation framework for Physical Robot Interaction with Virtual Environments [4.966661313606916]
本稿では,仮想環境との物理的相互作用をシミュレーションするSimPRIVEを提案する。
SimPRIVEを使用することで、ROS 2上で動作する任意の物理移動ロボットは、Unreal Engine 5グラフィックエンジンで構築された仮想世界でデジタルツインを動かせるように構成することができる。
このフレームワークは、AgileX Scout Miniローバーで障害物回避のためにトレーニングされた強化学習エージェントをテストすることで検証されている。
論文 参考訳(メタデータ) (2025-04-30T09:22:55Z) - MineLand: Simulating Large-Scale Multi-Agent Interactions with Limited Multimodal Senses and Physical Needs [12.987019067098414]
大規模スケーラビリティ,マルチモーダル感覚の制限,物理的ニーズの3つの重要な特徴を導入することで,このギャップを埋めるマルチエージェントMinecraftシミュレータであるMineLandを提案する。
シミュレータは64以上のエージェントをサポートします。エージェントは視覚的,聴覚的,環境的な意識に制限があり,食物や資源といった物理的ニーズを満たすために積極的にコミュニケーションし,協力せざるを得ません。
実験により,シミュレータ,対応するベンチマーク,およびAIエージェントフレームワークが,より生態学的・ニュアンスな集団行動に寄与することが示された。
論文 参考訳(メタデータ) (2024-03-28T09:53:41Z) - V-IRL: Grounding Virtual Intelligence in Real Life [65.87750250364411]
V-IRLは、エージェントが仮想的で現実的な環境で現実世界と対話することを可能にするプラットフォームである。
私たちのプラットフォームは、様々な実践的なタスクを達成できるエージェントを開発するための遊び場として役立ちます。
論文 参考訳(メタデータ) (2024-02-05T18:59:36Z) - Learning Interactive Real-World Simulators [96.5991333400566]
生成モデルを用いて実世界の相互作用の普遍的なシミュレータを学習する可能性について検討する。
シミュレーターを用いて、高レベルな視覚言語ポリシーと低レベルな強化学習ポリシーの両方を訓練する。
ビデオキャプションモデルは、シミュレートされた経験を持つトレーニングの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-10-09T19:42:22Z) - How Simulation Helps Autonomous Driving:A Survey of Sim2real, Digital
Twins, and Parallel Intelligence [16.24370001383615]
シミュレーションで学んだ運転知識を現実に適応させる方法が重要な問題となっている。
仮想シミュレーションの世界は、照明、テクスチャ、車両のダイナミクス、エージェントの振る舞いなど多くの面で現実世界と異なる。
現実のギャップ問題に対処するアプローチの3つのカテゴリ - シミュレーションから現実への知識伝達(sim2real)、デジタル双生児における学習(DT)、並列インテリジェンスによる学習(PI)
論文 参考訳(メタデータ) (2023-05-02T09:00:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。