論文の概要: BattleAgent: Multi-modal Dynamic Emulation on Historical Battles to Complement Historical Analysis
- arxiv url: http://arxiv.org/abs/2404.15532v1
- Date: Tue, 23 Apr 2024 21:37:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-25 15:03:25.072088
- Title: BattleAgent: Multi-modal Dynamic Emulation on Historical Battles to Complement Historical Analysis
- Title(参考訳): BattleAgent: 歴史的戦闘に関するマルチモーダル・ダイナミック・エミュレーション
- Authors: Shuhang Lin, Wenyue Hua, Lingyao Li, Che-Jui Chang, Lizhou Fan, Jianchao Ji, Hang Hua, Mingyu Jin, Jiebo Luo, Yongfeng Zhang,
- Abstract要約: 本稿では,大規模視覚言語モデルとマルチエージェントシステムを組み合わせたエミュレーションシステムであるBattleAgentを提案する。
複数のエージェント間の複雑な動的相互作用をシミュレートし、エージェントとその環境をシミュレートすることを目的としている。
指導者の意思決定プロセスと、兵士のような一般参加者の視点の両方をエミュレートする。
- 参考スコア(独自算出の注目度): 62.60458710368311
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents BattleAgent, an emulation system that combines the Large Vision-Language Model and Multi-agent System. This novel system aims to simulate complex dynamic interactions among multiple agents, as well as between agents and their environments, over a period of time. It emulates both the decision-making processes of leaders and the viewpoints of ordinary participants, such as soldiers. The emulation showcases the current capabilities of agents, featuring fine-grained multi-modal interactions between agents and landscapes. It develops customizable agent structures to meet specific situational requirements, for example, a variety of battle-related activities like scouting and trench digging. These components collaborate to recreate historical events in a lively and comprehensive manner while offering insights into the thoughts and feelings of individuals from diverse viewpoints. The technological foundations of BattleAgent establish detailed and immersive settings for historical battles, enabling individual agents to partake in, observe, and dynamically respond to evolving battle scenarios. This methodology holds the potential to substantially deepen our understanding of historical events, particularly through individual accounts. Such initiatives can also aid historical research, as conventional historical narratives often lack documentation and prioritize the perspectives of decision-makers, thereby overlooking the experiences of ordinary individuals. BattelAgent illustrates AI's potential to revitalize the human aspect in crucial social events, thereby fostering a more nuanced collective understanding and driving the progressive development of human society.
- Abstract(参考訳): 本稿では,大規模視覚言語モデルとマルチエージェントシステムを組み合わせたエミュレーションシステムであるBattleAgentを提案する。
このシステムは、複数のエージェント間の複雑な動的相互作用と、エージェントとその環境間の相互作用を、一定時間にわたってシミュレートすることを目的としている。
指導者の意思決定プロセスと、兵士のような一般参加者の視点の両方をエミュレートする。
エミュレーションはエージェントの現在の能力を示し、エージェントとランドスケープ間のきめ細かいマルチモーダル相互作用を特徴としている。
特定の状況条件を満たすようにカスタマイズ可能なエージェント構造を開発する。例えば、スカウトやトレンチ掘削など、様々な戦闘関連の活動を行う。
これらの構成要素は、様々な視点から個人の思考や感情についての洞察を提供しながら、活発で包括的な方法で歴史的な出来事を再現するために協力する。
バトルアジェントの技術的基盤は、歴史的戦闘の詳細な、没入的な設定を確立し、個々のエージェントが進化する戦闘シナリオに参加し、観察し、動的に対応できるようにする。
この方法論は、歴史的出来事、特に個人の説明を通じて、我々の理解を著しく深める可能性を秘めている。
このようなイニシアチブは、従来の歴史物語が文書を欠くことが多く、意思決定者の視点を優先し、普通の個人の経験を見落としているため、歴史研究にも役立てることができる。
BattelAgentは、AIが重要な社会的出来事における人間の側面を再活性化する可能性を示し、それによってより曖昧な集団的理解を育み、人間の社会の進歩的な発展を促進する。
関連論文リスト
- An Interactive Agent Foundation Model [50.50659114031731]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文 参考訳(メタデータ) (2024-02-08T18:58:02Z) - Multimodal Embodied Interactive Agent for Cafe Scene [86.81802927029976]
本稿では,自然言語で表現されたハイレベルなタスクを実行可能なアクションのシーケンスに変換するための,MEIA(Multimodal Embodied Interactive Agent)を提案する。
具体的には,シーンの視覚的記憶を介し,大規模モデルとの組込み制御を容易にする,新しいMultimodal Environment Memory (MEM) モジュールを提案する。
論文 参考訳(メタデータ) (2024-02-01T02:43:20Z) - Agent AI: Surveying the Horizons of Multimodal Interaction [83.18367129924997]
エージェントAI(Agent AI)とは、視覚刺激や言語入力、その他の環境データを知覚できる対話型システムである。
我々は,バーチャルリアリティやシミュレートされたシーンを容易に作成し,仮想環境内に具体化されたエージェントと対話できる未来を構想する。
論文 参考訳(メタデータ) (2024-01-07T19:11:18Z) - War and Peace (WarAgent): Large Language Model-based Multi-Agent
Simulation of World Wars [40.489161847202325]
LLMを利用したマルチエージェントAIシステムである textbfWarAgent を提案する。
シミュレーションの有効性を評価することにより,最先端AIシステムの能力の進歩と限界を検討する。
我々の発見は、紛争解決と平和維持戦略にどのようにアプローチするかを再定義する、データ駆動およびAIによる洞察を提供する。
論文 参考訳(メタデータ) (2023-11-28T20:59:49Z) - Tachikuma: Understading Complex Interactions with Multi-Character and
Novel Objects by Large Language Models [67.20964015591262]
我々は,複数文字と新しいオブジェクトベースインタラクション推定タスクとサポートデータセットからなる,立久間というベンチマークを導入する。
このデータセットは、ゲームプレイ中のリアルタイム通信からログデータをキャプチャし、多様な、接地された複雑なインタラクションを提供して、さらなる探索を行う。
本稿では,対話理解の強化に有効であることを示すため,簡単なプロンプトベースラインを提案し,その性能評価を行う。
論文 参考訳(メタデータ) (2023-07-24T07:40:59Z) - Generative Agents: Interactive Simulacra of Human Behavior [86.1026716646289]
生成エージェントを導入し,人間の振る舞いをシミュレートする計算ソフトウェアエージェントについて紹介する。
エージェントの経験の完全な記録を格納するために,大規模言語モデルを拡張するアーキテクチャについて述べる。
The Simsにインスパイアされた対話型サンドボックス環境に生成エージェントを投入する。
論文 参考訳(メタデータ) (2023-04-07T01:55:19Z) - Multi-Agent Interplay in a Competitive Survival Environment [0.0]
この論文は、2022年、ローマ・サピエンザ大学の人工知能とロボティクスの修士号に対する著者の論文"Multi-Agent Interplay in a Competitive Survival Environment"の一部である。
論文 参考訳(メタデータ) (2023-01-19T12:04:03Z) - GATSBI: Generative Agent-centric Spatio-temporal Object Interaction [9.328991021103294]
GAT SBIは生観測の系列を構造化表現に変換する生成モデルである。
GAT SBIはシーン分解や映像予測において最先端技術に比べて優れていることを示す。
論文 参考訳(メタデータ) (2021-04-09T09:45:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。