論文の概要: BattleAgent: Multi-modal Dynamic Emulation on Historical Battles to Complement Historical Analysis
- arxiv url: http://arxiv.org/abs/2404.15532v1
- Date: Tue, 23 Apr 2024 21:37:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-25 15:03:25.072088
- Title: BattleAgent: Multi-modal Dynamic Emulation on Historical Battles to Complement Historical Analysis
- Title(参考訳): BattleAgent: 歴史的戦闘に関するマルチモーダル・ダイナミック・エミュレーション
- Authors: Shuhang Lin, Wenyue Hua, Lingyao Li, Che-Jui Chang, Lizhou Fan, Jianchao Ji, Hang Hua, Mingyu Jin, Jiebo Luo, Yongfeng Zhang,
- Abstract要約: 本稿では,大規模視覚言語モデルとマルチエージェントシステムを組み合わせたエミュレーションシステムであるBattleAgentを提案する。
複数のエージェント間の複雑な動的相互作用をシミュレートし、エージェントとその環境をシミュレートすることを目的としている。
指導者の意思決定プロセスと、兵士のような一般参加者の視点の両方をエミュレートする。
- 参考スコア(独自算出の注目度): 62.60458710368311
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents BattleAgent, an emulation system that combines the Large Vision-Language Model and Multi-agent System. This novel system aims to simulate complex dynamic interactions among multiple agents, as well as between agents and their environments, over a period of time. It emulates both the decision-making processes of leaders and the viewpoints of ordinary participants, such as soldiers. The emulation showcases the current capabilities of agents, featuring fine-grained multi-modal interactions between agents and landscapes. It develops customizable agent structures to meet specific situational requirements, for example, a variety of battle-related activities like scouting and trench digging. These components collaborate to recreate historical events in a lively and comprehensive manner while offering insights into the thoughts and feelings of individuals from diverse viewpoints. The technological foundations of BattleAgent establish detailed and immersive settings for historical battles, enabling individual agents to partake in, observe, and dynamically respond to evolving battle scenarios. This methodology holds the potential to substantially deepen our understanding of historical events, particularly through individual accounts. Such initiatives can also aid historical research, as conventional historical narratives often lack documentation and prioritize the perspectives of decision-makers, thereby overlooking the experiences of ordinary individuals. BattelAgent illustrates AI's potential to revitalize the human aspect in crucial social events, thereby fostering a more nuanced collective understanding and driving the progressive development of human society.
- Abstract(参考訳): 本稿では,大規模視覚言語モデルとマルチエージェントシステムを組み合わせたエミュレーションシステムであるBattleAgentを提案する。
このシステムは、複数のエージェント間の複雑な動的相互作用と、エージェントとその環境間の相互作用を、一定時間にわたってシミュレートすることを目的としている。
指導者の意思決定プロセスと、兵士のような一般参加者の視点の両方をエミュレートする。
エミュレーションはエージェントの現在の能力を示し、エージェントとランドスケープ間のきめ細かいマルチモーダル相互作用を特徴としている。
特定の状況条件を満たすようにカスタマイズ可能なエージェント構造を開発する。例えば、スカウトやトレンチ掘削など、様々な戦闘関連の活動を行う。
これらの構成要素は、様々な視点から個人の思考や感情についての洞察を提供しながら、活発で包括的な方法で歴史的な出来事を再現するために協力する。
バトルアジェントの技術的基盤は、歴史的戦闘の詳細な、没入的な設定を確立し、個々のエージェントが進化する戦闘シナリオに参加し、観察し、動的に対応できるようにする。
この方法論は、歴史的出来事、特に個人の説明を通じて、我々の理解を著しく深める可能性を秘めている。
このようなイニシアチブは、従来の歴史物語が文書を欠くことが多く、意思決定者の視点を優先し、普通の個人の経験を見落としているため、歴史研究にも役立てることができる。
BattelAgentは、AIが重要な社会的出来事における人間の側面を再活性化する可能性を示し、それによってより曖昧な集団的理解を育み、人間の社会の進歩的な発展を促進する。
関連論文リスト
- StoryAgent: Customized Storytelling Video Generation via Multi-Agent Collaboration [88.94832383850533]
CSVG(Customized Storytelling Video Generation)のためのマルチエージェントフレームワークを提案する。
StoryAgentはCSVGを特殊エージェントに割り当てられた個別のサブタスクに分解し、プロの制作プロセスを反映する。
具体的には、撮影時間内整合性を高めるために、カスタマイズされたイメージ・ツー・ビデオ(I2V)手法であるLoRA-BEを導入する。
コントリビューションには、ビデオ生成タスクのための汎用フレームワークであるStoryAgentの導入や、プロタゴニストの一貫性を維持するための新しい技術が含まれている。
論文 参考訳(メタデータ) (2024-11-07T18:00:33Z) - Project Sid: Many-agent simulations toward AI civilization [1.623086795799085]
10から1000以上のAIエージェントがエージェント社会の中でどのように行動し、進歩するかを実証する。
まず,PIANOアーキテクチャを導入し,エージェントが人間や他のエージェントとリアルタイムで対話できるようにする。
次に,人史に触発された文明的ベンチマークを用いてエージェントシミュレーションにおけるエージェント性能を評価する。
論文 参考訳(メタデータ) (2024-10-31T18:11:22Z) - The Drama Machine: Simulating Character Development with LLM Agents [1.999925939110439]
本稿では,多言語モデル (LLM) エージェントを用いたドラマティックシナリオにおける複雑な動的キャラクタのシミュレートについて検討する。
本稿では,異なる「エゴ」と「スーパーエゴ」の心理的役割を演じるLLMエージェント間の相互作用を協調するドラママシンフレームワークを提案する。
結果として、このマルチエージェントアプローチは、対話的なターンの連続を通して進化する、よりニュアンスで適応的な物語を生み出すことができることが示唆された。
論文 参考訳(メタデータ) (2024-08-03T09:40:26Z) - Hello Again! LLM-powered Personalized Agent for Long-term Dialogue [63.65128176360345]
モデルに依存しない長期対話エージェント(LD-Agent)を導入する。
イベント認識、ペルソナ抽出、応答生成のための3つの独立した調整可能なモジュールが組み込まれている。
LD-Agentの有効性, 汎用性, クロスドメイン性について実験的に検証した。
論文 参考訳(メタデータ) (2024-06-09T21:58:32Z) - MEIA: Multimodal Embodied Perception and Interaction in Unknown Environments [82.67236400004826]
本稿では,自然言語で表現されたハイレベルなタスクを実行可能なアクションのシーケンスに変換するための,MEIA(Multimodal Embodied Interactive Agent)を提案する。
MEMモジュールは、多様な要件とロボットの能力に基づいて、MEIAが実行可能なアクションプランを生成することを可能にする。
論文 参考訳(メタデータ) (2024-02-01T02:43:20Z) - Agent AI: Surveying the Horizons of Multimodal Interaction [83.18367129924997]
エージェントAI(Agent AI)とは、視覚刺激や言語入力、その他の環境データを知覚できる対話型システムである。
我々は,バーチャルリアリティやシミュレートされたシーンを容易に作成し,仮想環境内に具体化されたエージェントと対話できる未来を構想する。
論文 参考訳(メタデータ) (2024-01-07T19:11:18Z) - Generative Agents: Interactive Simulacra of Human Behavior [86.1026716646289]
生成エージェントを導入し,人間の振る舞いをシミュレートする計算ソフトウェアエージェントについて紹介する。
エージェントの経験の完全な記録を格納するために,大規模言語モデルを拡張するアーキテクチャについて述べる。
The Simsにインスパイアされた対話型サンドボックス環境に生成エージェントを投入する。
論文 参考訳(メタデータ) (2023-04-07T01:55:19Z) - Multi-Agent Interplay in a Competitive Survival Environment [0.0]
この論文は、2022年、ローマ・サピエンザ大学の人工知能とロボティクスの修士号に対する著者の論文"Multi-Agent Interplay in a Competitive Survival Environment"の一部である。
論文 参考訳(メタデータ) (2023-01-19T12:04:03Z) - GATSBI: Generative Agent-centric Spatio-temporal Object Interaction [9.328991021103294]
GAT SBIは生観測の系列を構造化表現に変換する生成モデルである。
GAT SBIはシーン分解や映像予測において最先端技術に比べて優れていることを示す。
論文 参考訳(メタデータ) (2021-04-09T09:45:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。