論文の概要: Ella: Embodied Social Agents with Lifelong Memory
- arxiv url: http://arxiv.org/abs/2506.24019v1
- Date: Mon, 30 Jun 2025 16:22:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:54.154137
- Title: Ella: Embodied Social Agents with Lifelong Memory
- Title(参考訳): Ella:生涯記憶を持つ身体的ソーシャルエージェント
- Authors: Hongxin Zhang, Zheyuan Zhang, Zeyuan Wang, Zunzhe Zhang, Lixing Fang, Qinhong Zhou, Chuang Gan,
- Abstract要約: オープンな3次元世界において,コミュニティ内での生涯学習が可能なエンボディ型ソーシャルエージェントであるEllaを紹介した。
Ellaの機能の中核は、情報を格納し、マルチモーダルし、取得する構造化された長期記憶システムである。
我々は、15人のエージェントが何日も社会活動に従事しているダイナミックな3Dオープンな世界で能力指向の評価を行う。
- 参考スコア(独自算出の注目度): 41.283466782695434
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Ella, an embodied social agent capable of lifelong learning within a community in a 3D open world, where agents accumulate experiences and acquire knowledge through everyday visual observations and social interactions. At the core of Ella's capabilities is a structured, long-term multimodal memory system that stores, updates, and retrieves information effectively. It consists of a name-centric semantic memory for organizing acquired knowledge and a spatiotemporal episodic memory for capturing multimodal experiences. By integrating this lifelong memory system with foundation models, Ella retrieves relevant information for decision-making, plans daily activities, builds social relationships, and evolves autonomously while coexisting with other intelligent beings in the open world. We conduct capability-oriented evaluations in a dynamic 3D open world where 15 agents engage in social activities for days and are assessed with a suite of unseen controlled evaluations. Experimental results show that Ella can influence, lead, and cooperate with other agents well to achieve goals, showcasing its ability to learn effectively through observation and social interaction. Our findings highlight the transformative potential of combining structured memory systems with foundation models for advancing embodied intelligence. More videos can be found at https://umass-embodied-agi.github.io/Ella/.
- Abstract(参考訳): 本研究では,3次元オープンな世界において,コミュニティ内での生涯学習を実現し,日常的な視覚的観察や社会的相互作用を通じて経験を蓄積し,知識を習得する,実践型ソーシャルエージェントであるEllaを紹介する。
Ellaの機能の中核は、情報を効率的に保存、更新、取得する構造化された長期マルチモーダルメモリシステムである。
獲得した知識を整理するための名前中心のセマンティックメモリと、マルチモーダル体験をキャプチャするための時空間のエピソードメモリから構成される。
この生涯記憶システムと基礎モデルを統合することで、Ellaは意思決定に関連する情報を取得し、日々の活動を計画し、社会的関係を構築し、オープン世界の他の知的存在と共存しながら自律的に進化する。
ダイナミックな3Dオープンワールドにおいて、15人のエージェントが日々の社会活動に従事し、目に見えない制御された評価スイートで評価される能力指向評価を行う。
実験の結果、エルラは他のエージェントに影響を与え、リードし、協力して目標を達成することができ、観察と社会的相互作用を通じて効果的に学習できることが示される。
本研究は,構造化メモリシステムと基礎モデルを組み合わせることで,インボディードインテリジェンスを向上するトランスフォーメーションの可能性を明らかにするものである。
さらなるビデオはhttps://umass-embodied-agi.github.io/Ella/.comで見ることができる。
関連論文リスト
- LIFELONG SOTOPIA: Evaluating Social Intelligence of Language Agents Over Lifelong Social Interactions [4.819825467587802]
本稿では,言語エージェントの総合評価を行うための新しいベンチマークLIFELONG-SOTOPIAを提案する。
私たちがテストするすべての言語モデルの目標達成と信頼性が、インタラクション全体を通じて低下していることに気付きました。
以上の結果から,生涯にわたる社会的相互作用による言語エージェントの社会的知性評価にはLIFELONG-SOTOPIAが有効であることが示唆された。
論文 参考訳(メタデータ) (2025-06-14T23:57:54Z) - From Human Memory to AI Memory: A Survey on Memory Mechanisms in the Era of LLMs [34.361000444808454]
メモリは情報をエンコードし、保存し、検索するプロセスである。
大規模言語モデル(LLM)の時代において、メモリとは、AIシステムが過去のインタラクションからの情報を保持し、リコールし、使用し、将来の応答とインタラクションを改善する能力である。
論文 参考訳(メタデータ) (2025-04-22T15:05:04Z) - SACSoN: Scalable Autonomous Control for Social Navigation [62.59274275261392]
我々は、社会的に邪魔にならないナビゲーションのための政策の訓練方法を開発した。
この反事実的摂動を最小化することにより、共有空間における人間の自然な振る舞いを変えない方法でロボットに行動を促すことができる。
屋内移動ロボットが人間の傍観者と対話する大規模なデータセットを収集する。
論文 参考訳(メタデータ) (2023-06-02T19:07:52Z) - ArK: Augmented Reality with Knowledge Interactive Emergent Ability [115.72679420999535]
基礎モデルから新しいドメインへの知識記憶の伝達を学習する無限エージェントを開発する。
私たちのアプローチの核心は、Augmented Reality with Knowledge Inference Interaction (ArK)と呼ばれる新しいメカニズムである。
我々のArKアプローチは,大規模な基礎モデルと組み合わせることで,生成された2D/3Dシーンの品質を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-05-01T17:57:01Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Flexible social inference facilitates targeted social learning when
rewards are not observable [58.762004496858836]
グループは、個人が他人の成功から学べるときにより効果的にコーディネートする。
社会的推論能力は、このギャップを埋める助けとなり、個人が他人の基本的な知識に対する信念を更新し、観察可能な行動軌跡から成功することを示唆する。
論文 参考訳(メタデータ) (2022-12-01T21:04:03Z) - Cognitive architecture aided by working-memory for self-supervised
multi-modal humans recognition [54.749127627191655]
人間パートナーを認識する能力は、パーソナライズされた長期的な人間とロボットの相互作用を構築するための重要な社会的スキルです。
ディープラーニングネットワークは最先端の結果を達成し,そのような課題に対処するための適切なツールであることが実証された。
1つの解決策は、ロボットに自己スーパービジョンで直接の感覚データから学習させることである。
論文 参考訳(メタデータ) (2021-03-16T13:50:24Z) - Learning About Objects by Learning to Interact with Them [29.51363040054068]
人間はしばしば、外部の監督をほとんど、あるいは全く行わずに自分の世界について学ぶ。
物体を発見し,その物理特性を学習する計算フレームワークを提案する。
我々のエージェントは、近距離フォトリアリスティックで物理対応のAI2-THOR環境の中に置かれると、その世界と対話し、物体について学ぶ。
論文 参考訳(メタデータ) (2020-06-16T16:47:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。