論文の概要: What Must Generalist Agents Remember?
- arxiv url: http://arxiv.org/abs/2606.18746v1
- Date: Wed, 17 Jun 2026 06:46:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.036021
- Title: What Must Generalist Agents Remember?
- Title(参考訳): ジェネラリストのエージェントって何?
- Authors: Khurram Yamin, Namrata Deka, Maitreyi Swaroop, Albert Ting, Jeff Schneider, Bryan Wilder,
- Abstract要約: 本稿では,複数の環境や目標に対してほぼ最適に振る舞うために,ジェネラリストエージェントがメモリに格納しなければならないものを公式に記述する。
これは、2つのドメインが観測上のボトルネックを共有しているが、互換性のない最適動作を必要とする場合、任意の一様で最適に近いポリシーは、そのボトルネックにおいて異なるメモリ分布を誘導する必要があることを示している。
さらに、エージェントのメモリが関連する目標の値を推定するのに十分な情報を持っている場合、エージェントの局所遷移ダイナミクスを概ね再構築するためにメモリを使用することができることを示す。
- 参考スコア(独自算出の注目度): 15.799667725892922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper develops a formal account of what generalist agents must store in memory in order to act near-optimally across multiple environments and goals. It shows that when two domains share an observational bottleneck but require incompatible optimal actions, any uniformly near-optimal policy must induce distinct memory distributions at that bottleneck. The result yields a separation theorem: sufficiently successful agents cannot rely only on current state observations, but must preserve domain-relevant information in memory. The paper further shows that if an agent's memory contains enough information to estimate values for related goals, then that memory can be used to approximately reconstruct the agent's local transition dynamics. Together, these results characterize memory as the substrate that supports domain disambiguation, transition-model reconstruction, and planning for generalist agents.
- Abstract(参考訳): 本稿では,複数の環境や目標に対してほぼ最適に振る舞うために,ジェネラリストエージェントがメモリに格納しなければならないものを公式に記述する。
これは、2つのドメインが観測上のボトルネックを共有しているが、互換性のない最適動作を必要とする場合、任意の一様で最適に近いポリシーは、そのボトルネックにおいて異なるメモリ分布を誘導する必要があることを示している。
十分に成功したエージェントは現在の状態の観測にのみ依存することはできないが、メモリ内のドメイン関連情報を保存しなければならない。
さらに、エージェントのメモリが関連する目標の値を推定するのに十分な情報を持っている場合、エージェントの局所遷移ダイナミクスを概ね再構築するためにメモリを使用することができることを示す。
これらの結果は、メモリをドメインの曖昧さ、トランジションモデル再構築、ジェネラリストエージェントの計画をサポートする基質として特徴付ける。
関連論文リスト
- Rethinking Memory as Continuously Evolving Connectivity [63.58181883607843]
既存のメモリ拡張LDMエージェントは、メモリを事前定義された表現と固定された検索パイプラインを備えた静的リポジトリとして扱う。
メモリをヘテロジニアスなグラフとしてモデル化し,そのトポロジを3段階にわたって段階的に洗練する,コネクティビティ進化型メモリフレームワークであるFluxMemを提案する。
LoCoMo、Mind2Web、GAIAなど、根本的に異なる3つのベンチマークにおいて、FluxMemは一貫した最先端のパフォーマンスを実現し、複雑なエージェント環境において強力な適応と一般化を示す。
論文 参考訳(メタデータ) (2026-05-27T17:35:34Z) - Memory Transfer Learning: How Memories are Transferred Across Domains in Coding Agents [56.078070829341534]
メモリベースの自己進化は、コーディングエージェントにとって有望なパラダイムとして登場した。
ヘテロジニアスドメインからの統一メモリプールを利用して、textbfMemory Transfer Learning (MTL) について検討する。
論文 参考訳(メタデータ) (2026-04-15T15:50:29Z) - MemoryArena: Benchmarking Agent Memory in Interdependent Multi-Session Agentic Tasks [55.145729491377374]
メモリを持つエージェントの既存の評価は、通常、単独で記憶と行動を評価する。
マルチセッションメモリ-エージェント環境ループにおけるエージェントメモリのベンチマークのための統合評価ジムであるMemoryArenaを紹介する。
MemoryArenaは、Webナビゲーション、優先制約付き計画、プログレッシブ情報検索、シーケンシャルなフォーマルな推論を含む評価をサポートする。
論文 参考訳(メタデータ) (2026-02-18T09:49:14Z) - Fine-Mem: Fine-Grained Feedback Alignment for Long-Horizon Memory Management [63.48041801851891]
Fine-Memは、きめ細かいフィードバックアライメントのために設計された統一されたフレームワークである。
MemalphaとMemoryAgentBenchの実験は、Fin-Memが強いベースラインを一貫して上回ることを示した。
論文 参考訳(メタデータ) (2026-01-13T11:06:17Z) - Memory in the Age of AI Agents [217.9368190980982]
この研究は、現在のエージェントメモリ研究の最新の展望を提供することを目的としている。
我々は,エージェントメモリ,すなわちトークンレベル,パラメトリック,潜時メモリの3つの支配的実現を同定する。
実用的な開発を支援するため、メモリベンチマークとオープンソースフレームワークの包括的な概要をコンパイルする。
論文 参考訳(メタデータ) (2025-12-15T17:22:34Z) - SEDM: Scalable Self-Evolving Distributed Memory for Agents [23.182291416527764]
SEDMは、メモリをパッシブリポジトリからアクティブな自己最適化コンポーネントに変換する検証可能で適応的なフレームワークである。
また,SEDMは,強いメモリベースラインに比べてトークンオーバーヘッドを低減しつつ,推論精度を向上することを示した。
結果は、SEDMをオープンエンドのマルチエージェントコラボレーションのためのスケーラブルで持続可能なメモリメカニズムとして強調する。
論文 参考訳(メタデータ) (2025-09-11T14:37:37Z) - Unraveling the Complexity of Memory in RL Agents: an Approach for Classification and Evaluation [39.69790911626182]
強化学習領域(RL)における多数のタスクにおいて、エージェントへのメモリの取り込みが不可欠である
メモリ」という用語は幅広い概念を包含しており、エージェントのメモリを検証するための統一的な方法論が欠如していることと相まって、エージェントのメモリ能力に関する誤った判断につながる。
本稿では,エージェントメモリタイプを正確に定義することで,RLにおけるメモリ概念の合理化を目指す。
論文 参考訳(メタデータ) (2024-12-09T14:34:31Z) - A Cognitive Architecture for Machine Consciousness and Artificial Superintelligence: Thought Is Structured by the Iterative Updating of Working Memory [0.0]
本稿では、コンピュータ内での人間的な思考プロセスのシミュレートのための分析フレームワークを提供する。
注意と記憶がどのように構造化され、更新され、思考ストリームへの連想的な追加を探すために利用されるかを記述する。
論文 参考訳(メタデータ) (2022-03-29T22:28:30Z) - Kanerva++: extending The Kanerva Machine with differentiable, locally
block allocated latent memory [75.65949969000596]
エピソディックメモリとセマンティックメモリは、人間のメモリモデルの重要なコンポーネントです。
我々は、エピソードメモリとセマンティックメモリのギャップを埋める新しい原理ベイズメモリ割り当てスキームを開発しました。
この割り当て方式がメモリ条件画像生成の性能を向上させることを実証する。
論文 参考訳(メタデータ) (2021-02-20T18:40:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。