論文の概要: MAGNET: Towards Adaptive GUI Agents with Memory-Driven Knowledge Evolution
- arxiv url: http://arxiv.org/abs/2601.19199v2
- Date: Sat, 31 Jan 2026 15:17:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 15:03:50.597744
- Title: MAGNET: Towards Adaptive GUI Agents with Memory-Driven Knowledge Evolution
- Title(参考訳): MAGNET: メモリ駆動の知識進化を伴う適応型GUIエージェントを目指して
- Authors: Libo Sun, Jiwen Zhang, Siyuan Wang, Zhongyu Wei,
- Abstract要約: 大きなファンデーションモデルを利用したモバイルエージェントは、自律的なタスク実行を可能にするが、頻繁な更新によって、過去のデータでトレーニングされたエージェントが失敗する。
本稿では、メモリ駆動型適応エージェントフレームワークであるMAGNETを紹介する。
オンラインベンチマーク AndroidWorldの評価では、ベースラインよりも大幅に改善されている。
- 参考スコア(独自算出の注目度): 44.92687597179025
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile GUI agents powered by large foundation models enable autonomous task execution, but frequent updates altering UI appearance and reorganizing workflows cause agents trained on historical data to fail. Despite surface changes, functional semantics and task intents remain fundamentally stable. Building on this insight, we introduce MAGNET, a memory-driven adaptive agent framework with dual-level memory: stationary memory linking diverse visual features to stable functional semantics for robust action grounding and procedural memory capturing stable task intents across varying workflows. We propose a dynamic memory evolution mechanism that continuously refines both memories by prioritizing frequently accessed knowledge. Online benchmark AndroidWorld evaluations show substantial improvements over baselines, while offline benchmarks confirm consistent gains under distribution shifts. These results validate that leveraging stable structures across interface changes improves agent performance and generalization in evolving software environments.
- Abstract(参考訳): 大きなファンデーションモデルを利用したモバイルGUIエージェントは、自律的なタスク実行を可能にするが、UIの外観を変え、ワークフローを再編成する頻繁な更新によって、履歴データでトレーニングされたエージェントが失敗する。
表面的な変化にもかかわらず、機能的意味論とタスク意図は基本的に安定している。
この知見に基づいて、我々は、二レベルメモリを備えたメモリ駆動適応型エージェントフレームワークであるMAGNETを紹介した。
本稿では、頻繁にアクセスされる知識を優先することで、両方の記憶を継続的に洗練する動的記憶進化機構を提案する。
オンラインベンチマーク AndroidWorldの評価では、ベースラインよりも大幅に改善されている。
これらの結果から, エージェント性能の向上とソフトウェア環境の一般化が期待できる。
関連論文リスト
- Memory Retention Is Not Enough to Master Memory Tasks in Reinforcement Learning [44.94110361062394]
実世界の意思決定は、安定かつ適応性のあるメモリに依存する。
既存の強化学習ベンチマークとメモリ拡張エージェントは、主に保持に焦点を当てている。
部分的な可観測性の下で連続的なメモリ更新を明示的にテストするベンチマークを導入する。
論文 参考訳(メタデータ) (2026-01-21T15:27:23Z) - Fine-Mem: Fine-Grained Feedback Alignment for Long-Horizon Memory Management [63.48041801851891]
Fine-Memは、きめ細かいフィードバックアライメントのために設計された統一されたフレームワークである。
MemalphaとMemoryAgentBenchの実験は、Fin-Memが強いベースラインを一貫して上回ることを示した。
論文 参考訳(メタデータ) (2026-01-13T11:06:17Z) - MemEvolve: Meta-Evolution of Agent Memory Systems [66.09735157017558]
自己進化型メモリシステムは、大型言語モデル(LLM)ベースのエージェントの進化パラダイムを前例のない形で再構築している。
MemeEvolveは、エージェントの経験的知識とメモリアーキテクチャを共同で進化させるメタ進化フレームワークである。
EvolveLabは、12の代表的なメモリシステムをモジュール設計空間に蒸留する、統一された自己進化型メモリである。
論文 参考訳(メタデータ) (2025-12-21T14:26:14Z) - Evo-Memory: Benchmarking LLM Agent Test-time Learning with Self-Evolving Memory [89.65731902036669]
Evo-Memoryは、大規模言語モデル(LLM)エージェントで自己進化型メモリを評価するための、ストリーミングベンチマークとフレームワークである。
10以上の代表的なメモリモジュールを評価し、10種類の多ターンゴール指向およびシングルターン推論およびQAデータセットで評価した。
論文 参考訳(メタデータ) (2025-11-25T21:08:07Z) - Memo: Training Memory-Efficient Embodied Agents with Reinforcement Learning [53.72709564555407]
Memoは、強化学習のためのトランスフォーマーベースのアーキテクチャとトレーニングのレシピである。
トレーニング中のモデルの入力と周期的な要約トークンをインターリーブすることで、メモリの生成と検索を組み込む。
グリッドワールドメタRLベンチマークとマルチオブジェクトナビゲーションタスクにおけるMemoの有効性を,フォトリアリスティック屋内環境で実証する。
論文 参考訳(メタデータ) (2025-10-22T16:24:47Z) - SEDM: Scalable Self-Evolving Distributed Memory for Agents [23.182291416527764]
SEDMは、メモリをパッシブリポジトリからアクティブな自己最適化コンポーネントに変換する検証可能で適応的なフレームワークである。
また,SEDMは,強いメモリベースラインに比べてトークンオーバーヘッドを低減しつつ,推論精度を向上することを示した。
結果は、SEDMをオープンエンドのマルチエージェントコラボレーションのためのスケーラブルで持続可能なメモリメカニズムとして強調する。
論文 参考訳(メタデータ) (2025-09-11T14:37:37Z) - Stable Hadamard Memory: Revitalizing Memory-Augmented Agents for Reinforcement Learning [64.93848182403116]
現在のディープラーニングメモリモデルは、部分的に観察可能で長期にわたる強化学習環境で苦労している。
本稿では,強化学習エージェントのための新しい記憶モデルであるStable Hadamard Memoryを紹介する。
我々の手法は、部分的に観測可能なベンチマークに挑戦する上で、最先端のメモリベースの手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2024-10-14T03:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。