論文の概要: Experience Makes Skillful: Enabling Generalizable Medical Agent Reasoning via Self-Evolving Skill Memory
- arxiv url: http://arxiv.org/abs/2606.09365v2
- Date: Wed, 10 Jun 2026 14:46:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 14:23:44.366444
- Title: Experience Makes Skillful: Enabling Generalizable Medical Agent Reasoning via Self-Evolving Skill Memory
- Title(参考訳): 自己進化型スキルメモリによる一般化可能な医療エージェント推論の実現
- Authors: Haoran Sun, Wenjie Li, Yujie Zhang, Zekai Lin, Fanrui Zhang, Kaitao Chen, Xingqi He, Yichen Li, Mianxin Liu, Lei Liu, Yankai Jiang,
- Abstract要約: SkeMexはデプロイ後のフレームワークで、モデルの重みを更新することなく、スキルベースのメモリを通じて医療エージェントを改善する。
情報的相互作用の軌跡を、再利用可能な手続き的知識を符号化する構造化されたスキルに蒸留する。
環境フィードバックからコンテキスト依存のユーティリティを推定し、バリューアウェアな検索とリポジトリガバナンスのガイドに使用します。
- 参考スコア(独自算出の注目度): 43.487137083499704
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical agent systems are increasingly expected to support interactive clinical decision making rather than only static question answering. In such settings, effective agents must reuse prior experience across evolving cases, yet existing memory mechanisms often retain raw historical traces that are redundant, noisy, and difficult to govern. More importantly, they rarely distinguish which memories are truly useful for future reasoning. This limits their ability to accumulate compact and reliable experience for long-horizon clinical reasoning. To close this gap, we propose SkeMex, a post-deployment self-evolution framework that improves medical agents through a skill-based memory without updating model weights. SkeMex distills informative interaction trajectories into structured skills that encode reusable procedural knowledge, and organizes them into a multi-branch repository spanning general, task-specific, and action-level experience. To determine which memories should be reused and retained, SkeMex estimates context-dependent utility from environment feedback and uses it to guide value-aware retrieval and repository governance. A closed-loop ``Read--Write--Assess--Govern" lifecycle further supports continual evolution by writing new skills, updating utilities, promoting useful memories, and removing harmful entries. Experiments across diverse clinical tasks show that SkeMex consistently outperforms representative memory-based agents in both offline and online settings. It also generalizes across model backbones and supports transferable skill memory. All data and code will be released publicly.
- Abstract(参考訳): 医療エージェントシステムは、静的な質問応答だけでなく、インタラクティブな臨床的意思決定をサポートすることがますます期待されている。
このような設定では、有効なエージェントは進化するケース間で事前経験を再利用する必要があるが、既存のメモリメカニズムは、冗長でうるさい、管理が難しい、生の履歴を保持できることが多い。
さらに重要なことは、将来の推論に本当に役立つ記憶を区別することはめったにない。
これにより、長期臨床推論のためのコンパクトで信頼性の高い経験を蓄積する能力が制限される。
このギャップを埋めるために、我々は、モデル重みを更新することなく、スキルベースのメモリを通じて医療エージェントを改善する後自己進化フレームワークであるSkeMexを提案する。
SkeMexは、情報的相互作用の軌跡を、再利用可能な手続き的知識を符号化する構造化されたスキルに蒸留し、それらを一般的な、タスク固有の、アクションレベルのエクスペリエンスにまたがるマルチブランチリポジトリに整理する。
SkeMexは、どのメモリを再利用し、保持すべきかを決定するために、環境フィードバックからコンテキストに依存したユーティリティを推定し、それをバリューアウェアな検索とリポジトリガバナンスのガイドに利用する。
クローズドループ ``Read--Write--Assess--Govern" ライフサイクルは、新しいスキルを書き、ユーティリティを更新し、有用なメモリを宣伝し、有害なエントリを削除することで、継続的な進化をさらにサポートする。
さまざまな臨床タスクに対する実験では、SkeMexはオフラインとオンラインの両方で、代表的メモリベースのエージェントを一貫して上回っている。
また、モデルバックボーンをまたいで一般化し、転送可能なスキルメモリをサポートする。
すべてのデータとコードは公開されます。
関連論文リスト
- AdMem: Advanced Memory for Task-solving Agents [13.611633561917513]
大規模言語モデル(LLM)はツール使用エージェントとしての約束を示すが、知識の記憶、整理、再利用を必要とする長期的タスクには制限がある。
本稿では,短期記憶と長期記憶を組み合わせた2段階設計において,セマンティック,エピソード,手続き記憶を統合した統合的・自動記憶フレームワークを提案する。
論文 参考訳(メタデータ) (2026-06-05T00:11:57Z) - WorldMemArena: Evaluating Multimodal Agent Memory Through Action-World Interaction [72.1620416874118]
マルチモーダルな言語モデルは、長距離エージェントとしてますます多くデプロイされている。
既存のベンチマークは、静的対話上のリコールを測定し、メモリを1つのタスクの精度に分解し、キャプションに対する視覚的な観察を減らす。
マルチモーダルエージェントメモリを,観測可能な4段階ライフサイクルを持つアクションワールドインタラクションループとして定式化する。
論文 参考訳(メタデータ) (2026-05-28T04:27:20Z) - Contextual Agentic Memory is a Memo, Not True Memory [3.939241105154204]
我々は、ルックアップをメモリとして扱うことは、エージェント能力、長期学習、セキュリティの証明可能な結果を伴うカテゴリエラーであると主張する。
生体知能は, 高速海馬貯蔵と低速大脳皮質体重統合を併用することによりこの問題を解決した。
論文 参考訳(メタデータ) (2026-04-30T10:54:56Z) - Memory for Autonomous LLM Agents:Mechanisms, Evaluation, and Emerging Frontiers [0.42061757959666934]
大きな言語モデル(LLM)エージェントは、単一のコンテキストウィンドウが小さすぎて何が起きているのかをキャプチャできないような環境で、ますます運用される。
メモリはステートレステキストジェネレータを真に適応的なエージェントに変える。
この調査は、メモリがどのように設計され、実装され、現代のLCMベースのエージェントで評価されるかという構造化された説明を提供する。
論文 参考訳(メタデータ) (2026-03-08T15:08:01Z) - Memory Retention Is Not Enough to Master Memory Tasks in Reinforcement Learning [44.94110361062394]
実世界の意思決定は、安定かつ適応性のあるメモリに依存する。
既存の強化学習ベンチマークとメモリ拡張エージェントは、主に保持に焦点を当てている。
部分的な可観測性の下で連続的なメモリ更新を明示的にテストするベンチマークを導入する。
論文 参考訳(メタデータ) (2026-01-21T15:27:23Z) - Memory in the Age of AI Agents [217.9368190980982]
この研究は、現在のエージェントメモリ研究の最新の展望を提供することを目的としている。
我々は,エージェントメモリ,すなわちトークンレベル,パラメトリック,潜時メモリの3つの支配的実現を同定する。
実用的な開発を支援するため、メモリベンチマークとオープンソースフレームワークの包括的な概要をコンパイルする。
論文 参考訳(メタデータ) (2025-12-15T17:22:34Z) - MemVerse: Multimodal Memory for Lifelong Learning Agents [35.218549149012844]
我々は,モデルに依存しないプラグアンドプレイメモリフレームワークであるMemVerseを紹介した。
MemVerseは階層的検索ベースのメモリで高速パラメトリックリコールを行う。
スケーラブルで適応的なマルチモーダルインテリジェンスを実現する。
論文 参考訳(メタデータ) (2025-12-03T10:06:14Z) - Agentic Learner with Grow-and-Refine Multimodal Semantic Memory [50.81667005063605]
ViLoMemは、コンパクトなスキーマベースのメモリを構築するデュアルストリームメモリフレームワークである。
視覚的障害パターンと論理的推論エラーを符号化し、MLLMが成功し失敗した経験から学ぶことを可能にする。
論文 参考訳(メタデータ) (2025-11-26T18:55:08Z) - ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory [57.517214479414726]
ReasoningBankは、エージェントの自己判断の成功と失敗の経験から一般化可能な推論戦略を抽出するメモリフレームワークである。
テスト時には、エージェントがReasoningBankから関連する記憶を取得してそのインタラクションを知らせ、新しい学習を統合することで、時間が経つにつれてより有能になる。
本稿では,エージェントのインタラクションエクスペリエンスをスケールアップすることにより,学習プロセスの高速化と多様化を図るメモリ対応テストタイムスケーリング(MaTTS)を提案する。
論文 参考訳(メタデータ) (2025-09-29T17:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。