論文の概要: MEMRES: A Memory-Augmented Resolver with Confidence Cascade for Agentic Python Dependency Resolution
- arxiv url: http://arxiv.org/abs/2604.16941v1
- Date: Sat, 18 Apr 2026 09:52:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.251116
- Title: MEMRES: A Memory-Augmented Resolver with Confidence Cascade for Agentic Python Dependency Resolution
- Title(参考訳): MEMRES: エージェントPython依存解決のための信頼性カスケードを備えたメモリ拡張リゾルバ
- Authors: Dao Sy Duy Minh, Tran Chi Nguyen, Trung Kiet Huynh, Pham Phu Hoa, Nguyen Lam Phu Quy, Vu Nguyen,
- Abstract要約: MEMRESはPythonの依存性解決のためのエージェントシステムである。
Gemma-2 9B (10 GB VRAM) を使用したHG2.9Kでは、MEMRESは2890スニペットの2503スニペットを解決している。
- 参考スコア(独自算出の注目度): 1.6376585841690154
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present MEMRES, an agentic system for Python dependency resolution that introduces a multi-level confidence cascade where the LLM serves as the last resort. Our system combines: (1) a Self-Evolving Memory that accumulates reusable resolution patterns via tips and shortcuts; (2) an Error Pattern Knowledge Base with 200+ curated import-to-package mappings; (3) a Semantic Import Analyzer; and (4) a Python 2 heuristic detector resolving the largest failure category. On HG2.9K using Gemma-2 9B (10 GB VRAM). MEMRES resolves 2503 of 2890 (86.6%, 10-run average) snippets, combining intra-session memory with our confidence cascade for the remainder. This already exceeds PLLM's 54.7% overall success rate by a wide margin.
- Abstract(参考訳): 我々は,LLMが最後の手段として機能するマルチレベル信頼性カスケードを導入したPython依存解決のためのエージェントシステムMEMRESを提案する。
本システムでは,(1)チップやショートカットを通じて再利用可能な解決パターンを蓄積する自己進化メモリ,(2)200以上のキュレートされたインポート・パッケージマッピングを備えたエラーパターン知識ベース,(3)セマンティックインポートアナライザ,(4)最大の障害カテゴリを解決するPython 2ヒューリスティック検出器を組み合わせる。
Gemma-2 9B (10GB VRAM) を使用したHG2.9K。
MEMRESは2890(86.6%、平均10ラン)スニペットの2503を解決し、セッション内メモリと残りの信頼性カスケードを組み合わせた。
これはPLLMの総成功率54.7%をはるかに上回っている。
関連論文リスト
- MemEvoBench: Benchmarking Memory MisEvolution in LLM Agents [78.95081012334116]
永続メモリを持つ大規模言語モデル(LLM)は、相互作用の継続性とパーソナライゼーションを高めるが、新たな安全性リスクをもたらす。
汚染または偏りのある記憶蓄積は、異常な作用を引き起こす可能性がある。
MemeEvoBenchは、LLMエージェントのメモリ安全性を評価する最初のベンチマークである。
論文 参考訳(メタデータ) (2026-04-17T07:29:52Z) - From Translation to Superset: Benchmark-Driven Evolution of a Production AI Agent from Rust to Python [2.7324157162184157]
本稿では,大規模な言語モデルでRustの目的をPythonに翻訳するLLM支援型連続コード翻訳手法を提案する。
我々は、Pythonポートが59/80 SWE-bench検証タスク(73.8%)をRustの56/80(70.0%)に対して解決し、現実世界のエージェントタスクでほぼ同等であることを実証した。
評価の結果,APIレイテンシが支配的な LLM ベースのエージェントでは,Python の表現性が 15.9 倍のコード削減を実現している。
論文 参考訳(メタデータ) (2026-04-13T14:21:44Z) - Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval [59.295767860331004]
RF-Memは、親しみやすい不確実性誘導デュアルパスメモリレトリバーである。
それは、人間のようなデュアルプロセス認識をレトリバーに埋め込む。
一定の予算とレイテンシの制約の下で、ワンショット検索とフルコンテキスト推論を一貫して上回る。
論文 参考訳(メタデータ) (2026-03-10T06:31:44Z) - MemCtrl: Using MLLMs as Active Memory Controllers on Embodied Agents [53.44122827359892]
本稿では,Multimodal Large Language Models (MLLM) を用いたメモリのオンラインプルーニングフレームワークであるMemCtrlを提案する。
拡張MLLMは平均で16%、特定の命令サブセットで20%以上改善されている。
論文 参考訳(メタデータ) (2026-01-28T18:31:17Z) - Many Hands Make Light Work: An LLM-based Multi-Agent System for Detecting Malicious PyPI Packages [3.7667883869699597]
PyPIのようなオープンソースリポジトリの悪意のあるコードは、ソフトウェアサプライチェーンに対する脅威が増大している。
本稿では,悪質なPyPIパッケージを検出するために協調言語モデルを用いたマルチエージェントシステムであるLAMPSを提案する。
論文 参考訳(メタデータ) (2026-01-17T19:43:22Z) - Agentic Learner with Grow-and-Refine Multimodal Semantic Memory [50.81667005063605]
ViLoMemは、コンパクトなスキーマベースのメモリを構築するデュアルストリームメモリフレームワークである。
視覚的障害パターンと論理的推論エラーを符号化し、MLLMが成功し失敗した経験から学ぶことを可能にする。
論文 参考訳(メタデータ) (2025-11-26T18:55:08Z) - Where LLM Agents Fail and How They can Learn From Failures [62.196870049524364]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。
単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。
現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。
AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文 参考訳(メタデータ) (2025-09-29T18:20:27Z) - MemGuide: Intent-Driven Memory Selection for Goal-Oriented Multi-Session LLM Agents [46.21840714172862]
インテント駆動型メモリ選択のための2段階フレームワークであるMemGuideを紹介する。
MemGuideは、現在の対話コンテキストとメモリバンク内の格納されたインテント記述とを一致させる。
Missing-Aligned Guided Filteringでは、チェーンオブソートスロット推論器を使用して未充填スロットを列挙し、微調整のLLaMA-8Bフィルタを使用して検索したユニットを再ランクする。
論文 参考訳(メタデータ) (2025-05-26T17:10:43Z) - The Last Dependency Crusade: Solving Python Dependency Conflicts with LLMs [10.800983456810165]
本稿では,Pythonプログラムの依存性問題を自動的に修復するLarge Language Models (LLMs) について検討する。
本稿では,新しい検索拡張世代 (RAG) アプローチであるHGM (plum) を提案する。
論文 参考訳(メタデータ) (2025-01-27T16:45:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。