論文の概要: Stateless Decision Memory for Enterprise AI Agents
- arxiv url: http://arxiv.org/abs/2604.20158v1
- Date: Wed, 22 Apr 2026 03:51:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.957558
- Title: Stateless Decision Memory for Enterprise AI Agents
- Title(参考訳): エンタープライズAIエージェントのためのステートレス決定メモリ
- Authors: Vasundra Srinivasan,
- Abstract要約: 規制領域における長期水平決定エージェントは、検索強化パイプラインによって支配される。
規制されたデプロイメントは、4つのシステムプロパティのロードバランシングです。
本稿では,DPM(Deterministic Projection Memory)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Enterprise deployment of long-horizon decision agents in regulated domains (underwriting, claims adjudication, tax examination) is dominated by retrieval-augmented pipelines despite a decade of increasingly sophisticated stateful memory architectures. We argue this reflects a hidden requirement: regulated deployment is load-bearing on four systems properties (deterministic replay, auditable rationale, multi-tenant isolation, statelessness for horizontal scale), and stateful architectures violate them by construction. We propose Deterministic Projection Memory (DPM): an append-only event log plus one task-conditioned projection at decision time. On ten regulated decisioning cases at three memory budgets, DPM matches summarization-based memory at generous budgets and substantially outperforms it when the budget binds: at a 20x compression ratio, DPM improves factual precision by +0.52 (Cohen's h=1.17, p=0.0014) and reasoning coherence by +0.53 (h=1.13, p=0.0034), paired permutation, n=10. DPM is additionally 7-15x faster at binding budgets, making one LLM call at decision time instead of N. A determinism study of 10 replays per case at temperature zero shows both architectures inherit residual API-level nondeterminism, but the asymmetry is structural: DPM exposes one nondeterministic call; summarization exposes N compounding calls. The audit surface follows the same one-versus-N pattern: DPM logs two LLM calls per decision while summarization logs 83-97 on LongHorizon-Bench. We conclude with TAMS, a practitioner heuristic for architecture selection, and a failure analysis of stateful memory under enterprise operating conditions. The contribution is the argument that statelessness is the load-bearing property explaining enterprise's preference for weaker but replayable retrieval pipelines, and that DPM demonstrates this property is attainable without the decisioning penalty retrieval pays.
- Abstract(参考訳): 規制領域における長期的意思決定エージェントの企業展開(引受、判断、課税審査)は、より洗練されたステートフルなメモリアーキテクチャの10年間にもかかわらず、検索強化パイプラインによって支配されている。
規制されたデプロイメントは、4つのシステム特性(決定論的リプレイ、監査可能な合理性、マルチテナント分離、水平スケールのステートレス性)に負荷がかかる。
本稿では,DPM(Deterministic Projection Memory)を提案する。
20倍の圧縮比で、DPMは事実精度を+0.52(コーエンのh=1.17, p=0.0014)改善し、コヒーレンスを+0.53(h=1.13, p=0.0034)、ペア置換を+0.53(h=1.13, p=0.0034)改善する。
DPMは結合予算で7~15倍高速で、Nの代わりに1回のLCM呼び出しを行う。 温度ゼロでのケース毎の10回のリプレイに関する決定論的研究は、両方のアーキテクチャが残留するAPIレベルの非決定論を継承することを示しているが、非対称性は構造的である: DPMは1つの非決定論的な呼び出しを露呈し、要約はNの合成呼び出しを露呈する。
DPMは意思決定毎に2つのLLMコールをログし、LongHorizon-Benchの要約ログは83-97である。
我々は,アーキテクチャ選択の実践的ヒューリスティックであるTAMSと,企業運用条件下でのステートフルメモリの障害解析を結論付けている。
コントリビューションは、ステートレスは、企業がより弱いが再生可能な検索パイプラインを好むことを説明するロードベアリングプロパティであり、DPMは、決定的なペナルティ検索報酬なしでこのプロパティが達成可能であることを証明している。
関連論文リスト
- IMPACT-CYCLE: A Contract-Based Multi-Agent System for Claim-Level Supervisory Correction of Long-Video Semantic Memory [73.22944697933603]
既存のパイプラインは不透明でエンドツーエンドの出力を生成し、検査の中間状態は公開しない。
IMPACT-Cycleは,マルチモーダル反復クレームレベルのメンテナンスとして,長時間ビデオ理解を再構築するマルチエージェントシステムである。
論文 参考訳(メタデータ) (2026-04-22T03:03:33Z) - Four-Axis Decision Alignment for Long-Horizon Enterprise AI Agents [0.0]
長期のエンタープライズエージェントは、失われた記憶、多段階の推論、および規制の制約の下で高い評価を下す。
長距離決定行動は、4つの軸に分解され、それぞれ独立に測定可能で、フェール可能となる。
論文 参考訳(メタデータ) (2026-04-21T13:37:19Z) - When to Forget: A Memory Governance Primitive [0.0]
Memory Worthはメモリ当たりの2カウンタ信号で、メモリが成功と失敗を共起する頻度を追跡する。
MW は条件付き成功確率 p+(m) = Pr[y_t = +1 | m in M_t] にほぼ確実に収束することを示す。
これは今でもメモリ管理にとって有用な操作信号であり、制御された合成環境で実証的に検証する。
論文 参考訳(メタデータ) (2026-04-13T19:54:14Z) - Cognitive Friction: A Decision-Theoretic Framework for Bounded Deliberation in Tool-Using Agents [0.0]
制約のないツール使用エージェントは、どの情報ソースをクエリして実行するかを決めなければなりません。
本稿では,これらの障害モードを認知的摩擦によって形式化する決定論的枠組みであるTCAを提案する。
我々は,TCAを2つの制御された環境において,停止品質,混雑時の行動選択,時間的緊急性の分離を図った。
論文 参考訳(メタデータ) (2026-03-31T17:30:25Z) - Adversarial Intent is a Latent Variable: Stateful Trust Inference for Securing Multimodal Agentic RAG [5.4716896485317195]
マルチモーダルエージェントRAGに対する現在のステートレスディフェンスは、悪意のあるセマンティクスを配布する敵の戦略を検出するのに失敗する。
MMA-RAGTは,MTA (Modular Trust Agent) が管理する推定時制御フレームワークで,ほぼ信頼状態を維持している。
論文 参考訳(メタデータ) (2026-02-24T23:52:27Z) - CLAUSE: Agentic Neuro-Symbolic Knowledge Graph Reasoning via Dynamic Learnable Context Engineering [47.77119771502664]
CLAUSEは,文脈構築を知識グラフ上の逐次決定プロセスとして扱うエージェント型3エージェントニューロシンボリックフレームワークである。
CLAUSEは提案したLagrangian-Constrained Multi-Agent Proximal Policy Optimization (LC-MAPPO)アルゴリズムを用いて、サブグラフアーキテクト、パスナビゲータ、コンテキストキュレーターの3つのエージェントを調整する。
HotpotQA、MetaQA、FactKG全体では、CLAUSEはより高いEM@1を得られると同時に、トークン予算が等しく低い場合のサブグラフの成長とエンドツーエンドのレイテンシを低減する。
論文 参考訳(メタデータ) (2025-09-25T11:43:08Z) - Memory in Large Language Models: Mechanisms, Evaluation and Evolution [8.158439933515131]
我々は,4つの分類法(パラメトリック,文脈,外部,手続き/エピソード)とメモリ四倍法(ロケーション,永続性,書き込み/アクセスパス,制御性)を提案する。
DMM Gov: DAPT/TAPT, PEFT, モデル編集(ROME, MEND, MEMIT, SERAC)、RAGをコーディネートして監査可能なループを形成する。
これにより、再現可能で、同等で、統制可能な、研究と展開のための座標系が得られる。
論文 参考訳(メタデータ) (2025-09-23T10:06:58Z) - Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models [86.88657425848547]
大型推論モデル(LRMs)はすでに長い連鎖推論のための潜在能力を持っている。
我々は、自動生成の自己検証タスクを使用して、モデルに推論、帰納、誘拐の3つのメタ能力を持たせることを明確にした。
我々の3つのステージ・パイプラインの個別アライメント、パラメータ空間のマージ、ドメイン固有の強化学習は、命令調整ベースラインと比較して10%以上のパフォーマンス向上を実現します。
論文 参考訳(メタデータ) (2025-05-15T17:58:33Z) - Acting in Delayed Environments with Non-Stationary Markov Policies [57.52103323209643]
本稿では,MDPにおける学習と計画のためのフレームワークについて紹介する。
実行が遅れると、元の状態空間における決定論的マルコフポリシーは最大報酬を得るのに十分であるが、非定常である必要があることを証明します。
我々は、状態拡張に頼らずに遅延実行タスクを解く非定常Q学習スタイルのモデルベースアルゴリズムを考案した。
論文 参考訳(メタデータ) (2021-01-28T13:35:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。