論文の概要: Entity-Collision: A Stratified Protocol for Attributing Retrieval Lift in Agent Memory
- arxiv url: http://arxiv.org/abs/2605.29630v1
- Date: Thu, 28 May 2026 09:02:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.092331
- Title: Entity-Collision: A Stratified Protocol for Attributing Retrieval Lift in Agent Memory
- Title(参考訳): Entity-Collision: A Stratified Protocol for Attributing Retrieval Lift in Agent Memory
- Authors: Youwang Deng,
- Abstract要約: エンドツーエンドのエージェント-メモリベンチマークでは、レトリバー毎に単一の hit@k が報告されている。
本稿では,BM25フロアを構造的に固定するシステムに依存しないプロトコルであるエンティティ・コリジョンを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end agent-memory benchmarks report a single hit@k per retriever, confounding lexical leakage (uncontrolled query/gold/distractor entity overlap) with tag-mixing (preferences, services, tools averaged together). We propose entity-collision, a system-agnostic protocol that pins the BM25 floor by construction -- every distractor shares the answer's entity tokens -- and stratifies queries by discriminator tag, so any lift over BM25 is attributable to the embedder. Applied to an open-source agent-memory testbed across 5 tags x 3 embedders x 5 collision degrees with paired-bootstrap 95% CIs, the protocol reveals a two-axis pattern: a 256-d hash trigram helps only on closed-vocabulary lexical tags at deep collision; MiniLM-384 dominates both axes; and a 2.7x-parameter BGE-large does not uniformly improve on MiniLM -- it wins on intent-style queries but loses on lexical ones. Encoder capacity alone is not the binding constraint. The synthetic intent-tag null replicates on LongMemEval (n=500) as a single-session-preference recall cliff. Adaptive vector-weight routing on LoCoMo is a measured null: 11.7pp of oracle headroom exists, but no signal we tested recovers it. All 26 result tables and 37 reproduce scripts are version-controlled and verified by a public registry; the protocol is exercised on a deterministically governed memory testbed (event-sourced decision log, DAG-state-machine schema lifecycle) so every reported CI is reproducible byte-for-byte from the ingest stream.
- Abstract(参考訳): エンドツーエンドのエージェント-メモリベンチマークでは、レトリバー毎に単一の hit@k が報告され、タグミキシング(参照、サービス、ツールの平均化)と語彙リーク(制御されていないクエリ/ゴールド/ディストラクタエンティティの重複)が混在している。
我々は、BM25フロアを構築によってピン留めするシステムに依存しないプロトコルであるエンティティコリジョンを提案し、各インタラプタは、回答のエンティティトークンを共有し、識別器タグによってクエリを階層化する。
256-dのハッシュトリグラムは、深い衝突時にクローズドボキャブラリの語彙タグのみを支援する。MiniLM-384は両方の軸を支配、BGE-largeは2.7xのパラメータでMiniLMを均一に改善しない。
エンコーダの容量だけではバインディングの制約ではない。
合成インテントタグヌルは、LongMemEval (n=500) 上でシングルセッション参照リコール崖として複製される。
LoCoMo上の適応的ベクトルウェイトルーティングは、測定されたヌルである:1.7ppのオラクルヘッドルームが存在するが、テストした信号では回復しない。
プロトコルは決定論的に管理されたメモリテストベッド(イベントソース決定ログ、DAG-ステートマシンスキーマライフサイクル)で実行され、報告されたすべてのCIは、取り込みストリームからバイト単位で再現可能である。
関連論文リスト
- Skill-as-Pseudocode: Refactoring Skill Libraries to Pseudocode for LLM Agents [50.78646963535282]
Skill-as-Pseudocode (SaP) はマークダウンスキルライブラリの型付き擬似コードへの自動変換である。
1つ以上のスキルから引き出された類似の手続きパスのクラスタごとに、SaPは型付きコントラクトを抽出し、それを4チェック決定性検証器を通じてフィルタリングする。
プロモートされた契約は、復元された具体的なアクションテンプレートと共に書き直されたスキルスケルトンにインライン化され、エージェントは2つの補完的な信号を与える。
論文 参考訳(メタデータ) (2026-05-27T04:48:40Z) - CommitDistill: A Lightweight Knowledge-Centric Memory Layer for Software Repositories [0.5872014229110213]
ソフトウェアは、コミットメッセージ、プルリクエストの議論、スレッド発行に大量の構造化されていない知識を蓄積します。
エージェントのタイプメモリアーキテクチャ(MemGPT、生成エージェント、YangらのPlugMemモジュール)に関する最近の研究は、エージェントメモリは生の対話テキストではなく、蒸留された型付き知識であるべきだと主張している。
私たちは、決定論的、依存性なし、ローカルのみ、埋め込みなしという制約のある体制の下で、ソフトウェアリポジトリ自身のgit履歴にそのスタンスを適用します。
論文 参考訳(メタデータ) (2026-05-18T12:14:28Z) - Committed SAE-Feature Traces for Audited-Session Substitution Detection in Hosted LLMs [2.6382975801439836]
ホスト型LLMプロバイダにはサイレント代替インセンティブがあり、より強力なモデルを宣伝し、より安価な応答を提供する。
このギャップを埋めるコミットオープンプロトコルを提案する。
プロトコルを3つのバックボーン(Qwen3-1.7B、Gemma-2-2B、およびGemma-2-9Bへの4.5倍スケールアップ)でインスタンス化する。
論文 参考訳(メタデータ) (2026-04-20T12:34:56Z) - WISV: Wireless-Informed Semantic Verification for Distributed Speculative Decoding in Device-Edge LLM Inference [56.297697169678095]
WISV(Wireless-Informed Semantic Verification)は、分散投機的復号化フレームワークである。
WISVは最大60.8%の許容長の増加、37.3%の対話ラウンドの削減、31.4%のエンドツーエンドレイテンシの改善を実現している。
NVIDIA Jetson AGX OrinとA40搭載サーバからなるハードウェアテストベッド上でWISVを検証する。
論文 参考訳(メタデータ) (2026-04-20T01:29:56Z) - Graduated Trust Gating for IoT Location Verification: Trading Off Detection and Proof Escalation [0.0]
既存のスプーフィング検出器はバイナリな決定を出力し、システム設計者は高い偽陰性と高い偽受容率を選択せざるを得ない。
本稿では,複数信号の整合性スコアを算出し,それを3つのアクション(ProCEED,STEP-UP,DENY)にマップする信頼ゲートを提案する。
セッションラッチ機構は、ひとつの不審な修正がセッション全体をブロックすることを保証する。
論文 参考訳(メタデータ) (2026-04-04T23:42:56Z) - ML Defender (aRGus NDR): An Open-Source Embedded ML NIDS for Botnet and Anomalous Traffic Detection in Resource-Constrained Organizations [0.0]
本稿では,C++20で構築された,150-200 USDのコモディティハードウェア上にデプロイ可能なオープンソースのネットワーク侵入検知システムを提案する。
ML Defenderは、eBPF/XDPパケットキャプチャ、ZeroMQトランスポート、Protocol Buffersシリアライゼーションの6成分パイプラインを実装している。
Ransomware Threat Winsポリシーは、ML推論を用いて両方のスコアの最大演算を選択し、偽陽性を抑える。
論文 参考訳(メタデータ) (2026-04-03T05:20:13Z) - Label-Free Cross-Task LoRA Merging with Null-Space Compression [50.63908869296697]
我々は,ラベルフリーで出力に依存しない手法であるNull-Space Compression (NSC) Mergingを紹介した。
NSCは、従来のメソッドがタスクのサブセットに収まるバランスの取れたゲインを持つ20の異種視覚タスクに対して、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-03-27T11:34:41Z) - AIP: Agent Identity Protocol for Verifiable Delegation Across MCP and A2A [0.0]
IBCT(Invocation-Bound Capability Tokens)は、ID、認可、証明のバインディングを単一の追加専用トークンチェーンに融合する。
完全な言語間の相互運用性を備えたPythonとRustのリファレンス実装を提供しています。
論文 参考訳(メタデータ) (2026-03-25T19:45:37Z) - FuseSampleAgg: Fused Neighbor Sampling and Aggregation for Mini-batch GNNs [51.56484100374058]
FuseSampleAggは、隣人の平均アグリゲーションをGraphSAGEの1つのパスにフューズし、サンプリングする。
Operatorは決定論的であり、標準のPyTorchと統合され、CSVログからすべてのテーブルとフィギュアを再現するスクリプトが同梱されている。
論文 参考訳(メタデータ) (2025-11-17T17:57:18Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。