論文の概要: What Spatial Memory Must Store: Occlusion as the Test for Language-Agent Memory
- arxiv url: http://arxiv.org/abs/2606.10299v1
- Date: Tue, 09 Jun 2026 01:34:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.251025
- Title: What Spatial Memory Must Store: Occlusion as the Test for Language-Agent Memory
- Title(参考訳): 空間記憶とは何か:言語記憶のテストとしての排除
- Authors: Doeon Kwon, Junho Bang,
- Abstract要約: 言語エージェントの「メモリ・パレス」システムは、図形がテキストにできないものを追加するという直感に基づいて、各メモリを世界座標に固定する。
私たちはその直感を検証し、3つの結果を報告します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Language-agent "memory palace" systems anchor each memory to a world coordinate, on the intuition that geometry adds something text cannot. We make that intuition testable and report three results. First, the memory-palace default of folding spatial proximity into a linear blend beside recency and importance does not help and can hurt: in a pre-registered recall experiment the shipped blend fails its own frozen test (mean Delta-Hit@5 -0.0375, Wilcoxon p=0.306), sitting at a position-blind baseline, while a geometry-led weighting wins decisively (+0.3208, p<10^-15): geometry must lead recall when the query regime is spatial. Second, memory recall and visibility must be separated: recall is occlusion-blind by design (you correctly remember the next room behind a wall), while visibility is a perception predicate over stored geometry that the live system never computed. A one-line ray-versus-voxel digital differential analyzer (DDA), re-pointed from the gaze ray the agent already casts, supplies it: text and the live FoV cone both score 0.000 on 849 behind-wall targets while cone-plus-DDA reaches 0.982 (exact McNemar p<10^-6); coordinate recall separately resolves near-duplicate locations a cosine null cannot (1.000 vs 0.533, n=150). Third, the visibility predicate is confirmed live under a git-committed pre-registration (SPMEM-OCC-LIVE-v1: eight scripted worlds, automated oracle scoring, 96 behind-wall targets, false-visible 1.000->0.000, pooled exact McNemar p=2.5x10^-29), a run that surfaced and fixed a real relay anchor defect. We concede that occlusion-needs-geometry is near-tautological; the contribution is the measurement and isolation, separating what spatial memory must store from how it is read. These pilots power a frozen confirmatory study (SPMEM-ZERO-REAL-PREREG-v1); the full human-authored multi-world study with blind raters remains future work.
- Abstract(参考訳): 言語エージェントの「メモリ・パレス」システムは、図形がテキストにできないものを追加するという直感に基づいて、各メモリを世界座標に固定する。
私たちはその直感を検証し、3つの結果を報告します。
事前登録されたリコール実験では、出荷されたブレンドは自身の凍結試験(Delta-Hit@5 -0.0375, Wilcoxon p=0.306)に失敗し、位置盲点のベースラインに座る一方、幾何学的な重み付けは決定的に勝利する(+0.3208, p<10^-15)。
第2に、メモリのリコールと可視性は分離されなければならない:リコールは設計によってオクルージョン・ブラインド(壁の後ろの隣の部屋を正しく記憶する)であり、一方可視性は、ライブシステムが決して計算しなかったような記憶された幾何学上の予測である。
テキストとライブのFoVコーンは849の裏壁ターゲットで0.000点、コーンプラスDDAは0.982点に達する(McNemar p<10^-6)。
SPMEM-OCC-LIVE-v1: 8つのスクリプト化された世界、自動化されたオラクルスコア、96の裏壁の目標、偽視可能 1.000->0.000、プールされた正確なMcNemar p=2.5x10^-29、実際のリレーアンカーの欠陥を表面化し修正したラン。
我々は、オクルージョン・ネッズ・ジオメトリーがほぼ自閉症であると認識し、その貢献は測定と隔離であり、空間記憶が読み方から保存しなければならないものを切り離すことである。
これらのパイロットは凍結確認研究(SPMEM-ZERO-REAL-PREREG-v1)を推進している。
関連論文リスト
- eMEM: A Hybrid Spatio-Temporal Memory System For Embodied Agents [1.8047694351309203]
物理環境で動作するエンボディエージェントのためのハイブリッドグラフベースメモリシステムeMEMを提案する。
eMEMはこのギャップをマルチインデックスアーキテクチャ(構造化ストレージ用ITE、近傍セマンティックサーチ用hlib、空間クエリ用Rツリー)で埋める。
また,eMEM-Bench v1は,メモリ評価のためのProcTHOR-10Kシーン上で構築したベンチマークである。
論文 参考訳(メタデータ) (2026-06-02T09:22:12Z) - Robust Dreamer: Deviation-Aware Latent Gaussian Memory for Action-Controlled AR Video Generation [89.70897512515477]
アクション制御された画像対ビデオ生成は、インタラクティブな世界シミュレーションにおいて有望なパラダイムであり、各制御信号が即時視覚応答を誘発する。
長時間の自己回帰的なロールアウトに対する視覚的忠実さと3D一貫性を維持することは依然として難しい。
既存の3D認識手法は、textitLatent--RGB Cyclingからの情報損失と、textiterror-free仮説によって引き起こされるトレーニング-推論ギャップという2つの障害により、破滅的なドリフトに悩まされることが多い。
textbfRobust Dreamerという,メモリ拡張フレームワークについて紹介する。
論文 参考訳(メタデータ) (2026-05-29T05:21:33Z) - NumLeak: Public Numeric Benchmarks as Latent Labels in Foundation Models [0.0]
NumLeakは、プロダクションモデル上のAPI境界プローブとオープン因果LM上のホワイトボックス制御バリデーションを組み合わせた測定フレームワークである。
最上位のフロンティアLLMは3シードプールのピアソン・r=0.97-0.99でファマ・フレンチの過剰リターンをリコールし、5つの兄弟要素で0.15-25bps以内にとどまった。
論文 参考訳(メタデータ) (2026-05-28T12:52:49Z) - Amplifying, Not Learning: Fine-Tuned AI Text Detectors Amplify a Pretrained Direction [51.56484100374058]
テキスト検出器は、事前訓練された典型軸を増幅する。
タスク監督前の生エンコーダでは、3つのアーキテクチャでNYT-vs-HC3 AUROC 0.806/0.944/0.834を達成する。
RoBERTaベースでは、生のプロジェクションは微調整を超えるが、RoBERTaベースでは、フル微調整は、試験された流線型人口の双方で生よりも識別を小さくする。
論文 参考訳(メタデータ) (2026-05-20T19:08:38Z) - ZenBrain: A Neuroscience-Inspired 7-Layer Memory Architecture for Autonomous AI Systems [51.56484100374058]
LongMemEval-500では、ZenBrainは長いコンテキストのオラクルのバイナリ・ジャッジの精度を4.5pp以内と一致させる。
ZenBrainは7層の神経科学にインスパイアされたメモリアーキテクチャである。
論文 参考訳(メタデータ) (2026-04-26T20:39:19Z) - When to Forget: A Memory Governance Primitive [0.0]
Memory Worthはメモリ当たりの2カウンタ信号で、メモリが成功と失敗を共起する頻度を追跡する。
MW は条件付き成功確率 p+(m) = Pr[y_t = +1 | m in M_t] にほぼ確実に収束することを示す。
これは今でもメモリ管理にとって有用な操作信号であり、制御された合成環境で実証的に検証する。
論文 参考訳(メタデータ) (2026-04-13T19:54:14Z) - ImplicitMemBench: Measuring Unconscious Behavioral Adaptation in Large Language Models [60.14219417402433]
LLMエージェントの既存のメモリベンチマークは、事実の明示的なリコールを評価するが、意識的な検索なしに、経験が自動的な振る舞いになる暗黙の記憶を見落としている。
IndicitMemBenchは、非宣言的メモリの標準的な認知科学のアカウントから引き出された3つの構造を通して暗黙的メモリを評価する最初の体系的なベンチマークである。
当社の300イテムスイートでは,初動採点を備えたLearning/Priming-Interfere-Testプロトコルを統一しています。
論文 参考訳(メタデータ) (2026-04-09T10:26:32Z) - CADSmith: Multi-Agent CAD Generation with Programmatic Geometric Validation [10.21291474099901]
テキスト・トゥ・CAD生成の既存の方法は、幾何的検証のない単一パスで動作するか、次元誤差を解決できない視覚的フィードバックに頼っている。
自然言語からCadQueryを生成するマルチエージェントパイプラインであるCADSmithを提案する。
次に、2つのネスト補正ループ(実行エラーを解消する内ループ)と、プログラム的幾何的検証に基礎を置く外ループという、反復的な洗練プロセスを実行する。
論文 参考訳(メタデータ) (2026-03-27T15:23:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。