論文の概要: User as Engram: Internalizing Per-User Memory as Local Parametric Edits
- arxiv url: http://arxiv.org/abs/2606.19172v1
- Date: Wed, 17 Jun 2026 15:15:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.233438
- Title: User as Engram: Internalizing Per-User Memory as Local Parametric Edits
- Title(参考訳): ユーザ・アズ・エングラム: ローカルパラメトリック・エディットとしてユーザ毎のメモリを内部化する
- Authors: Bojie Li,
- Abstract要約: 現在、ほとんどのパーソナライゼーションは、自然言語のメモリファイルや検索インデックスにおいて、ユーザの事実を重みの外側に保持している。
ユーザ・アズ・エングラム(User as Engram)を提案する。エングラムモデルのハッシュキーメモリテーブルに,外科的編集としてユーザのコンテンツを格納する。
この層状設計はユーザ毎のLoRAの直接リコールと一致し、平均して5.6倍高い間接推論精度を提供する。
- 参考スコア(独自算出の注目度): 0.3951796994513004
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Personal memory in a language model is two problems: content and reasoning skill. The brain keeps the two apart (a sparse, local engram in the hippocampus for each episode, a slow neocortex for the shared skills that interpret it), so a new fact need not overwrite everything else. Most personalization today keeps a user's facts outside the weights, in a natural-language memory file or a retrieval index. When facts are written into the model instead, the standard recipe is the per-user LoRA adapter, which does the opposite of the brain, folding content and skill into one global weight delta. Writing a user's facts as a LoRA contaminates text unrelated to them; writing the same facts as local Engram rows leaves it mathematically untouched, resulting in a roughly 33,000x smaller memory footprint. We therefore propose User as Engram: store a user's content as surgical edits to the hash-keyed memory table of an Engram model, and carry the reasoning skill in one shared adapter. This layered design matches per-user LoRA's direct recall while delivering 5.6x higher indirect-reasoning accuracy on average, and never makes a single user worse at reasoning than the untouched base. The edit is a glass box: writing a fact switches on its lookup at exactly the trigger, adds the value the answer needs, leaves every other position unchanged to the last bit, and fails if written into the wrong layer. Because different users' facts land in disjoint hash slots, their edits compose: many users live in one shared table at once, stacking additively and losslessly, where a per-user LoRA, a single global weight delta, admits only one. Upon retrieval, a per-user Engram table does not grow with the population the retriever must search, so past ~100 facts it overtakes a retrieval pipeline on a 2.5x larger model.
- Abstract(参考訳): 言語モデルにおけるパーソナルメモリは、内容と推論のスキルの2つの問題である。
脳は2つの部分(各エピソードの海馬の局所的なエングラム、それを解釈する共有スキルの低速な新皮質)を分離しているため、新しい事実は他の全てを上書きする必要はない。
現在、ほとんどのパーソナライゼーションは、自然言語のメモリファイルや検索インデックスにおいて、ユーザの事実を重みの外側に保持している。
代わりに事実がモデルに書き込まれるとき、標準的なレシピはユーザ毎のLoRAアダプタで、脳の反対、コンテンツ、スキルを1つのグローバルな重量差に分割する。
ユーザの事実をLoRAとして書くと、それらと無関係なテキストが汚染され、ローカルのEngram行と同じ事実が数学的に無傷のまま残され、結果としてメモリフットプリントが約33,000倍小さくなる。
そこで我々は,ユーザ・アズ・エングラムを提案する: ユーザのコンテンツをEngramモデルのハッシュキーメモリテーブルに外科的編集として保存し,その推論スキルを1つの共有アダプタに保持する。
この階層化された設計は、ユーザ毎のLoRAの直接リコールと一致し、平均して5.6倍高い間接推論精度を実現している。
編集はガラスボックスで、トリガーのルックアップにファクトスイッチを書き、必要な値を追加し、他のすべての位置を最後のビットに変更し、間違ったレイヤに書き込むとフェールする。
多くのユーザが一度に1つの共有テーブルに住み、付加的かつ損失的に積み重ね、ユーザ毎のLoRA(グローバルな1つの重み付けデルタ)が1つしか認めない。
検索時には、ユーザ当たりのEngramテーブルは、検索者が検索しなければならない人口とともに成長しないため、過去100年ほどで2.5倍のモデルで検索パイプラインを上回っている。
関連論文リスト
- User as Code: Executable Memory for Personalized Agents [0.3951796994513004]
パーソナライズされたAIエージェントには、ユーザメモリ — ユーザが誰であるかの永続的なモデルが必要です。
ユーザメモリは実行可能でなければならない、と私たちは主張する。
ユーザ・アズ・コード(UaC)は,ユーザのエージェントのモデルが生きたソフトウェアプロジェクトであるパラダイムである。
論文 参考訳(メタデータ) (2026-06-15T13:39:41Z) - Does Engram Do Memory Retrieval in Autoregressive Image Generation? [50.31813662801864]
本研究では,Engramモジュールを2次元空間的$n$-gramハッシュ,ゲート融合,KV-cache互換インクリメンタル推論で視覚に適応させる。
ゲート・クランプ・スイープは、エングラムの経路を完全に無効にすることは破滅的であることを示している。
ドナープローブ実験により、一致した、逆数的な、あるいはランダムな同一クラスの例にハッシュ入力を交換すると、統計的に区別不能な次トーケン分布が生じることが示された。
論文 参考訳(メタデータ) (2026-05-13T08:40:46Z) - LikeBench: Evaluating Subjective Likability in LLMs for Personalization [11.75597537798083]
第三の軸であるリキスタビリティは、主観的かつユーザエクスペリエンスの中心でありながら、現在のベンチマークでは過小評価されていない、と私たちは主張する。
マルチセッション動的評価フレームワークであるLikeBenchを紹介する。
DeepSeek R1は、メモリ精度が低い(86%、17の事実/注目)が、Qwen3のメモリ精度が高い(93%、43の事実/注目)にもかかわらず、ライカビリティスコアが28%向上した。
GPT-5のようなSOTAモデルでさえ、略してうまく適応する
論文 参考訳(メタデータ) (2025-12-15T08:18:42Z) - WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models [78.22291694903659]
大規模言語モデル(LLM)は、成長を続ける世界の事実に適合し、幻覚的応答を修正するために知識更新を必要とする。
更新された知識が記憶にどこに存在するかは、モデル編集の基本的な問題である。
記憶のギャップを埋めるためにWISEを提案する。
論文 参考訳(メタデータ) (2024-05-23T16:35:52Z) - SpellMapper: A non-autoregressive neural spellchecker for ASR
customization with candidate retrieval based on n-gram mappings [76.87664008338317]
文脈スペル補正モデルは、音声認識を改善するために浅い融合に代わるものである。
ミススペルn-gramマッピングに基づく候補探索のための新しいアルゴリズムを提案する。
Spoken Wikipediaの実験では、ベースラインのASRシステムに比べて21.4%のワードエラー率の改善が見られた。
論文 参考訳(メタデータ) (2023-06-04T10:00:12Z) - MQuAKE: Assessing Knowledge Editing in Language Models via Multi-Hop Questions [75.21713251369225]
編集されたモデルが正しい解答を行うかどうかを評価するマルチホップ質問を含むベンチマークMQuAKEを提案する。
本稿では,メモリベースのアプローチであるMeLLoを提案する。これは,編集された事実に整合した回答を生成するために,言語モデルを反復的に促しながら,すべての編集された事実を外部に保存する。
論文 参考訳(メタデータ) (2023-05-24T06:48:41Z) - Graph Meets LLM: A Novel Approach to Collaborative Filtering for Robust
Conversational Understanding [20.934922599119865]
欠陥クエリは、自動音声認識(ASR)と自然言語理解(NLU)におけるユーザの曖昧さ、誤り、エラーから生じる可能性がある。
パーソナライズドクエリ書き換え(Personalized query rewriting)は、ユーザの個々の振る舞いや好みを考慮してクエリの欠陥を軽減するアプローチである。
本稿では,これまでユーザの歴史になかった新しいユーザインタラクションの書き直し作業に特に対処する「協調クエリ書き換え」手法を提案する。
論文 参考訳(メタデータ) (2023-05-23T18:15:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。