論文の概要: When to Write and When to Suppress: Route-Specialized Dual Adapters for Memory-Assisted Knowledge Editing
- arxiv url: http://arxiv.org/abs/2606.14668v2
- Date: Tue, 16 Jun 2026 14:27:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 15:01:46.714772
- Title: When to Write and When to Suppress: Route-Specialized Dual Adapters for Memory-Assisted Knowledge Editing
- Title(参考訳): メモリ支援知識編集のための経路特化デュアルアダプタ
- Authors: Baijia Zhang, Yining Huang,
- Abstract要約: 本稿では,メモリ支援環境において,参照時に編集メモリが検索され,パラメータ効率のよいアダプタがモデルのオブジェクトの嗜好を補正する機能について検討する。
本稿では、ルート特化デュアルアダプタエディタであるメソッドを導入する。関連ルータは、まず、プロンプトが編集メモリを受け取るかどうかを判断する。ルータドプロンプトは、元のオブジェクトよりも新しいオブジェクトを好むように訓練された編集アダプタを使用する。
我々は,同じメモリプロトコルと2つの7B/8Bで,1000ケースプロトコルであるcf,zsre,mquakeの評価を行った。
- 参考スコア(独自算出の注目度): 3.4559015629061194
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Knowledge editing systems must update selected facts while preserving nearby but irrelevant behavior. This paper studies this problem in a memory-assisted setting where an edit memory is retrieved at inference time and a parameter-efficient adapter corrects the model's object preference. We argue that the central design question is not only how to write an edit, but also when to suppress it. We introduce \method{}, a route-specialized dual-adapter editor. A relevance router first decides whether a prompt should receive an edit memory. Routed prompts use an edit adapter trained to prefer the new object over the original object; unrouted non-direct prompts use a separate locality adapter trained to preserve or restore the original-object preference. We evaluate \method{} on three 1,000-case protocols, \cf{}, \zsre{}, and \mquake{}, under the same memory protocol and two 7B/8B base models. On Llama-3.1-8B-Instruct, \method{} obtains the best overall probability-preference accuracy on all three benchmarks: 0.8180 on \cf{}, 0.8946 on \zsre{}, and 0.9922 on \mquake{}. The same trend holds on Qwen3-8B. Router ablations show that the relevant memory boundary differs across datasets: a lexical neural router is safest on \cf{}, while BGE embedding routing is better on \zsre{} and \mquake{}. Component and module ablations show that the gain mainly comes from separating edit injection from off-route suppression rather than from simply increasing LoRA capacity.
- Abstract(参考訳): 知識編集システムは、近くのけれども無関係な行動を保ちながら、選択した事実を更新しなければならない。
本稿では,この問題を,パラメータ効率のよいアダプタがモデルのオブジェクト嗜好を補正する,メモリアシスト方式で検討する。
中心となる設計上の問題は、編集の書き方だけでなく、いつそれを抑えるかである、と我々は主張する。
経路特化デュアルアダプタエディタである \method{} を紹介する。
関連ルータは、まず、プロンプトが編集メモリを受け取るか否かを判定する。
Routedプロンプトは、元のオブジェクトよりも新しいオブジェクトを好むように訓練された編集アダプタを使用する。
我々は,同じメモリプロトコルと2つの7B/8Bベースモデルの下で,1000ケースプロトコルである \cf{}, \zsre{}, \mquake{} に対して \method{} を評価する。
Llama-3.1-8B-インストラクタでは、\method{} は、すべてのベンチマークで 0.8180 on \cf{}, 0.8946 on \zsre{}, 0.9922 on \mquake{} である。
同じ傾向がQwen3-8Bにも見られる。
レクシカルニューラルネットワークルータは \cf{} が最も安全であり、BGE埋め込みルーティングは \zsre{} と \mquake{} の方が優れている。
コンポーネントとモジュールの短縮は、LoRAのキャパシティを単純に増やすのではなく、編集インジェクションとオフルートのコンプレッションを分離することによる利得を示している。
関連論文リスト
- Echo-Memory: A Controlled Study of Memory in Action World Models [58.77172260403133]
本研究では,行動条件付き世界モデルにおける記憶機構の制御に関する研究を行う。
既存のメモリ設計と比較するのは難しいのは、ゲインにはバックボーン、トレーニング、検索、評価の違いが絡み合っているからである。
我々はEcho-Memoryを使ってアクション・ツー・ビデオのインタフェースを修正し、生成元によって履歴が保存され読み込まれるかだけを変える。
論文 参考訳(メタデータ) (2026-06-08T17:54:10Z) - Model Routing as a Trust Problem: Route Receipts for Adaptive AI Systems [0.0]
ルーティングは、AIサービスが安価で、高速で、大規模に利用可能であることを支援する。
ルーティングがコストや品質,あるいは説明責任を変更すると,ユーザが何が起きたのかを判断できずに,信頼が損なわれる可能性がある。
本稿では、ルート受信の概念、最小限のスキーマとリアクションモデル、および選択したプラットフォームに関するドキュメントベースの調査を紹介する。
論文 参考訳(メタデータ) (2026-05-03T04:49:30Z) - HoReN: Normalized Hopfield Retrieval for Large-Scale Sequential Model Editing [12.303016850029683]
大規模言語モデルは、展開後に必然的に時代遅れになる膨大な事実知識を符号化する。
1行の作業は、ロケーション・then-edit手順を通じてベースウェイトを直接変更することで、新しい事実をインストールする。
補完ラインはベースウェイトをそのまま残し、外部メモリを通して編集をルーティングするが、ルーティングの課題に直面している。
提案するHoReNは,3つのアイデアに基づいたルーティング機能を備えたコードブックベースのエディタである。
論文 参考訳(メタデータ) (2026-05-02T15:51:31Z) - ELDER: Enhancing Lifelong Model Editing with Mixture-of-LoRA [55.697627106315004]
大規模言語モデル(LLM)は、特定の知識を効率的に更新し、事実の誤りを避けるためにモデル編集を必要とする。
従来のアプローチでは、元のパラメータを凍結し、知識更新毎に新しいパラメータを個別に割り当てることで、シーケンシャルな編集を管理する。
本稿では,データとアダプタを連続的に関連付ける新しい手法であるELDERを提案する。
論文 参考訳(メタデータ) (2024-08-19T02:27:00Z) - WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models [78.22291694903659]
大規模言語モデル(LLM)は、成長を続ける世界の事実に適合し、幻覚的応答を修正するために知識更新を必要とする。
更新された知識が記憶にどこに存在するかは、モデル編集の基本的な問題である。
記憶のギャップを埋めるためにWISEを提案する。
論文 参考訳(メタデータ) (2024-05-23T16:35:52Z) - StableMoE: Stable Routing Strategy for Mixture of Experts [109.0602120199226]
Mixture-of-Experts (MoE)技術は、安価な計算オーバーヘッドでトランスフォーマーのモデルサイズをスケールアップすることができる。
本稿では、ルーティング変動問題に対処する2つのトレーニング段階を持つStableMoEを提案する。
その結果,StableMoEは収束速度と性能の両面で既存のMoE法よりも優れていた。
論文 参考訳(メタデータ) (2022-04-18T16:48:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。