論文の概要: The Labyrinth and the Thread: Rethinking Regularizations in Sequential Knowledge Editing for Large Language Models
- arxiv url: http://arxiv.org/abs/2605.26670v1
- Date: Tue, 26 May 2026 08:07:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.742623
- Title: The Labyrinth and the Thread: Rethinking Regularizations in Sequential Knowledge Editing for Large Language Models
- Title(参考訳): ラビリンスとスレッド:大規模言語モデルのための逐次知識編集における正規化の再考
- Authors: Zheng Wang, Kaixuan Zhang, Wanfang Chen, Jingwen Zhang, Xiaonan Lu,
- Abstract要約: 我々はまずAlphaEditの実証的な成功を分析し、厳密な最適化分析により、1回と逐次編集の形式的等価性を確立する。
信頼性の高いシーケンシャルアップデートには,多くの一般的な正規化戦略が不要であることを実証的に確認する。
私たちの研究は、Ariadne氏のスレッドにシーケンシャルな編集のラビリンスを通し、よりシンプルで、より解釈可能で、信頼性の高い知識更新への道をチャート化します。
- 参考スコア(独自算出の注目度): 15.376868559569623
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Sequential editing of structured knowledge in large language models allows targeted factual updates without retraining, yet existing methods often rely on complex regularization or constraint mechanisms whose necessity remains unclear. In this work, we systematically investigate the mechanisms underlying effective and stable sequential editing. Specifically, we first analyze the empirical success of AlphaEdit and establish, via a rigorous optimization analysis, the formal equivalence between one-time and sequential editing. Building on this insight, we generalize the equivalence to a broader class of editing objectives, demonstrating that stability emerges naturally from properly accounting for accumulated editing constraints, rather than from specialized regularization or null-space operations. We empirically confirm that many commonly used regularization strategies are unnecessary for reliable sequential updates. Furthermore, we extend our framework to handle conflicting edits, ensuring robust and consistent behavior under contradictory updates. Ultimately, our work provides Ariadne's thread through the labyrinth of sequential editing, charting a path toward simpler, more interpretable, and dependable knowledge updates. Our code is available at https://github.com/Wangzzzzzzzz/OTE-SE-Alignment.
- Abstract(参考訳): 大規模言語モデルにおける構造化知識の逐次的な編集は、意図した事実の更新を可能にするが、既存の手法は、必要が不明な複雑な正規化や制約機構に依存していることが多い。
本研究では,有効かつ安定した逐次編集のメカニズムを体系的に検討する。
具体的には、まずAlphaEditの実証的な成功を分析し、厳密な最適化分析により、1回とシーケンシャルな編集の形式的等価性を確立する。
この知見に基づいて、我々はより広範な編集目標のクラスに同値性を一般化し、安定性が特別な正規化やヌルスペース操作ではなく、蓄積した編集制約を適切に考慮することから自然に現れることを示す。
信頼性の高いシーケンシャルアップデートには,多くの一般的な正規化戦略が不要であることを実証的に確認する。
さらに、矛盾する編集を扱うためにフレームワークを拡張し、矛盾する更新の下で堅牢で一貫した振る舞いを保証する。
最終的に我々の研究は、Ariadne氏のスレッドをシーケンシャルな編集のラビリンスを通じて提供し、よりシンプルで、より解釈可能で、信頼性の高い知識更新への道をチャート化します。
私たちのコードはhttps://github.com/Wangzzzzzz/OTE-SE-Alignment.comで公開されています。
関連論文リスト
- The Anatomy of an Edit: Mechanism-Guided Activation Steering for Knowledge Editing [52.315369633116255]
大規模言語モデル(LLM)は知識ベースとしてますます使われているが、それらを最新の状態に保つには、目標とする知識編集(KE)が必要である。
ニューロンレベルの知識属性(NLKA)を用いたKEの力学的考察
代表的KE法全体にわたって、我々は一貫したパターンを見出す: ミッド・トゥ・レイト・アテンションは、主に新しいターゲットを促進するが、アテンションとFFNモジュールは、元の事実を抑えるために協力する。
本研究の目的は,MEGA(Mechanism-Guided Activation steering method)を提案することである。
論文 参考訳(メタデータ) (2026-03-21T12:40:15Z) - Spectral Characterization and Mitigation of Sequential Knowledge Editing Collapse [44.49646322759214]
モデルの一般能力は、事前訓練された重み行列の支配的な特異方向と密接に関連していることを示す。
支配的な特異部分空間を明示的に保存することにより、シーケンシャルな編集を安定化するプラグイン・アンド・プレイフレームワークであるREVIVEを提案する。
論文 参考訳(メタデータ) (2026-01-16T07:18:14Z) - EvoEdit: Evolving Null-space Alignment for Robust and Efficient Knowledge Editing [19.834477925624658]
大規模言語モデル(LLM)は、時代遅れまたは誤った知識を正すために継続的な更新を必要とする。
既存のアプローチは主に位置対応のフレームワークに基づいている。
本稿では,連続的なヌル空間アライメントによる破滅的干渉を緩和する新しい編集戦略であるEvoEditを紹介する。
論文 参考訳(メタデータ) (2025-10-11T21:36:14Z) - Is Model Editing Built on Sand? Revealing Its Illusory Success and Fragile Foundation [50.40861036534546]
大きな言語モデル(LLM)は、必然的に時代遅れまたは誤った知識をエンコードする。そのような知識の更新、削除、そして忘れは、アライメント、安全性、その他の問題にとって重要である。
この問題を解決するために、モデル編集は有望なパラダイムとして現れ、特定の事実が更新され、他の知識を保持しながら、パラメータの小さなサブセットを正確に編集する。
前回の論文で大きな成功を収めたにもかかわらず、編集の信頼性は脆弱な基盤にかかっていることが判明した。
我々の経験的証拠は、編集が完全な意味論よりもショートカットに基づく可能性が高いことを示し、さらなる進歩の前にモデル編集の基盤を急激な再考を求める。
論文 参考訳(メタデータ) (2025-10-01T07:59:23Z) - MEMOIR: Lifelong Model Editing with Minimal Overwrite and Informed Retention for LLMs [76.28901550926021]
寿命の長いモデル編集のための既存の方法は、妥協の一般化、過去の編集の妨害、長い編集シーケンスへのスケールの失敗である。
我々は,学習済みモデルのコア能力を保ちながら,残メモリを介して知識を注入する,新しいスケーラブルなフレームワークMEMOIRを提案する。
MeMOIRは信頼性、一般化、ローカリティのメトリクスにまたがる最先端のパフォーマンスを実現し、最小限の忘れ物で数千のシーケンシャルな編集にスケールする。
論文 参考訳(メタデータ) (2025-06-09T16:16:42Z) - LyapLock: Bounded Knowledge Preservation in Sequential Large Language Model Editing [28.870053452479443]
現在の位置情報編集アプローチは、逐次編集中に徐々にパフォーマンスが低下している。
textbfLyapLockは、長期制約付きプログラミングを、効率的な解法のために、段階的に抽出可能なサブプロブレムに分解するために提案されている。
実験結果から,本フレームワークは汎用性を安定させ,SOTAベースラインよりも平均編集効率を11.89%向上させるとともに,1万回以上の編集能力に拡張可能であることがわかった。
論文 参考訳(メタデータ) (2025-05-21T16:16:33Z) - Knowledge Editing through Chain-of-Thought [31.230769348268282]
インコンテキスト編集(In-context editing)は、世界知識を維持するために、大きな言語モデル(LLM)を新しい情報で更新する技法である。
その可能性にもかかわらず、既存のコンテキスト内知識編集手法はしばしばタスク固有である。
本研究では,リトレーニングを伴わずに,様々なタスクにまたがるLSMを柔軟かつ効率的に更新する新しい知識編集フレームワークEditCoTを提案する。
論文 参考訳(メタデータ) (2024-12-23T17:17:50Z) - EVEDIT: Event-based Knowledge Editing with Deductive Editing Boundaries [69.72012539060731]
大規模言語モデル(LLM)における効率的な知識編集(KE)の理論的枠組みを導入する。
本稿では,事象をイベント記述と組み合わせたイベントベースの知識編集タスクを提案する。
編集モデルにおける不確実性を解消するための既存の設定よりもイベントベースの編集の方が優れていることを実証的に示す。
論文 参考訳(メタデータ) (2024-02-17T16:34:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。