論文の概要: Modality-Decoupled Online Recursive Editing
- arxiv url: http://arxiv.org/abs/2605.20273v1
- Date: Tue, 19 May 2026 03:11:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.257986
- Title: Modality-Decoupled Online Recursive Editing
- Title(参考訳): モダリティを分離したオンライン再帰編集
- Authors: Siyuan Li, Youyuan Zhang, Fangming Liu, Jing Li,
- Abstract要約: 生涯MLLM適応のためのモダリティ分離オンラインエディタM-OREを提案する。
M-OREは、統一された近近射影の定式化から派生し、シャーマン・モリソン再帰を伴う閉形式のアップデートを認める。
テキストスタックとビジュアルプロジェクタのモジュール単位のローカリティ統計を保持し、視覚的に支配的な更新シェーピングを回避し、固定されたローランク編集サブスペースで連続的な更新を実行する。
- 参考スコア(独自算出の注目度): 21.86720581525853
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online model editing for multimodal large language models (MLLMs) requires assimilating a stream of corrections under tight compute and memory budgets. Yet editors developed for text-only LLMs often degrade on MLLMs: visually dominant activations skew the statistics that shape updates, causing cross-modal conflict, while sequential writes become entangled in a shared edit space and amplify long-horizon interference, causing inter-edit interference. To address these, we propose M-ORE, a modality-decoupled online recursive editor for lifelong MLLM adaptation. M-ORE is derived from a unified proximal-projection formulation and admits a closed-form update with a Sherman-Morrison recursion, yielding constant per-edit overhead. It maintains module-wise locality statistics for the text stack and the visual projector to avoid visually dominated update shaping and performs continual updates in a fixed orthogonal low-rank edit subspace via a Sherman-Morrison recursion to mitigate long-horizon interference. Experiments on multiple MLLM backbones and online editing benchmarks show that our M-ORE method consistently improves reliability, generality, and locality over strong baselines, while achieving favorable quality-efficiency scaling. Our code is publicly available at https://github.com/lab-klc/M-ORE.
- Abstract(参考訳): マルチモーダル大言語モデル(MLLM)のオンラインモデル編集には、厳密な計算とメモリ予算の下での修正のストリームを同化する必要がある。
視覚的に支配的なアクティベーションは更新を形作る統計を歪め、モード間の競合を引き起こし、シーケンシャルな書き込みは共有編集空間に絡み合い、長い水平干渉を増幅し、相互干渉を引き起こす。
そこで本稿では,M-ORE(M-ORE)を提案する。
M-OREは、統一された近近射影の定式化から派生し、シャーマン・モリソン再帰によるクローズドフォームの更新を認め、プロセッサごとのオーバーヘッドは一定である。
テキストスタックとビジュアルプロジェクタのモジュールワイドなローカリティ統計を保持し、視覚的に支配される更新シェーピングを回避し、シャーマン・モリソン再帰を通じて固定直交の低ランク編集サブ空間で連続的な更新を行い、長い水平干渉を緩和する。
複数のMLLMバックボーンとオンライン編集ベンチマークの実験から,我々のM-ORE法は信頼性,汎用性,局所性を常に向上するとともに,良好な品質・効率のスケーリングを実現していることがわかった。
私たちのコードはhttps://github.com/lab-klc/M-ORE.comで公開されています。
関連論文リスト
- Edit-Based Refinement for Parallel Masked Diffusion Language Models [47.05195944319345]
マスク付き拡散言語モデルは並列トークン生成を可能にし、復号効率を向上させる。
本稿では,軽量な後編集ステップで拡散生成を増強する編集ベース改良フレームワークME-DLMを提案する。
本手法は,HumanEvalで11.6点,GSM8Kで33.6点,全拡散ステップの8分の1を用いて一貫したゲインを得る。
論文 参考訳(メタデータ) (2026-05-10T15:31:22Z) - MEMOIR: Lifelong Model Editing with Minimal Overwrite and Informed Retention for LLMs [76.28901550926021]
寿命の長いモデル編集のための既存の方法は、妥協の一般化、過去の編集の妨害、長い編集シーケンスへのスケールの失敗である。
我々は,学習済みモデルのコア能力を保ちながら,残メモリを介して知識を注入する,新しいスケーラブルなフレームワークMEMOIRを提案する。
MeMOIRは信頼性、一般化、ローカリティのメトリクスにまたがる最先端のパフォーマンスを実現し、最小限の忘れ物で数千のシーケンシャルな編集にスケールする。
論文 参考訳(メタデータ) (2025-06-09T16:16:42Z) - ELDER: Enhancing Lifelong Model Editing with Mixture-of-LoRA [55.697627106315004]
大規模言語モデル(LLM)は、特定の知識を効率的に更新し、事実の誤りを避けるためにモデル編集を必要とする。
従来のアプローチでは、元のパラメータを凍結し、知識更新毎に新しいパラメータを個別に割り当てることで、シーケンシャルな編集を管理する。
本稿では,データとアダプタを連続的に関連付ける新しい手法であるELDERを提案する。
論文 参考訳(メタデータ) (2024-08-19T02:27:00Z) - DAFNet: Dynamic Auxiliary Fusion for Sequential Model Editing in Large Language Models [32.598670876662375]
動的補助核融合ネットワーク(DAFNet)は、シーケンス全体の事実知識間の意味的相互作用を強化するように設計されている。
DAFNetはシングルターンとシーケンシャルな編集において、強いベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2024-05-31T02:56:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。