論文の概要: Geometry Conflict: Explaining and Controlling Forgetting in LLM Continual Post-Training
- arxiv url: http://arxiv.org/abs/2605.09608v1
- Date: Sun, 10 May 2026 15:40:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 02:24:05.536875
- Title: Geometry Conflict: Explaining and Controlling Forgetting in LLM Continual Post-Training
- Title(参考訳): 幾何学的矛盾: LLM連続試験における予測の説明と制御
- Authors: Yuanyi Wang, Yifan Yang, Su Lu, Yanggan Gu, Pengkai Wang, Wenjun Wang, Zhaoyi Yan, Congkai Xie, Jianmin Wu, Jialun Cao, Shing-Chi Cheung, Hongxia Yang,
- Abstract要約: 我々は3つの質問を通して連続的なポストトレーニングについて研究している。
私たちの中心的な発見は、忘れることがステートリレーショナルな更新統合の失敗と見なすことができることです。
データフリー更新積分法であるGeometry-Conflict Wasserstein Merging (GCWM)を提案する。
- 参考スコア(独自算出の注目度): 32.954434663995
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Continual post-training aims to extend large language models (LLMs) with new knowledge, skills, and behaviors, yet it remains unclear when sequential updates enable capability transfer and when they cause catastrophic forgetting. Existing methods mitigate forgetting through sequential fine-tuning, replay, regularization, or model merging, but offer limited criteria for determining when incorporating new updates is beneficial or harmful. In this work, we study LLM continual post-training through three questions: What drives forgetting? When do sequentially acquired capabilities transfer or interfere? How can compatibility be used to control update integration? We address these questions through task geometry: we represent each post-training task by its parameter update and study the covariance geometry induced by the update. Our central finding is that: forgetting can be considered as a state-relative update-integration failure, it arises when the covariance geometries induced by tasks misalign with the geometry of the evolving model state. Sequential updates transfer when they remain compatible with the model state shaped by previous updates, and interfere when state-relative geometry conflict becomes high. Motivated by this finding, we propose Geometry-Conflict Wasserstein Merging (GCWM), a data-free update-integration method that constructs a shared Wasserstein metric via Gaussian Wasserstein barycenters and uses geometry conflict to gate geometry-aware correction. Across Qwen3 0.6B--14B on domain-continual and capability-continual settings, GCWM consistently outperforms data-free baselines, improving retention and final performance without replay data. These results identify geometry conflict as both an explanatory signal for forgetting and a practical control signal for LLM continual post-training.
- Abstract(参考訳): 継続的なポストトレーニングは、大きな言語モデル(LLM)を新しい知識、スキル、振る舞いで拡張することを目的としている。
既存の方法は、シーケンシャルな微調整、リプレイ、正規化、モデルマージを通じて忘れを緩和するが、新しい更新を組み込むことが有益か有害かを決定するための限られた基準を提供する。
本研究では,LLMの継続学習を3つの質問を通して研究する。
シーケンシャルに取得した機能はいつ転送されるのか?
互換性はどのようにして更新統合を制御することができるのか?
我々は,これらの課題をタスク幾何学を通して解決し,そのパラメータ更新によって各ポストトレーニングタスクを表現し,その更新によって引き起こされる共分散幾何学を研究する。
我々の中心的な発見は: 忘れることは状態関係の更新積分失敗と見なすことができ、それは、進化するモデル状態の幾何学と相違するタスクによって誘導される共分散幾何学が生じるときに起こる。
逐次更新は、以前の更新によって形成されたモデル状態と互換性を維持したままであり、状態相対幾何学的衝突が高くなると干渉する。
この発見に触発されたGeometry-Conflict Wasserstein Merging (GCWM) は,ガウス・ヴァッサーシュタイン・バリセンツを介して共有ワッサーシュタイン計量を構築し,幾何学的競合を利用してゲート幾何学的補正を行うデータフリーな更新積分法である。
Qwen3 0.6B--14Bのドメイン・コンティネント・コンティネント・セッティングでは、GCWMはデータフリーのベースラインを一貫して上回り、データ再生なしで保持と最終的なパフォーマンスを改善している。
これらの結果は、幾何学的矛盾を、忘れるための説明的信号と、LLM連続後学習のための実用的な制御信号の両方とみなす。
関連論文リスト
- Transporting Task Vectors across Different Architectures without Training [18.853461748616333]
異種モデルにまたがってタスク固有の更新をトランスポートするためのトレーニング不要な方法であるSoseusを紹介した。
パラメータを直接マッチングするのではなく、中間表現で引き起こされる機能的効果によってタスク更新を特徴付ける。
論文 参考訳(メタデータ) (2026-02-13T14:16:34Z) - Merging Beyond: Streaming LLM Updates via Activation-Guided Rotations [55.047454145941366]
Streaming Mergingは、反復最適化プロセスとしてマージを概念化する革新的なモデル更新パラダイムである。
ARMは勾配勾配勾配のダイナミクスを近似するために設計された戦略である。
ARMは初期のSFTチェックポイントしか必要とせず、反復的なマージによって完全に収束したSFTモデルを上回る。
論文 参考訳(メタデータ) (2026-02-03T08:15:57Z) - ET-Agent: Incentivizing Effective Tool-Integrated Reasoning Agent via Behavior Calibration [68.89572566071575]
ETAgentはエージェントのツール使用行動を調整するためのトレーニングフレームワークである。
過誤行動パターンを最適行動に段階的に校正するように設計されている。
論文 参考訳(メタデータ) (2026-01-11T11:05:26Z) - Agent-Dice: Disentangling Knowledge Updates via Geometric Consensus for Agent Continual Learning [41.461840578204956]
大言語モデル(LLM)ベースのエージェントは、破滅的な忘れをせずに新しいタスクを学習する。
Agent-Diceは指向性コンセンサス評価に基づくパラメータ融合フレームワークである。
GUIエージェントとツール使用エージェントドメインの実験は、Agent-Diceが優れた連続学習性能を示すことを示した。
論文 参考訳(メタデータ) (2026-01-07T06:43:50Z) - STABLE: Gated Continual Learning for Large Language Models [0.0]
STABLEは、シーケンシャルな更新時に忘れることを制限する、ゲート付き連続的なセルフ編集フレームワークである。
各候補編集は3つの指標のうちの1つを用いて安定性の予算に対して評価される。
Qwen-2.5-7Bモデルの実験では、ゲーティングは適応性を保ちながら忘れを効果的に軽減することを示した。
論文 参考訳(メタデータ) (2025-10-17T16:14:05Z) - CP$^2$: Leveraging Geometry for Conformal Prediction via Canonicalization [51.716834831684004]
幾何データシフトにおける共形予測(CP)の問題について検討する。
本稿では,幾何的ポーズなどの幾何学的情報を統合することを提案する。
論文 参考訳(メタデータ) (2025-06-19T10:12:02Z) - MINGLE: Mixture of Null-Space Gated Low-Rank Experts for Test-Time Continual Model Merging [29.58798660724693]
連続モデルマージは、オリジナルのトレーニングデータにアクセスすることなく、独立して微調整されたモデルを順次統合する。
テスト時間連続モデルマージの新しいフレームワークであるMINGLEを提案する。
MINGLEは堅牢な一般化を実現し、忘れることを大幅に減らし、従来の最先端の手法を平均で7-9%上回っている。
論文 参考訳(メタデータ) (2025-05-17T07:24:22Z) - Large Continual Instruction Assistant [59.585544987096974]
CIT(Continuous Instruction Tuning)は、大規模モデルにデータによる人間の意図データに従うよう指示するために用いられる。
既存の更新勾配は、CITプロセス中に前のデータセットのパフォーマンスを著しく損なうことになる。
本稿では,この課題に対処する汎用的な連続的命令チューニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-08T11:24:59Z) - Global Convergence of Policy Gradient for Linear-Quadratic Mean-Field
Control/Game in Continuous Time [109.06623773924737]
線形二乗平均場制御とゲームに対するポリシー勾配法について検討する。
線形速度で最適解に収束し, 合成シミュレーションにより検証した。
論文 参考訳(メタデータ) (2020-08-16T06:34:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。