Fugu-MT 論文翻訳(概要): Learning in the Null Space: Small Singular Values for Continual Learning

論文の概要: Learning in the Null Space: Small Singular Values for Continual Learning

arxiv url: http://arxiv.org/abs/2602.21919v1
Date: Wed, 25 Feb 2026 13:55:06 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-26 18:19:16.849879
Title: Learning in the Null Space: Small Singular Values for Continual Learning
Title（参考訳）: Null空間での学習: 連続学習のための小さな特異値
Authors: Cuong Anh Pham, Praneeth Vepakomma, Samuel Horváth,
Abstract要約: NESS (Null-space Estimated from Small Singular value) は、勾配操作ではなく、重み空間に直交性を直接適用する手法である。 NESSは各層の入力表現の最小特異値を用いて近似ヌル空間を構築し、この部分空間に制約されたコンパクトローランク適応(LoRA)によるタスク固有の更新をパラメータ化する。 3つのベンチマークデータセットの理論的解析と実験により、連続学習における小さな特異値の役割が強調され、タスク間の競合性能、低い忘れ込み、安定した精度が示される。
参考スコア（独自算出の注目度）: 15.50990273412897
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Alleviating catastrophic forgetting while enabling further learning is a primary challenge in continual learning (CL). Orthogonal-based training methods have gained attention for their efficiency and strong theoretical properties, and many existing approaches enforce orthogonality through gradient projection. In this paper, we revisit orthogonality and exploit the fact that small singular values correspond to directions that are nearly orthogonal to the input space of previous tasks. Building on this principle, we introduce NESS (Null-space Estimated from Small Singular values), a CL method that applies orthogonality directly in the weight space rather than through gradient manipulation. Specifically, NESS constructs an approximate null space using the smallest singular values of each layer's input representation and parameterizes task-specific updates via a compact low-rank adaptation (LoRA-style) formulation constrained to this subspace. The subspace basis is fixed to preserve the null-space constraint, and only a single trainable matrix is learned for each task. This design ensures that the resulting updates remain approximately in the null space of previous inputs while enabling adaptation to new tasks. Our theoretical analysis and experiments on three benchmark datasets demonstrate competitive performance, low forgetting, and stable accuracy across tasks, highlighting the role of small singular values in continual learning. The code is available at https://github.com/pacman-ctm/NESS.
Abstract（参考訳）: さらなる学習を可能にしながら破滅的な忘れを緩和することは、継続学習(CL)における主要な課題である。直交的学習法はその効率性や強い理論的性質に注目され、既存の多くのアプローチでは勾配射影を通して直交性を強制している。本稿では、直交性を再検討し、小特異値が前のタスクの入力空間とほぼ直交する方向に対応するという事実を活用する。この原理に基づいて、勾配操作ではなく、重み空間に直交性を直接適用するCL法であるNESS(Null-space Estimated from Small Singular value)を導入する。具体的には、NESSは各層の入力表現の最小特異値を用いて近似ヌル空間を構築し、この部分空間に制約されたコンパクトローランク適応(LoRAスタイル)によってタスク固有の更新をパラメータ化する。部分空間基底はヌル空間制約を保存するために固定され、各タスクに対して1つのトレーニング可能な行列のみが学習される。この設計により、結果の更新は以前の入力のnull空間にほぼ留まり、新しいタスクへの適応を可能にする。 3つのベンチマークデータセットの理論的解析と実験により、連続学習における小さな特異値の役割が強調され、タスク間の競合性能、低い忘れ込み、安定した精度が示される。コードはhttps://github.com/pacman-ctm/NESSで公開されている。

関連論文リスト

Geometric-Disentangelment Unlearning [106.99160454669902]
忘れたサンプルへの勾配はしばしば保持された知識を傷つける本稿では,GU(Geometric-disment Unlearning)を提案する。本手法はプラグ・アンド・プレイであり,既存の勾配に基づくアンラーニング手法と併用することで副作用を軽減できる。
論文参考訳（メタデータ） (2025-11-21T09:58:25Z)
GNSP: Gradient Null Space Projection for Preserving Cross-Modal Alignment in VLMs Continual Learning [27.9960664846484]
コントラスト言語-画像事前学習は、共有埋め込み空間における視覚的・テキスト的モダリティを整列させることにより、目覚ましいゼロショットの一般化を示した。様々なタスクを継続的に微調整すると、CLIPはその埋め込みアライメントの破滅的な忘れ込みと劣化に悩まされる。 GNSP(Gradient Null Space Projection)は,タスク固有の勾配を以前に学習した知識のnull空間に投影する,効率的な連続学習手法である。
論文参考訳（メタデータ） (2025-07-26T07:22:12Z)
SplitLoRA: Balancing Stability and Plasticity in Continual Learning Through Gradient Space Splitting [68.00007494819798]
継続的な学習には、安定性を保ちながら複数のタスクを連続的に学習するモデルが必要である。グラディエント・プロジェクションはCLにおいて有効で一般的なパラダイムとして現れ、以前に学習したタスクの勾配空間を2つの部分空間に分割する。新しいタスクは小部分空間内で効果的に学習され、これにより以前取得した知識との干渉が軽減される。既存の勾配射影法は、勾配空間を適切に分割することが困難であるため、塑性と安定性の最適なバランスを達成するのに苦労する。
論文参考訳（メタデータ） (2025-05-28T13:57:56Z)
Continuous Subspace Optimization for Continual Learning [24.597922531045846]
継続的な学習は、先行知識を維持しながら、連続的に複数のタスクを学習することを目的としている。連続学習のための連続部分空間最適化(CoSO)を提案する。 CoSOは、特に長いタスクシーケンスを持つ挑戦的なシナリオにおいて、最先端のメソッドを著しく上回る。
論文参考訳（メタデータ） (2025-05-17T03:53:21Z)
Sculpting Subspaces: Constrained Full Fine-Tuning in LLMs for Continual Learning [19.27175827358111]
大規模言語モデル(LLM)における継続的な学習は破滅的な忘れがちである。適応特異値分解(SVD)を利用した連続的完全微調整手法を提案する。我々は,Encoder-decoder (T5-Large) モデルとdecoder-only (LLaMA-2 7B) モデルの両方を用いて,標準連続学習ベンチマークを広範囲に評価した。
論文参考訳（メタデータ） (2025-04-09T17:59:42Z)
Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Self-Regularization [77.62516752323207]
そこで本研究では,事前訓練した重みを効率よく微調整する直交微調整法を導入し,頑健さと一般化の強化を実現した。自己正規化戦略は、OrthSRと呼ばれるVLMのゼロショット一般化の観点から安定性を維持するためにさらに活用される。筆者らはCLIPとCoOpを再検討し,少数の画像のクラスフィシエーションシナリオにおけるモデルの改善を効果的に行う。
論文参考訳（メタデータ） (2024-07-11T10:35:53Z)
Towards Continual Learning Desiderata via HSIC-Bottleneck Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文参考訳（メタデータ） (2024-01-17T09:01:29Z)
Balancing Stability and Plasticity through Advanced Null Space in Continual Learning [77.94570903726856]
我々は,従来のタスクの古いデータを格納することなく,安定性と可塑性のバランスをとるために,新しい連続学習手法Advanced Null Space(AdNS)を提案する。また,現在のタスクの性能向上を図るため,タスク内蒸留を簡便かつ効果的に行う方法を提案する。実験結果から,提案手法は最先端の連続学習手法よりも優れた性能が得られることが示された。
論文参考訳（メタデータ） (2022-07-25T11:04:22Z)
Training Networks in Null Space of Feature Covariance for Continual Learning [34.095874368589904]
従来のタスクのヌルスペース内でネットワークパラメータを逐次最適化する新しいネットワークトレーニングアルゴリズムadam-nsclを提案する。このアプローチを,cifar-100とtinyimagenetのベンチマークデータセット上での連続学習のためのトレーニングネットワークに適用する。
論文参考訳（メタデータ） (2021-03-12T07:21:48Z)
Continual Learning in Low-rank Orthogonal Subspaces [86.36417214618575]
連続学習(CL)では、学習者は一連のタスクに直面して次々に到着し、学習経験が終わるとすべてのタスクを覚えることが目的である。 CLの以前の技術は、タスク間の干渉を減らすためにエピソードメモリ、パラメータ正規化、ネットワーク構造を使用していたが、最終的には、全てのアプローチが共同ベクトル空間で異なるタスクを学習する。干渉を最小限に抑えるために互いに直交する異なる(低ランクな)ベクトル部分空間でタスクを学習することを提案する。
論文参考訳（メタデータ） (2020-10-22T12:07:43Z)
Learning to Optimize Non-Rigid Tracking [54.94145312763044]
我々は、堅牢性を改善し、解法収束を高速化するために学習可能な最適化を採用する。まず、CNNを通じてエンドツーエンドに学習された深い特徴にアライメントデータ項を統合することにより、追跡対象をアップグレードする。次に,プレコンディショニング手法と学習手法のギャップを,プレコンディショナを生成するためにトレーニングされたConditionNetを導入することで埋める。
論文参考訳（メタデータ） (2020-03-27T04:40:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。