論文の概要: PALoRA: Projection-Adaptive LoRA for Preserving Reasoning in Large Language Models
- arxiv url: http://arxiv.org/abs/2605.24549v1
- Date: Sat, 23 May 2026 12:34:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.232086
- Title: PALoRA: Projection-Adaptive LoRA for Preserving Reasoning in Large Language Models
- Title(参考訳): PALoRA:大規模言語モデルにおける推論保存のための投影適応LoRA
- Authors: Mustafa Hayri Bilgin, Mariam Barry, Albert Bifet, Azzedine Idir Ait Said, Soumya Banerjee,
- Abstract要約: 推論に必要な情報は、支配的な特異方向のみに局所化されるのではなく、代わりに特異スペクトルに分散されることを示す。
干渉を低減した知識注入のための2段階フレームワークであるPALoRAを紹介する。
- 参考スコア(独自算出の注目度): 11.396379339626122
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficiently updating Large Language Models (LLMs) with new or evolving factual knowledge remains a central challenge, as even parameter-efficient adaptation can erode previously acquired reasoning abilities. This tension reflects a plasticity-stability dilemma: models must incorporate new knowledge while preserving skill-critical representations. In this work, we study this trade-off through the spectral structure of multilayer perceptron weight matrices. We show, both theoretically and empirically, that information essential for reasoning is not localized only in dominant singular directions, but is instead distributed across the singular spectrum. Motivated by this observation, we introduce PALoRA, a two-stage framework for knowledge injection with reduced interference. PALoRA first trains a Singular Value Fine-Tuning (SVF) expert on a reasoning dataset and uses its learned singular scaling vector as a frozen geometric probe to identify components that are critical for the target skill. It then performs factual knowledge injection with Low-Rank Adaptation (LoRA) under a structural orthogonality constraint, ensuring that updates avoid the identified skill-relevant subspace. Across Llama 3.1 8B and Mistral 7B, and across mathematical, coding, and scientific reasoning benchmarks, PALoRA preserves on average 95% of the SVF expert's reasoning performance while maintaining competitive factual recall. It consistently improves skill retention over prior spectral Parameter-Efficient Fine-Tuning (PEFT) methods while adding less than 0.006% parameter overhead.
- Abstract(参考訳): 大規模言語モデル(LLM)を新しくあるいは進化した事実知識で効果的に更新することは依然として中心的な課題であり、パラメータ効率の適応でさえ、以前獲得した推論能力を損なう可能性がある。
モデルは、スキルクリティカルな表現を維持しながら、新しい知識を取り入れなければならない。
本研究では、このトレードオフを多層パーセプトロン質量行列のスペクトル構造を通して検討する。
理論的にも経験的にも、推論に必要な情報は支配的な特異な方向だけに局在するのではなく、代わりに特異なスペクトルに分散していることが示される。
本研究の目的は,干渉を低減した知識注入のための2段階フレームワークであるPALoRAを導入することである。
PALoRAはまず、推論データセット上でSingular Value Fine-Tuning(SVF)の専門家をトレーニングし、学習した特異スケーリングベクトルを凍結幾何学的プローブとして使用して、ターゲットスキルに不可欠なコンポーネントを特定する。
その後、構造的直交制約の下でLoRA(Lo-Rank Adaptation)による事実知識注入を行い、更新が特定されたスキル関連部分空間を避ける。
Llama 3.1 8B と Mistral 7B の他、数学、コーディング、科学的推論のベンチマークを通じて、PALoRA は、競争上の事実リコールを維持しながら、SVFの専門家の推論性能の95%を保存している。
パラメタパラメータ効率の良いファインチューニング(PEFT)法よりも一貫してスキル保持を改善し、パラメータのオーバーヘッドは0.006%未満である。
関連論文リスト
- Large Vision-Language Models Get Lost in Attention [51.851592109135716]
本稿では,情報理論と幾何に基づく統合フレームワークを提案し,残差更新の幾何的およびエントロピー的性質を定量化する。
注意は再設定に焦点を当てたサブスペース言語演算子として機能し、FFNはセマンティックイノベーションを駆動するサブスペース言語演算子として機能します。
論文 参考訳(メタデータ) (2026-05-07T04:45:52Z) - Representation-Guided Parameter-Efficient LLM Unlearning [7.509597637044037]
大規模言語モデル(LLM)は、しばしば機密または有害な情報を記憶し、効果的な機械学習技術を必要とする。
本稿では,表現空間の幾何学的特性を活用し,堅牢かつ高精度な未学習を実現する新しい手法であるRepresentation-Guided Low-rank Unlearning (REGLU)を提案する。
論文 参考訳(メタデータ) (2026-04-19T11:59:58Z) - Decomposing and Composing: Towards Efficient Vision-Language Continual Learning via Rank-1 Expert Pool in a Single LoRA [50.97792275353563]
単一低ランク適応 (LoRA) モジュールを分解可能な Rank-1 エキスパートプールとして再構成する,新しいフレームワークを提案する。
本手法では,このエキスパートプールから[Guided]トークンのセマンティクスに導かれて,疎結合でタスク固有の更新を動的に作成することを学ぶ。
論文 参考訳(メタデータ) (2026-01-30T10:54:51Z) - Latent-Space Contrastive Reinforcement Learning for Stable and Efficient LLM Reasoning [16.244366307890832]
textbfDeepLatent Reasoning(DLR)を提案する。
このフレームワークは、試行錯誤コストを、高価なトークンレベルのフルシーケンス生成から連続潜在多様体へシフトさせる。
実験により、DLRはより安定した訓練収束を実現し、より長い水平推論チェーンをサポートし、推論能力の持続的な蓄積を促進することが示されている。
論文 参考訳(メタデータ) (2026-01-24T03:18:22Z) - How and Why LLMs Generalize: A Fine-Grained Analysis of LLM Reasoning from Cognitive Behaviors to Low-Level Patterns [51.02752099869218]
大きな言語モデル(LLM)は、非常に異なる一般化の振る舞いを示す。
推論を原子核スキルに分解する新しいベンチマークを導入する。
SFTモデルはよりシャープなドリフトと表面パターンへの過度な適合を示すのに対し、RL型モデルはより安定した行動プロファイルを維持し、推論スキルの崩壊に抵抗することを示す。
論文 参考訳(メタデータ) (2025-12-30T08:16:20Z) - The Path Not Taken: RLVR Provably Learns Off the Principals [85.41043469428365]
スパーシティはモデル条件の最適化バイアスの表面積であることを示す。
我々はこれらの力学を三ゲージ理論で機械的に説明する。
本稿では,RLVRの学習力学のパラメータレベルの特徴付けを行う。
論文 参考訳(メタデータ) (2025-11-11T18:49:45Z) - The First Few Tokens Are All You Need: An Efficient and Effective Unsupervised Prefix Fine-Tuning Method for Reasoning Models [69.798277882245]
大規模言語モデルの推論効率を向上させるために,Unsupervised Prefix Fine-Tuning (UPFT)を導入した。
UPFTはラベル付きデータや徹底的なサンプリングの必要性を取り除く。
実験の結果,UPFTは教師付き手法の性能と一致していることがわかった。
論文 参考訳(メタデータ) (2025-03-04T18:56:03Z) - MLAE: Masked LoRA Experts for Visual Parameter-Efficient Fine-Tuning [45.93128932828256]
Masked LoRA Experts (MLAE) は、視覚的PEFTにマスキングの概念を適用する革新的なアプローチである。
本手法は,低ランク行列を独立したランク1サブマトリクスに変換するセル分解戦略を組み込んだものである。
MLAEは,VTAB-1kベンチマークでは平均78.8%,FGVCベンチマークでは90.9%の精度で,新しい最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2024-05-29T08:57:23Z) - Ladder-of-Thought: Using Knowledge as Steps to Elevate Stance Detection [73.31406286956535]
姿勢検出タスクにLadder-of-Thought(LoT)を導入する。
LoTは、小さなLMに高品質な外部知識を同化させ、生成した中間的論理を精査するように指示する。
実験では, 姿勢検出タスクにおけるCoTのGPT-3.5よりも16%改善し, 10%向上した。
論文 参考訳(メタデータ) (2023-08-31T14:31:48Z) - A Causal View of Entity Bias in (Large) Language Models [42.64248130399508]
ホワイトボックスとブラックボックスの設定の両方において,エンティティバイアスを軽減するための因果介入手法を提案する。
ホワイトボックス設定では,PLMのOOD性能を5.7ポイント,機械読解(MRC)を9.1ポイント向上させる。
ブラックボックス設定下では, 文脈内介入は, GPT-3.5の実体に基づく知識紛争を効果的に軽減し, MRCの正確な一致精度を最大20.5ポイント改善し, REの記憶率を最大17.6ポイント削減する。
論文 参考訳(メタデータ) (2023-05-24T03:59:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。