論文の概要: Subspace Control: Turning Constrained Model Steering into Controllable Spectral Optimization
- arxiv url: http://arxiv.org/abs/2604.04231v1
- Date: Sun, 05 Apr 2026 19:27:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.996786
- Title: Subspace Control: Turning Constrained Model Steering into Controllable Spectral Optimization
- Title(参考訳): 部分空間制御:制約付きモデルステアリングを制御可能なスペクトル最適化に変換する
- Authors: Yancheng Huang, Changsheng Wang, Chongyu Fan, Yicheng Lang, Bingqi Shang, Yang Zhang, Mingyi Hong, Qing Qu, Alvaro Velasquez, Sijia Liu,
- Abstract要約: 制約付きモデルトレーニングのためのサブスペース制御フレームワークを提案する。
SIFT (spectral interference-free training) は、すべてのタスクにおいて、実質的で堅牢なパフォーマンス改善を一貫して達成する。
- 参考スコア(独自算出の注目度): 27.280175507074322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foundation models, such as large language models (LLMs), are powerful but often require customization before deployment to satisfy practical constraints such as safety, privacy, and task-specific requirements, leading to "constrained" optimization problems for model steering and adaptation. However, solving such problems remains largely underexplored and is particularly challenging due to interference between the primary objective and constraint objectives during optimization. In this paper, we propose a subspace control framework for constrained model training. Specifically, (i) we first analyze, from a model merging perspective, how spectral cross-task interference arises and show that it can be resolved via a one-shot solution that orthogonalizes the merged subspace; (ii) we establish a connection between this solution and gradient orthogonalization in the spectral optimizer Muon; and (iii) building on these insights, we introduce SIFT (spectral interference-free training), which leverages a localization scheme to selectively intervene during optimization, enabling controllable updates that mitigate objective-constraint conflicts. We evaluate SIFT across four representative applications: (a) machine unlearning, (b) safety alignment, (c) text-to-speech adaptation, and (d) hallucination mitigation. Compared to both control-based and control-free baselines, SIFT consistently achieves substantial and robust performance improvements across all tasks. Code is available at https://github.com/OPTML-Group/SIFT.
- Abstract(参考訳): 大規模言語モデル(LLM)のような基礎モデルは強力だが、安全性やプライバシー、タスク固有の要件といった現実的な制約を満たすために、デプロイ前にカスタマイズを必要とすることが多く、モデルステアリングと適応のための"制約付き"最適化問題に繋がる。
しかし、そのような問題の解法は未解明のままであり、最適化時の主目的と制約目的との干渉により特に困難である。
本稿では,制約付きモデルトレーニングのためのサブスペース制御フレームワークを提案する。
具体的には
i) モデルマージの観点から、まず、どのようにスペクトルクロスタスクの干渉が起こるかを分析し、それが統合された部分空間を直交するワンショット解によって解決可能であることを示す。
(II)スペクトルオプティマイザMuonにおけるこの解と勾配直交化の接続を確立する。
3)これらの知見に基づいて、最適化中に選択的に介入するための局所化スキームを活用するSIFT(spectral interference-free training)を導入し、客観的制約の衝突を緩和する制御可能な更新を可能にする。
SIFTを4つの代表的なアプリケーションで評価する。
a) 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械学習; 機械教育; 機械
(b)安全アライメント
(c)テキストから音声への適応、及び
(d)幻覚の緩和。
コントロールベースベースラインとコントロールフリーベースラインの両方と比較して、SIFTは、すべてのタスクにおいて、実質的で堅牢なパフォーマンス改善を一貫して達成している。
コードはhttps://github.com/OPTML-Group/SIFTで入手できる。
関連論文リスト
- Feasibility Restoration under Conflicting STL Specifications with Pareto-Optimal Refinement [18.383508411056944]
Signal Temporal Logic (STL) は、ロボット工学における表現的要求を規定する表現的言語である。
STL仕様は、安全規則、交通規制、タスクと目的を一緒に満たせない現実世界のアプリケーションでは矛盾する可能性がある。
本稿では,最小限の緩和による実現可能性の回復を図り,それを価値認識多目的最適化問題として定式化し,実現可能な解を洗練する,統合された2段階フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-06T23:41:01Z) - OmniVL-Guard: Towards Unified Vision-Language Forgery Detection and Grounding via Balanced RL [63.388513841293616]
既存の偽造検出手法は、現実世界の誤報に多いインターリーブされたテキスト、画像、ビデオを扱うのに失敗する。
このギャップを埋めるため,本論文では,オムニバス・ビジョン言語による偽造検出と接地のための統一フレームワークの開発を目標としている。
我々は、OmniVL-Guardという、オムニバス視覚言語による偽造検出と接地のためのバランスの取れた強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-11T09:41:36Z) - Adaptive Linear Path Model-Based Diffusion [52.84663832658799]
リニアパスモデルベース拡散(LP-MBD)を導入し、分散保存スケジュールをフローマッチング線形確率パスに置き換える。
また,適応型LP-MBD(ALP-MBD)を提案し,タスクの複雑さや環境条件に応じて拡散ステップやノイズレベルを調整する。
論文 参考訳(メタデータ) (2026-02-02T21:33:03Z) - Automated Optimization Modeling via a Localizable Error-Driven Perspective [20.591721861026414]
本稿では,自動最適化のための新しい誤り駆動学習フレームワークを提案する。
MINDはデータ合成からポストトレーニングまで、モデルトレーニングフレームワーク全体をカスタマイズした。
MINDは、最先端の自動化最適化モデリングアプローチを一貫して上回っている。
論文 参考訳(メタデータ) (2026-01-17T09:59:01Z) - QoS-Aware Hierarchical Reinforcement Learning for Joint Link Selection and Trajectory Optimization in SAGIN-Supported UAV Mobility Management [52.15690855486153]
宇宙空間統合ネットワーク (SAGIN) がユビキタスUAV接続を実現するための重要なアーキテクチャとして登場した。
本稿では,SAGINにおけるUAVモビリティ管理を制約付き多目的関節最適化問題として定式化する。
論文 参考訳(メタデータ) (2025-12-17T06:22:46Z) - Steerable Adversarial Scenario Generation through Test-Time Preference Alignment [58.37104890690234]
対立シナリオ生成は、自律運転システムの安全性評価のためのコスト効率の良いアプローチである。
textbfSteerable textbfAdversarial scenario textbfGEnerator (SAGE) という新しいフレームワークを導入する。
SAGEは、逆境とリアリズムの間のトレードオフを、再トレーニングなしできめ細かいテストタイムコントロールを可能にします。
論文 参考訳(メタデータ) (2025-09-24T13:27:35Z) - Rewards-in-Context: Multi-objective Alignment of Foundation Models with Dynamic Preference Adjustment [46.44464839353993]
リワード・イン・コンテキスト(Rewards-in-Context, RiC)を導入する。
RiCは単一のファンデーションモデルの教師付き微調整のみを必要とし、推論時間中にユーザの好みを動的に調整する。
論文 参考訳(メタデータ) (2024-02-15T18:58:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。