論文の概要: Exploring Data-Free LoRA Transferability for Video Diffusion Models
- arxiv url: http://arxiv.org/abs/2605.01929v1
- Date: Sun, 03 May 2026 15:22:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.99941
- Title: Exploring Data-Free LoRA Transferability for Video Diffusion Models
- Title(参考訳): ビデオ拡散モデルにおけるデータフリーのロラ転送可能性の検討
- Authors: Yuchen Wang, Wenliang Zhong, Lichen Bai, Zikai Zhou, Shitong Shao, Bojun Cheng, Shuo Chen, Shuo Yang, Zeke Xie,
- Abstract要約: ステップ蒸留や因果蒸留を利用したビデオ拡散モデルは優れた性能を発揮した。
既存のLoRAをこれらの変種に適用することは、重量空間のミスマッチのため重要な課題である。
本稿では、ターゲットの多様体の保護とLoRAアライメントの復元を動的に仲裁するデータフリーフレームワークであるCluster-Aware Spectral Arbitration (CASA)を提案する。
- 参考スコア(独自算出の注目度): 41.981710361053196
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Video diffusion models leveraging step distillation or causal distillation have achieved remarkable performance. However, adapting existing LoRAs to these variants remains a critical challenge due to weight space mismatches. We observe that direct application leads to style degradation and structural collapse, yet the underlying mechanisms remain poorly understood. To fill this gap, we delve into the weight space and identify that the incompatibility stems from spectral interference within shared functional clusters defined over singular subspaces. Specifically, our analysis reveals that while both paradigms respect spectral rigidity, they establish conflicting routing pathways that clash through constructive overload or destructive cancellation. To address this issue, we propose Cluster-Aware Spectral Arbitration (CASA), a data-free framework that dynamically arbitrates between safeguarding the target's manifold and restoring LoRA alignment based on spectral density. Extensive experiments demonstrate that CASA effectively mitigates artifacts and revives LoRA functionality. Our code is available at https://github.com/Noahwangyuchen/CASA
- Abstract(参考訳): ステップ蒸留や因果蒸留を利用したビデオ拡散モデルは優れた性能を発揮した。
しかし、これらの変種に既存のLoRAを適用することは、重量空間のミスマッチのため重要な課題である。
直接的な適用はスタイルの劣化と構造的崩壊につながるが、基礎となるメカニズムはよく分かっていない。
このギャップを埋めるために、ウェイト空間を探索し、特異部分空間上で定義された共有汎関数クラスタ内のスペクトル干渉から不整合が生じることを確かめる。
具体的には、両パラダイムがスペクトル剛性を尊重する一方で、建設的過負荷や破壊的キャンセルを通じて衝突する競合経路を確立することを明らかにする。
この問題を解決するために、ターゲットの多様体の保護とスペクトル密度に基づくLoRAアライメントの復元を動的に仲裁するデータフリーフレームワークであるCluster-Aware Spectral Arbitration (CASA)を提案する。
大規模な実験により、CASAはアーティファクトを効果的に軽減し、LoRA機能を復活させることが示された。
私たちのコードはhttps://github.com/Noahwangyuchen/CASAで利用可能です。
関連論文リスト
- Preference-Aligned LoRA Merging: Preserving Subspace Coverage and Addressing Directional Anisotropy [50.63908869296697]
複数のローランド適応(LoRA)モジュールを統合することで汎用システムの構築が期待できる。
優先重み付きクロスエントロピー擬似空間を用いて重みを重み付けするTARA-Mergingを提案する。
8つのビジョンと6つのNLIベンチマークで、TARA-MergingはバニラとLoRA対応のベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-03-27T11:07:46Z) - BadRSSD: Backdoor Attacks on Regularized Self-Supervised Diffusion Models [10.286339414754499]
Bad RSSDは自己教師付き拡散モデルの表現層をターゲットにした最初のバックドア攻撃である。
標的画像に対するPCA空間のトリガーで有毒なサンプルのセマンティック表現をハイジャックする。
悪い RSSD は FID と MSE の両方で既存の攻撃を著しく上回っている。
論文 参考訳(メタデータ) (2026-03-01T09:56:26Z) - NP-LoRA: Null Space Projection Unifies Subject and Style in LoRA Fusion [16.64405108290577]
Low-Rank Adaptation (LoRA) 融合は学習対象とスタイル表現を再利用・構成するための重要な技術である。
既存の方法は重量ベースのマージに依存しており、一方のLoRAが他方を支配下に置くことが多い。
サブスペース分離を強制するLoRA融合のためのプロジェクションベースのフレームワークであるNull Space Projection LoRAを提案する。
論文 参考訳(メタデータ) (2025-11-14T08:06:01Z) - Latent Space Factorization in LoRA [10.994747174370099]
低ランク適応 (LoRA) はパラメータ効率の高い微調整法として広く用いられている。
本稿ではFVAE-LoRA(Facterized Variational Autoencoder LoRA)を提案する。
また,本論文のエビデンス・ロウアー・バウンドの定式化は,潜在空間間の分解を明示的に促進し,一方の潜在空間をタスク・サレントな特徴に,他方の残余情報に割り当てるものである。
論文 参考訳(メタデータ) (2025-10-22T14:37:20Z) - Revisiting LoRA through the Lens of Parameter Redundancy: Spectral Encoding Helps [37.00767702936744]
Low-Rank Adaptation (LoRA) は、大規模な基礎モデルを微調整するための顕著なテクニックとして登場した。
その成功にもかかわらず、LoRAのキャパシティと効率を制限するかなりのパラメータ冗長性はボトルネックとして認識されている。
underlineSpectral-underlineencoding underlineLow-underlineRank underlineAdaptation (SeLoRA)を紹介する。
論文 参考訳(メタデータ) (2025-06-20T07:09:05Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - FreSca: Scaling in Frequency Space Enhances Diffusion Models [55.75504192166779]
本稿では,潜時拡散モデルにおける周波数制御について検討する。
本稿では,低周波成分と高周波成分にノイズ差を分解する新しいフレームワークFreScaを紹介する。
FreScaはモデルの再トレーニングやアーキテクチャの変更なしに動作し、モデルとタスクに依存しない制御を提供する。
論文 参考訳(メタデータ) (2025-04-02T22:03:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。