Fugu-MT 論文翻訳(概要): Modular Customization of Diffusion Models via Blockwise-Parameterized Low-Rank Adaptation

論文の概要: Modular Customization of Diffusion Models via Blockwise-Parameterized Low-Rank Adaptation

arxiv url: http://arxiv.org/abs/2503.08575v1
Date: Tue, 11 Mar 2025 16:10:36 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-12 22:35:51.874596
Title: Modular Customization of Diffusion Models via Blockwise-Parameterized Low-Rank Adaptation
Title（参考訳）: ブロックワイズパラメータ化低ランク適応による拡散モデルのモジュラーカスタマイズ
Authors: Mingkang Zhu, Xi Chen, Zhongdao Wang, Bei Yu, Hengshuang Zhao, Jiaya Jia,
Abstract要約: コンセプトのスタイリングやマルチコンセプトのカスタマイズといったアプリケーションには、モジュール化が不可欠である。インスタントマージ法は、個々のマージされた概念のアイデンティティ損失と干渉を引き起こすことが多い。個々の概念のアイデンティティを正確に保存しつつ,複数の概念を効率的に組み合わせたインスタントマージ手法であるBlockLoRAを提案する。
参考スコア（独自算出の注目度）: 73.16975077770765
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent diffusion model customization has shown impressive results in incorporating subject or style concepts with a handful of images. However, the modular composition of multiple concepts into a customized model, aimed to efficiently merge decentralized-trained concepts without influencing their identities, remains unresolved. Modular customization is essential for applications like concept stylization and multi-concept customization using concepts trained by different users. Existing post-training methods are only confined to a fixed set of concepts, and any different combinations require a new round of retraining. In contrast, instant merging methods often cause identity loss and interference of individual merged concepts and are usually limited to a small number of concepts. To address these issues, we propose BlockLoRA, an instant merging method designed to efficiently combine multiple concepts while accurately preserving individual concepts' identity. With a careful analysis of the underlying reason for interference, we develop the Randomized Output Erasure technique to minimize the interference of different customized models. Additionally, Blockwise LoRA Parameterization is proposed to reduce the identity loss during instant model merging. Extensive experiments validate the effectiveness of BlockLoRA, which can instantly merge 15 concepts of people, subjects, scenes, and styles with high fidelity.
Abstract（参考訳）: 最近の拡散モデルカスタマイズは、主題やスタイルの概念を少数の画像に組み込むことで、顕著な成果を上げている。しかし、複数の概念のモジュール化された構成は、そのアイデンティティに影響を与えることなく分散化された概念を効率的にマージすることを目的としており、未解決のままである。モジュールのカスタマイズは、異なるユーザによってトレーニングされたコンセプトを使用して、コンセプトのスタイリングやマルチコンセプトのカスタマイズのようなアプリケーションに不可欠である。既存のポストトレーニング手法は、固定された概念のセットに限られており、任意の異なる組み合わせは、新しい再トレーニングのラウンドを必要とする。対照的に、インスタントマージ法は、個々のマージされた概念のアイデンティティ損失や干渉を引き起こすことが多く、通常は少数の概念に制限される。これらの課題に対処するために,個別概念のアイデンティティを正確に保存しつつ,複数の概念を効率的に組み合わせたインスタントマージ手法であるBlockLoRAを提案する。干渉の原因を慎重に分析し、異なるカスタマイズされたモデルの干渉を最小限に抑えるためにランダム化された出力消去技術を開発した。さらに、インスタントモデルマージ時のアイデンティティ損失を低減するために、ブロックワイドLoRAパラメータ化を提案する。大規模な実験によりBlockLoRAの有効性が検証され、人、主題、シーン、スタイルの15のコンセプトを忠実にマージすることができる。

関連論文リスト

Mod-Adapter: Tuning-Free and Versatile Multi-concept Personalization via Modulation Adapter [52.08332620725473]
テストタイムの微調整なしにオブジェクトと抽象概念を効果的にカスタマイズできるマルチコンセプトパーソナライズのためのチューニング不要な手法を提案する。本手法は, 定量的, 質的, 人的評価によって支援された多概念パーソナライゼーションにおける最先端性能を実現する。
論文参考訳（メタデータ） (2025-05-24T09:21:32Z)
LoRACLR: Contrastive Adaptation for Customization of Diffusion Models [62.70911549650579]
LoRACLRは、複数のLoRAモデルを単一の統一モデルにマージする、マルチコンセプト画像生成の新しいアプローチである。 LoRACLRは、これらのモデルの重み空間を整列し、マージするために対照的な目的を使い、干渉を最小限にしながら互換性を確保する。本結果は,複数の概念を正確にマージし,パーソナライズされた画像生成能力を向上する上で,LoRACLRの有効性を強調した。
論文参考訳（メタデータ） (2024-12-12T18:59:55Z)
How to Continually Adapt Text-to-Image Diffusion Models for Flexible Customization? [91.49559116493414]
本稿では,CIDM(Concept-Incremental Text-to-image Diffusion Model)を提案する。破滅的な忘れと概念の無視を解決し、新しいカスタマイズタスクを概念的な方法で学習する。実験により、CIDMが既存のカスタム拡散モデルを上回ることが確認された。
論文参考訳（メタデータ） (2024-10-23T06:47:29Z)
LoRA-Composer: Leveraging Low-Rank Adaptation for Multi-Concept Customization in Training-Free Diffusion Models [33.379758040084894]
ドメイン内の課題として、マルチコンセプトのカスタマイズが登場します。既存のアプローチでは、複数のローランド適応(LoRA)の融合行列をトレーニングして、さまざまな概念をひとつのイメージにマージすることが多い。 LoRA-Composerは、複数のLoRAをシームレスに統合するために設計されたトレーニング不要のフレームワークである。
論文参考訳（メタデータ） (2024-03-18T09:58:52Z)
OMG: Occlusion-friendly Personalized Multi-concept Generation in Diffusion Models [47.63060402915307]
OMGは、単一のイメージ内に複数の概念をシームレスに統合するように設計されたフレームワークである。 OMGはマルチコンセプトパーソナライゼーションにおいて優れた性能を示す。 civitai.comのLoRAモデルは直接利用することができる。
論文参考訳（メタデータ） (2024-03-16T17:30:15Z)
Separable Multi-Concept Erasure from Diffusion Models [52.51972530398691]
大規模拡散モデルから安全でない概念を排除するために,分離可能なマルチコンセプト消去器(SepME)を提案する。後者は最適化可能なモデルウェイトを分離し、各ウェイトインクリメントは特定の概念の消去に対応する。広範囲にわたる実験は, 概念の排除, モデル性能の保存, 各種概念の消去・回復における柔軟性の確保に, アプローチの有効性を示すものである。
論文参考訳（メタデータ） (2024-02-03T11:10:57Z)
Orthogonal Adaptation for Modular Customization of Diffusion Models [39.62438974450659]
我々は、カスタマイズされたモデルを効率的にマージすることを目的として、Modular Customizationと呼ばれる新しい問題に対処する。直交適応(Orthogonal Adaptation, Orthogonal Adaptation)は,微調整時に相互にアクセスできないカスタマイズモデルを支援する手法である。提案手法は単純かつ汎用的であり,モデルアーキテクチャのほぼすべての最適化可能な重みに適用可能である。
論文参考訳（メタデータ） (2023-12-05T02:17:48Z)
Mix-of-Show: Decentralized Low-Rank Adaptation for Multi-Concept Customization of Diffusion Models [72.67967883658957]
低ランク適応(LoRA)を用いた新しい概念に対して、公共の大規模テキスト・画像拡散モデルを簡単にカスタマイズできる。複数のカスタマイズされた概念を共同でサポートするために複数の概念LoRAを利用することは、課題である。我々は、分散化されたマルチコンセプトカスタマイズの課題に対処するMix-of-Showと呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (2023-05-29T17:58:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。