論文の概要: AnyLogo: Symbiotic Subject-Driven Diffusion System with Gemini Status
- arxiv url: http://arxiv.org/abs/2409.17740v1
- Date: Thu, 26 Sep 2024 11:15:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-28 19:53:49.785315
- Title: AnyLogo: Symbiotic Subject-Driven Diffusion System with Gemini Status
- Title(参考訳): AnyLogo: ジェミニ状態を有する共生型主観駆動拡散システム
- Authors: Jinghao Zhang, Wen Qian, Hao Luo, Fan Wang, Feng Zhao,
- Abstract要約: 特筆すべき詳細整合性を備えたゼロショット領域カスタマイズツールである textbfAnyLogo を提示する。
我々は厳密な署名抽出と創造的なコンテンツ生成が有望な互換性があることに気付く。
外部構成の代わりに、デノナイジングモデルのgemini状態は、強化された被写体伝達効率を促進する。
- 参考スコア(独自算出の注目度): 18.523180287842813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models have made compelling progress on facilitating high-throughput daily production. Nevertheless, the appealing customized requirements are remain suffered from instance-level finetuning for authentic fidelity. Prior zero-shot customization works achieve the semantic consistence through the condensed injection of identity features, while addressing detailed low-level signatures through complex model configurations and subject-specific fabrications, which significantly break the statistical coherence within the overall system and limit the applicability across various scenarios. To facilitate the generic signature concentration with rectified efficiency, we present \textbf{AnyLogo}, a zero-shot region customizer with remarkable detail consistency, building upon the symbiotic diffusion system with eliminated cumbersome designs. Streamlined as vanilla image generation, we discern that the rigorous signature extraction and creative content generation are promisingly compatible and can be systematically recycled within a single denoising model. In place of the external configurations, the gemini status of the denoising model promote the reinforced subject transmission efficiency and disentangled semantic-signature space with continuous signature decoration. Moreover, the sparse recycling paradigm is adopted to prevent the duplicated risk with compressed transmission quota for diversified signature stimulation. Extensive experiments on constructed logo-level benchmarks demonstrate the effectiveness and practicability of our methods.
- Abstract(参考訳): 拡散モデルは、高スループットの日産生産を促進するために魅力的な進歩を遂げた。
それでも、魅力的なカスタマイズされた要件は、真正性に対するインスタンスレベルの微調整に悩まされている。
以前のゼロショットのカスタマイズ作業は、複雑なモデル構成や主題固有の構成を通じて詳細な低レベルシグネチャに対処しながら、アイデンティティ特徴の凝縮によるセマンティックな構成を実現し、システム全体の統計的コヒーレンスを著しく破壊し、様々なシナリオに適用性を制限する。
そこで本研究では, 共生拡散システム上に構築したゼロショット領域カスタマイズ器である \textbf{AnyLogo} について述べる。
バニラ画像生成としてストリーム化され、厳密なシグネチャ抽出と創造的コンテンツ生成が有望に互換性があり、単一のデノナイジングモデルで体系的にリサイクル可能であることを認識した。
外部構成の代わりに、デノナイジングモデルのgemini状態は、連続的なシグネチャ装飾を伴う強化された被写体伝達効率とアンタングル化されたセマンティック・シグネチャ空間を促進する。
また, このスパースリサイクルのパラダイムを採用して, 信号刺激の多様化を目的とした圧縮送信クォータによる重複リスクを防止する。
ロゴレベルのベンチマークによる大規模な実験は,本手法の有効性と実用性を示すものである。
関連論文リスト
- Continuous Speculative Decoding for Autoregressive Image Generation [33.05392461723613]
連続評価された自己回帰(AR)画像生成モデルは、離散的傾向よりも顕著な優位性を示している。
投機的復号化は大規模言語モデル(LLM)の加速に有効であることが証明された
この研究は離散トークンから連続空間への投機的復号アルゴリズムを一般化する。
論文 参考訳(メタデータ) (2024-11-18T09:19:15Z) - An Effective Deployment of Diffusion LM for Data Augmentation in Low-Resource Sentiment Classification [2.0930389307057427]
感性分類(SC)は、ドメイン固有のコンテキスト、不均衡なラベル分布、少数ショットシナリオなど、低リソースの課題に悩まされることが多い。
我々はDiffusion LMを提案し、強力なラベル関連トークンを再構成することでドメイン内の知識を捕捉し、擬似サンプルを生成する。
論文 参考訳(メタデータ) (2024-09-05T02:51:28Z) - Bridging Generative and Discriminative Models for Unified Visual
Perception with Diffusion Priors [56.82596340418697]
本稿では,豊富な生成前駆体を含む事前学習型安定拡散(SD)モデルと,階層的表現を統合可能な統一型ヘッド(Uヘッド)と,識別前駆体を提供する適応型専門家からなる,シンプルで効果的なフレームワークを提案する。
包括的調査では、異なる時間ステップで潜伏変数に隠された知覚の粒度や様々なU-netステージなど、バーマスの潜在的な特性が明らかになった。
有望な結果は,有望な学習者としての拡散モデルの可能性を示し,情報的かつ堅牢な視覚表現の確立にその意義を定めている。
論文 参考訳(メタデータ) (2024-01-29T10:36:57Z) - Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。
このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。
様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文 参考訳(メタデータ) (2023-08-28T08:47:06Z) - Denoising Diffusion Semantic Segmentation with Mask Prior Modeling [61.73352242029671]
本稿では,従来の識別的アプローチのセマンティックセグメンテーション品質を,デノナイズ拡散生成モデルでモデル化したマスクを用いて改善することを提案する。
市販セグメンタを用いた先行モデルの評価を行い,ADE20KとCityscapesの実験結果から,本手法が競争力のある定量的性能を実現することを示す。
論文 参考訳(メタデータ) (2023-06-02T17:47:01Z) - Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル
GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。
本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T15:32:59Z) - Learning Stationary Markov Processes with Contrastive Adjustment [2.76240219662896]
本稿では,マルコフ遷移カーネルの学習のための新しい最適化アルゴリズムであるエンファンコントラスト適応アルゴリズムを提案する。
コントラスト調整は特定の遷移分布の族に限らず、連続状態空間と離散状態空間の両方でデータをモデル化するのに使うことができる。
コントラスト調整は人-コンピュータ設計プロセスにおいて非常に有用であることを示す。
論文 参考訳(メタデータ) (2023-03-09T18:50:15Z) - Auto-regressive Image Synthesis with Integrated Quantization [55.51231796778219]
本稿では,条件付き画像生成のための多目的フレームワークを提案する。
CNNの帰納バイアスと自己回帰の強力なシーケンスモデリングが組み込まれている。
提案手法は,最先端技術と比較して,優れた多彩な画像生成性能を実現する。
論文 参考訳(メタデータ) (2022-07-21T22:19:17Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。