論文の概要: StyleGallery: Training-free and Semantic-aware Personalized Style Transfer from Arbitrary Image References
- arxiv url: http://arxiv.org/abs/2603.10354v1
- Date: Wed, 11 Mar 2026 03:05:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:32.756169
- Title: StyleGallery: Training-free and Semantic-aware Personalized Style Transfer from Arbitrary Image References
- Title(参考訳): StyleGallery: 任意画像参照からのトレーニング不要でセマンティックなパーソナライズされたスタイル転送
- Authors: Boyu He, Yunfan Ye, Chang Liu, Weishang Wu, Fang Liu, Zhiping Cai,
- Abstract要約: StyleGalleryは、スタイル転送のためのトレーニング不要でセマンティックなフレームワークである。
任意の参照イメージを入力としてサポートし、効果的にパーソナライズされたカスタマイズを可能にする。
コンテンツ構造保存、地域スタイル化、解釈可能性、パーソナライズされたカスタマイズにおいて、最先端の手法よりも優れています。
- 参考スコア(独自算出の注目度): 31.20742897872013
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the advancements in diffusion-based image style transfer, existing methods are commonly limited by 1) semantic gap: the style reference could miss proper content semantics, causing uncontrollable stylization; 2) reliance on extra constraints (e.g., semantic masks) restricting applicability; 3) rigid feature associations lacking adaptive global-local alignment, failing to balance fine-grained stylization and global content preservation. These limitations, particularly the inability to flexibly leverage style inputs, fundamentally restrict style transfer in terms of personalization, accuracy, and adaptability. To address these, we propose StyleGallery, a training-free and semantic-aware framework that supports arbitrary reference images as input and enables effective personalized customization. It comprises three core stages: semantic region segmentation (adaptive clustering on latent diffusion features to divide regions without extra inputs); clustered region matching (block filtering on extracted features for precise alignment); and style transfer optimization (energy function-guided diffusion sampling with regional style loss to optimize stylization). Experiments on our introduced benchmark demonstrate that StyleGallery outperforms state-of-the-art methods in content structure preservation, regional stylization, interpretability, and personalized customization, particularly when leveraging multiple style references.
- Abstract(参考訳): 拡散型画像スタイル転送の進歩にもかかわらず、既存の手法は一般的に制限される。
1) セマンティックギャップ: スタイル参照は適切なコンテンツセマンティクスを見逃し、制御不能なスタイリゼーションを引き起こす可能性がある。
2) 適用性を制限する余分な制約(例えば,セマンティックマスク)に依存すること
3) 適応的グローバルなアライメントが欠如し, 微粒化とグローバルなコンテンツ保存のバランスが取れなかった。
これらの制限、特にスタイル入力を柔軟に活用できないことは、パーソナライズ、正確性、適応性の点で基本的にスタイル転送を制限している。
そこで我々は、任意の参照イメージを入力としてサポートし、効果的なパーソナライズされたカスタマイズを可能にする、トレーニング不要でセマンティックなフレームワークであるStyleGalleryを提案する。
セマンティック領域セグメンテーション(余分な入力なしで領域を分割するための遅延拡散特徴の適応クラスタリング)、クラスタ化された領域マッチング(正確なアライメントのために抽出された特徴のブロックフィルタリング)、スタイル転送最適化(スタイル化を最適化するために、地域スタイルの損失を伴うエネルギー関数誘導拡散サンプリング)である。
紹介したベンチマーク実験により、StyleGalleryはコンテンツ構造保存、地域スタイリゼーション、解釈可能性、パーソナライズされたカスタマイズにおいて、特に複数のスタイル参照を活用する場合において、最先端の手法よりも優れていることが示された。
関連論文リスト
- Balanced Image Stylization with Style Matching Score [36.542802101359705]
Style Matching Score (SMS) は拡散モデルを用いた画像スタイリングの新しい最適化手法である。
SMSはスタイルのアライメントとコンテンツ保存のバランスを保ち、最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2025-03-10T17:58:02Z) - Z-STAR+: A Zero-shot Style Transfer Method via Adjusting Style Distribution [24.88532732093652]
スタイル転送は重要な課題であり、主に適切なスタイル表現を特定することに焦点を当てている。
既存の手法とは対照的に,バニラ拡散モデルにおける潜在的特徴が自然的スタイルや内容分布を本質的に含んでいることが判明した。
提案手法では,コンテンツ参照とスタイル参照を遅延空間で表現するために,デュアル・デノナイズ・パスを採用し,その後,スタイル遅延符号を用いたコンテントイメージ・デノナイズ・プロセスの導出を行う。
論文 参考訳(メタデータ) (2024-11-28T15:56:17Z) - InstantStyle-Plus: Style Transfer with Content-Preserving in Text-to-Image Generation [4.1177497612346]
スタイル転送(Style Transfer)は、視覚的なスタイルを取り入れながら、オリジナルの本質を維持するイメージを作成するために設計された革新的なプロセスである。
InstantStyle-Plusは、ターゲットスタイルをシームレスに統合しながら、オリジナルコンテンツの整合性を優先するアプローチである。
論文 参考訳(メタデータ) (2024-06-30T18:05:33Z) - ParaGuide: Guided Diffusion Paraphrasers for Plug-and-Play Textual Style
Transfer [57.6482608202409]
テキストスタイル転送は、意味を保ちながらテキストのスタイル特性を変換するタスクである。
任意のスタイルに柔軟に適応できる汎用型転送のための新しい拡散型フレームワークを提案する。
本研究では,人的評価と自動評価の両面から,Enron Email Corpusの手法を検証するとともに,形式性,感情,さらにはオーサシップスタイルの伝達にも優れることを示す。
論文 参考訳(メタデータ) (2023-08-29T17:36:02Z) - Any-to-Any Style Transfer: Making Picasso and Da Vinci Collaborate [58.83278629019384]
スタイル転送は、コンテンツ参照のために、ある画像のスタイルを他の画像へのスタイル参照にレンダリングすることを目的としている。
既存のアプローチでは、スタイルイメージの全体的スタイルをグローバルな方法で適用するか、あるいは、スタイルイメージのローカル色とテクスチャを、事前に定義された方法でコンテンツに移行するかのいずれかである。
本稿では,Any-to-Any Style Transferを提案する。Any-to-Any Style Transferは,スタイル画像中の領域のスタイルを対話的に選択し,所定のコンテンツ領域に適用することができる。
論文 参考訳(メタデータ) (2023-04-19T15:15:36Z) - Manifold Alignment for Semantically Aligned Style Transfer [61.1274057338588]
我々は,同じ意味領域からの画像特徴が多様体を形成し,複数の意味領域を持つ画像が多次元分布に従うことを仮定する。
この仮定に基づき、スタイル伝達問題は2つの多次元分布の整列として定式化される。
提案したフレームワークは、出力とスタイルイメージの間の意味的に類似した領域を、類似したスタイルパターンを共有することができる。
論文 参考訳(メタデータ) (2020-05-21T16:52:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。