論文の概要: Parameter-Free Style Projection for Arbitrary Style Transfer
- arxiv url: http://arxiv.org/abs/2003.07694v2
- Date: Tue, 8 Feb 2022 16:54:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 21:49:05.085920
- Title: Parameter-Free Style Projection for Arbitrary Style Transfer
- Title(参考訳): 任意のスタイル転送のためのパラメータフリースタイルプロジェクション
- Authors: Siyu Huang, Haoyi Xiong, Tianyang Wang, Bihan Wen, Qingzhong Wang,
Zeyu Chen, Jun Huan, Dejing Dou
- Abstract要約: 本稿では,パラメータフリー,高速,効果的なコンテンツスタイル変換のための特徴レベル変換手法であるStyle Projectionを提案する。
本稿では、任意の画像スタイルの転送にスタイル投影を利用するリアルタイムフィードフォワードモデルを提案する。
- 参考スコア(独自算出の注目度): 64.06126075460722
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Arbitrary image style transfer is a challenging task which aims to stylize a
content image conditioned on arbitrary style images. In this task the
feature-level content-style transformation plays a vital role for proper fusion
of features. Existing feature transformation algorithms often suffer from loss
of content or style details, non-natural stroke patterns, and unstable
training. To mitigate these issues, this paper proposes a new feature-level
style transformation technique, named Style Projection, for parameter-free,
fast, and effective content-style transformation. This paper further presents a
real-time feed-forward model to leverage Style Projection for arbitrary image
style transfer, which includes a regularization term for matching the semantics
between input contents and stylized outputs. Extensive qualitative analysis,
quantitative evaluation, and user study have demonstrated the effectiveness and
efficiency of the proposed methods.
- Abstract(参考訳): 任意のスタイルの画像に条件付けされたコンテンツイメージをスタイリングすることを目的とした,任意画像スタイルの転送が課題である。
このタスクでは、機能レベルのコンテントスタイルの変換が、機能の適切な融合に重要な役割を果たします。
既存の特徴変換アルゴリズムは、しばしばコンテンツやスタイルの詳細、非自然ストロークパターン、不安定なトレーニングを失う。
そこで本研究では,パラメータフリー,高速,効果的なコンテンツスタイル変換のための特徴レベル変換手法であるStyle Projectionを提案する。
本稿では,入力内容とスタイリッシュ出力のセマンティクスを整合させる正規化項を含む任意の画像スタイル転送に対して,スタイルプロジェクションを利用するリアルタイムフィードフォワードモデルを提案する。
大規模定性分析,定量的評価,ユーザスタディにより,提案手法の有効性と有効性を示した。
関連論文リスト
- StyleInject: Parameter Efficient Tuning of Text-to-Image Diffusion
Models [18.36484757267787]
StyleInject(スタイルインジェクション)は、テキスト・ツー・イメージ・モデルに適した特殊な微調整アプローチである。
入力信号の特性に基づいて視覚特徴のばらつきを調整することで、様々なスタイルに適応する。
これは、コミュニティが調整した様々な高度な生成モデルから学習し、拡張するのに特に有効である。
論文 参考訳(メタデータ) (2024-01-25T04:53:03Z) - Style Aligned Image Generation via Shared Attention [61.121465570763085]
本稿では,一連の生成画像間のスタイルアライメントを確立する技術であるStyleAlignedを紹介する。
拡散過程において、最小限の注意共有を生かして、T2Iモデル内の画像間のスタイル整合性を維持する。
本手法は,多種多様なスタイルやテキストのプロンプトにまたがって評価を行い,高品質で忠実であることを示す。
論文 参考訳(メタデータ) (2023-12-04T18:55:35Z) - A Unified Arbitrary Style Transfer Framework via Adaptive Contrastive
Learning [84.8813842101747]
Unified Contrastive Arbitrary Style Transfer (UCAST)は、新しいスタイルの学習・伝達フレームワークである。
入力依存温度を導入することで,スタイル伝達のための適応型コントラスト学習方式を提案する。
本フレームワークは,スタイル表現とスタイル伝達のための並列コントラスト学習方式,スタイル分布を効果的に学習するためのドメイン拡張モジュール,スタイル伝達のための生成ネットワークという,3つの重要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-03-09T04:35:00Z) - DiffStyler: Controllable Dual Diffusion for Text-Driven Image
Stylization [66.42741426640633]
DiffStylerは、拡散された結果の内容とスタイルのバランスを制御するための二重拡散処理アーキテクチャである。
本稿では、逆復調処理をベースとしたコンテンツ画像に基づく学習可能なノイズを提案し、そのスタイリング結果により、コンテンツ画像の構造情報をよりよく保存する。
論文 参考訳(メタデータ) (2022-11-19T12:30:44Z) - Line Search-Based Feature Transformation for Fast, Stable, and Tunable
Content-Style Control in Photorealistic Style Transfer [26.657485176782934]
フォトリアリスティックなスタイル転送は、ある画像からのコンテンツが他の画像のスタイルに現れるように適応する際に、現実的な外観のイメージを合成するタスクである。
モダンモデルは、コンテンツイメージとスタイルイメージを記述する機能を融合した変換を組み込み、その結果の機能をスタイリングされたイメージにデコードする。
コンテントの保存量と注入スタイルの強度のバランスを制御できる汎用変換を導入する。
論文 参考訳(メタデータ) (2022-10-12T08:05:49Z) - Learning Graph Neural Networks for Image Style Transfer [131.73237185888215]
最先端のパラメトリックおよび非パラメトリックなスタイル転送アプローチは、グローバルな統計アライメントによる局所的なスタイルパターンの歪んだり、パッチミスマッチによるアーティファクトを減らしたりする傾向にある。
本稿では,パラメトリック型と非パラメトリック型の両方のスタイライゼーションの欠如を緩和する,新しい半パラメトリック型ニューラルスタイルトランスファーフレームワークについて検討する。
論文 参考訳(メタデータ) (2022-07-24T07:41:31Z) - Domain Enhanced Arbitrary Image Style Transfer via Contrastive Learning [84.8813842101747]
Contrastive Arbitrary Style Transfer (CAST) は、新しいスタイル表現学習法である。
本フレームワークは,スタイルコード符号化のための多層スタイルプロジェクタ,スタイル分布を効果的に学習するためのドメイン拡張モジュール,画像スタイル転送のための生成ネットワークという,3つのキーコンポーネントから構成される。
論文 参考訳(メタデータ) (2022-05-19T13:11:24Z) - STALP: Style Transfer with Auxiliary Limited Pairing [36.23393954839379]
本稿では,1対のソース画像と,そのスタイリング画像を用いた画像の例ベーススタイリング手法を提案する。
本研究では,対象画像に対するリアルタイムな意味論的スタイル転送が可能な画像翻訳ネットワークの訓練方法を示す。
論文 参考訳(メタデータ) (2021-10-20T11:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。