論文の概要: UMFA: A photorealistic style transfer method based on U-Net and
multi-layer feature aggregation
- arxiv url: http://arxiv.org/abs/2108.06113v1
- Date: Fri, 13 Aug 2021 08:06:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-16 18:40:23.974334
- Title: UMFA: A photorealistic style transfer method based on U-Net and
multi-layer feature aggregation
- Title(参考訳): UMFA:U-Netと多層特徴集合に基づくフォトリアリスティックなスタイル転送手法
- Authors: D.Y. Rao, X.J. Wu, H. Li, J. Kittler, T.Y. Xu
- Abstract要約: 本稿では,フォトリアリスティックなイメージスタイリングの自然な効果を強調するために,フォトリアリスティックなスタイル転送ネットワークを提案する。
特に、高密度ブロックに基づくエンコーダとU-Netの対称構造を形成するデコーダとを連立して、効率的な特徴抽出と画像再構成を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In this paper, we propose a photorealistic style transfer network to
emphasize the natural effect of photorealistic image stylization. In general,
distortion of the image content and lacking of details are two typical issues
in the style transfer field. To this end, we design a novel framework employing
the U-Net structure to maintain the rich spatial clues, with a multi-layer
feature aggregation (MFA) method to simultaneously provide the details obtained
by the shallow layers in the stylization processing. In particular, an encoder
based on the dense block and a decoder form a symmetrical structure of U-Net
are jointly staked to realize an effective feature extraction and image
reconstruction. Besides, a transfer module based on MFA and "adaptive instance
normalization" (AdaIN) is inserted in the skip connection positions to achieve
the stylization. Accordingly, the stylized image possesses the texture of a
real photo and preserves rich content details without introducing any mask or
post-processing steps. The experimental results on public datasets demonstrate
that our method achieves a more faithful structural similarity with a lower
style loss, reflecting the effectiveness and merit of our approach.
- Abstract(参考訳): 本稿では,フォトリアリスティックな画像スタイライゼーションの自然な効果を強調する,フォトリアリスティックなスタイル転送ネットワークを提案する。
一般に、画像内容の歪みと詳細の欠如は、スタイル転送分野における2つの典型的な問題である。
この目的のために,U-Net構造を用いた多層特徴集約(MFA)法を用いて,スタイリング処理において浅層により得られた詳細情報を同時に提供する新しいフレームワークを設計する。
特に、高密度ブロックに基づくエンコーダとU-Netの対称構造を形成するデコーダとを連立して、効率的な特徴抽出と画像再構成を実現する。
また、スタイリゼーションを実現するために、スキップ接続位置にMFAと"adaptive instance normalization"(AdaIN)に基づく転送モジュールを挿入する。
したがって、スタイリッシュな画像は、実際の写真のテクスチャを有し、マスクや後処理工程を導入することなく、リッチなコンテンツ詳細を保持することができる。
公開データセットにおける実験結果は,提案手法の有効性とメリットを反映して,より忠実な構造的類似性と低いスタイル損失を実現することを実証する。
関連論文リスト
- ZePo: Zero-Shot Portrait Stylization with Faster Sampling [61.14140480095604]
本稿では,4つのサンプリングステップでコンテンツとスタイルの融合を実現する拡散モデルに基づく,インバージョンフリーなポートレートスタイリングフレームワークを提案する。
本稿では,一貫性機能における冗長な特徴をマージする機能統合戦略を提案し,注意制御の計算負荷を低減させる。
論文 参考訳(メタデータ) (2024-08-10T08:53:41Z) - A Unified Arbitrary Style Transfer Framework via Adaptive Contrastive
Learning [84.8813842101747]
Unified Contrastive Arbitrary Style Transfer (UCAST)は、新しいスタイルの学習・伝達フレームワークである。
入力依存温度を導入することで,スタイル伝達のための適応型コントラスト学習方式を提案する。
本フレームワークは,スタイル表現とスタイル伝達のための並列コントラスト学習方式,スタイル分布を効果的に学習するためのドメイン拡張モジュール,スタイル伝達のための生成ネットワークという,3つの重要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-03-09T04:35:00Z) - Unsupervised Structure-Consistent Image-to-Image Translation [6.282068591820945]
Swapping Autoencoderは、ディープイメージ操作と画像から画像への変換において最先端のパフォーマンスを達成した。
我々は、勾配反転層に基づく単純で効果的な補助モジュールを導入することにより、この作業を改善する。
補助モジュールの損失は、ジェネレータが全ゼロテクスチャコードでイメージを再構築することを学ぶことを強制する。
論文 参考訳(メタデータ) (2022-08-24T13:47:15Z) - Arbitrary Style Transfer with Structure Enhancement by Combining the
Global and Local Loss [51.309905690367835]
本稿では,グローバルな損失と局所的な損失を組み合わせ,構造拡張を伴う任意のスタイル転送手法を提案する。
実験結果から,視覚効果の優れた高画質画像が生成できることが示唆された。
論文 参考訳(メタデータ) (2022-07-23T07:02:57Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z) - Learning to Compose Hypercolumns for Visual Correspondence [57.93635236871264]
本稿では,画像に条件付けされた関連レイヤを活用することで,動的に効率的な特徴を構成する視覚対応手法を提案する。
提案手法はダイナミックハイパーピクセルフロー(Dynamic Hyperpixel Flow)と呼ばれ,深層畳み込みニューラルネットワークから少数の関連層を選択することにより,高速にハイパーカラム機能を構成することを学習する。
論文 参考訳(メタデータ) (2020-07-21T04:03:22Z) - Region-adaptive Texture Enhancement for Detailed Person Image Synthesis [86.69934638569815]
RATE-Netは、シャープなテクスチャで人物画像を合成するための新しいフレームワークである。
提案するフレームワークは,テクスチャ強化モジュールを利用して,画像から外観情報を抽出する。
DeepFashionベンチマークデータセットで実施された実験は、既存のネットワークと比較して、我々のフレームワークの優位性を実証した。
論文 参考訳(メタデータ) (2020-05-26T02:33:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。