論文の概要: Distribution Aligned Multimodal and Multi-Domain Image Stylization
- arxiv url: http://arxiv.org/abs/2006.01431v1
- Date: Tue, 2 Jun 2020 07:25:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 00:38:28.206461
- Title: Distribution Aligned Multimodal and Multi-Domain Image Stylization
- Title(参考訳): 分布整合型マルチモーダルおよびマルチドメイン画像スタイライゼーション
- Authors: Minxuan Lin, Fan Tang, Weiming Dong, Xiao Li, Chongyang Ma, Changsheng
Xu
- Abstract要約: マルチモーダルおよびマルチドメインスタイル転送のための統一フレームワークを提案する。
提案手法の鍵となるコンポーネントは,新しいスタイル分布アライメントモジュールである。
我々は,様々な芸術様式やジャンルで絵画の様式を伝達する枠組みを検証した。
- 参考スコア(独自算出の注目度): 76.74823384524814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal and multi-domain stylization are two important problems in the
field of image style transfer. Currently, there are few methods that can
perform both multimodal and multi-domain stylization simultaneously. In this
paper, we propose a unified framework for multimodal and multi-domain style
transfer with the support of both exemplar-based reference and randomly sampled
guidance. The key component of our method is a novel style distribution
alignment module that eliminates the explicit distribution gaps between various
style domains and reduces the risk of mode collapse. The multimodal diversity
is ensured by either guidance from multiple images or random style code, while
the multi-domain controllability is directly achieved by using a domain label.
We validate our proposed framework on painting style transfer with a variety of
different artistic styles and genres. Qualitative and quantitative comparisons
with state-of-the-art methods demonstrate that our method can generate
high-quality results of multi-domain styles and multimodal instances with
reference style guidance or random sampled style.
- Abstract(参考訳): マルチモーダルスタイライゼーションとマルチドメインスタイライゼーションは、画像スタイル転送の分野で2つの重要な問題である。
現在、マルチモーダルとマルチドメインの両方のスタイライゼーションを同時に実行できる方法はほとんどない。
本稿では,exemplar-based reference と randomly sampled guidance の両方をサポートするマルチモーダル・マルチドメイン方式トランスファーのための統一フレームワークを提案する。
提案手法の主な構成要素は,様々なスタイル領域間の明示的な分布ギャップを排除し,モード崩壊のリスクを低減する,新しいスタイル分布アライメントモジュールである。
マルチモーダルの多様性は、複数の画像またはランダムなスタイルコードからのガイダンスによって保証され、マルチドメイン制御はドメインラベルを使用して直接達成される。
提案手法は,様々な芸術的スタイルやジャンルを用いて,絵画スタイル転移の枠組みを検証した。
定性的・定量的比較により,マルチドメインスタイルとマルチモーダルインスタンスの良質な結果が,参照スタイルガイダンスやランダムサンプルスタイルで生成できることが証明された。
関連論文リスト
- MuVieCAST: Multi-View Consistent Artistic Style Transfer [6.767885381740952]
モジュール型マルチビュー一貫したスタイル転送ネットワークアーキテクチャである MuVieCAST を紹介する。
MuVieCASTはスパースビューと高密度ビューの両方をサポートし、幅広いマルチビューイメージデータセットを扱うのに十分な汎用性を持つ。
論文 参考訳(メタデータ) (2023-12-08T14:01:03Z) - Generative Powers of Ten [60.6740997942711]
本稿では,複数の画像スケールにまたがる一貫したコンテンツを生成するために,テキスト・ツー・イメージ・モデルを用いる手法を提案する。
マルチスケール拡散サンプリングを共同で行うことで実現した。
本手法は従来の超解像法よりも深いズームレベルを実現する。
論文 参考訳(メタデータ) (2023-12-04T18:59:25Z) - Multi-domain Unsupervised Image-to-Image Translation with Appearance
Adaptive Convolution [62.4972011636884]
本稿では,MDUIT(Multi-domain unsupervised image-to-image translation)フレームワークを提案する。
我々は、分解されたコンテンツ特徴と外観適応的畳み込みを利用して、画像をターゲットの外観に変換する。
提案手法は,最先端の手法と比較して,複数の領域で視覚的に多様かつ妥当な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-02-06T14:12:34Z) - Separating Content and Style for Unsupervised Image-to-Image Translation [20.44733685446886]
教師なしのイメージ・ツー・イメージ翻訳は、2つの視覚領域間のマッピングを未ペアのサンプルで学習することを目的としている。
統合されたフレームワークでコンテンツコードとスタイルコードを同時に分離することを提案する。
潜在機能と高レベルのドメイン不変タスクの相関から,提案手法は優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-27T12:56:50Z) - Anisotropic Stroke Control for Multiple Artists Style Transfer [36.92721585146738]
Stroke Control Multi-Artist Style Transferフレームワークを開発した。
異方性ストロークモジュール(ASM)は、様々なスタイルで適応的なセマンティック一貫性を持つネットワークを提供する。
単一スケールの条件付き識別器とは対照的に,識別器はマルチスケールのテクスチャの手がかりを捉えることができる。
論文 参考訳(メタデータ) (2020-10-16T05:32:26Z) - TSIT: A Simple and Versatile Framework for Image-to-Image Translation [103.92203013154403]
画像間翻訳のためのシンプルで多用途なフレームワークを提案する。
新たに提案した特徴変換を用いた2ストリーム生成モデルを提案する。
これにより、マルチスケールのセマンティック構造情報とスタイル表現を効果的に捕捉し、ネットワークに融合させることができる。
体系的な研究は、提案手法をいくつかの最先端タスク固有のベースラインと比較し、知覚的品質と定量的評価の両面での有効性を検証する。
論文 参考訳(メタデータ) (2020-07-23T15:34:06Z) - Manifold Alignment for Semantically Aligned Style Transfer [61.1274057338588]
我々は,同じ意味領域からの画像特徴が多様体を形成し,複数の意味領域を持つ画像が多次元分布に従うことを仮定する。
この仮定に基づき、スタイル伝達問題は2つの多次元分布の整列として定式化される。
提案したフレームワークは、出力とスタイルイメージの間の意味的に類似した領域を、類似したスタイルパターンを共有することができる。
論文 参考訳(メタデータ) (2020-05-21T16:52:37Z) - Latent Normalizing Flows for Many-to-Many Cross-Domain Mappings [76.85673049332428]
画像とテキストの合同表現の学習は、画像キャプションのようないくつかの重要なドメイン横断タスクのバックボーンを形成する。
ドメイン間の共有情報とドメイン固有の情報を個別にモデル化する,新しい半教師付きフレームワークを提案する。
画像キャプションやテキスト・ツー・イメージ合成など,様々なタスクにおけるモデルの有効性を示す。
論文 参考訳(メタデータ) (2020-02-16T19:49:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。