Fugu-MT 論文翻訳(概要): QuantArt: Quantizing Image Style Transfer Towards High Visual Fidelity

論文の概要: QuantArt: Quantizing Image Style Transfer Towards High Visual Fidelity

arxiv url: http://arxiv.org/abs/2212.10431v2
Date: Mon, 5 Jun 2023 20:20:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-07 21:15:21.234016
Title: QuantArt: Quantizing Image Style Transfer Towards High Visual Fidelity
Title（参考訳）: QuantArt: 高視力に向けた画像スタイル転送の量子化
Authors: Siyu Huang, Jie An, Donglai Wei, Jiebo Luo, Hanspeter Pfister
Abstract要約: 視覚的忠実度の高いスタイリングのためのQuantArtと呼ばれる新しいスタイル転送フレームワークを提案する。本フレームワークは,既存のスタイル転送方式と比較して,視覚的忠実度を著しく向上させる。
参考スコア（独自算出の注目度）: 94.5479418998225
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The mechanism of existing style transfer algorithms is by minimizing a hybrid loss function to push the generated image toward high similarities in both content and style. However, this type of approach cannot guarantee visual fidelity, i.e., the generated artworks should be indistinguishable from real ones. In this paper, we devise a new style transfer framework called QuantArt for high visual-fidelity stylization. QuantArt pushes the latent representation of the generated artwork toward the centroids of the real artwork distribution with vector quantization. By fusing the quantized and continuous latent representations, QuantArt allows flexible control over the generated artworks in terms of content preservation, style similarity, and visual fidelity. Experiments on various style transfer settings show that our QuantArt framework achieves significantly higher visual fidelity compared with the existing style transfer methods.
Abstract（参考訳）: 既存のスタイル転送アルゴリズムのメカニズムは、ハイブリッド損失関数を最小化し、生成した画像をコンテンツとスタイルの両方において高い類似点へ押し上げることである。しかし、このようなアプローチは視覚の忠実さを保証できない。つまり、生成されたアートワークは実際の作品と区別できない。本稿では,高精細度スタイリングのためのQuantArtと呼ばれる新しいスタイル転送フレームワークを提案する。 QuantArtは、生成したアートワークの潜在表現を、ベクトル量子化による実際のアートワーク分布のセントロイドにプッシュする。量子化および連続的な潜在表現を融合させることで、QuantArtはコンテンツ保存、スタイルの類似性、視覚的忠実度の観点から生成されたアートワークを柔軟に制御できる。様々なスタイル転送設定の実験により、我々のQuantArtフレームワークは既存のスタイル転送方式に比べて、視覚的忠実度が著しく高いことが示されている。

関連論文リスト

Inversion-Free Style Transfer with Dual Rectified Flows [57.02757226679549]
本稿では,2つの修正フローに基づく新しいテキスト変換自由なスタイル転送フレームワークを提案する。提案手法は,コンテントとスタイルのトラジェクトリを並列に予測し,動的中間点を通して融合する。様々なスタイルやコンテンツにまたがる一般化を実証し、効果的かつ効率的なスタイル転送パイプラインを提供する。
論文参考訳（メタデータ） (2025-11-26T02:28:51Z)
Zero-Shot Visual Concept Blending Without Text Guidance [0.0]
視覚概念ブレンディング」は、複数の参照画像の特徴をソース画像に転送するきめ細かい制御を提供する。本手法は, テクスチャ, 形状, 動き, スタイル, 抽象的な概念変換の柔軟な伝達を可能にする。
論文参考訳（メタデータ） (2025-03-27T08:56:33Z)
ZePo: Zero-Shot Portrait Stylization with Faster Sampling [61.14140480095604]
本稿では,4つのサンプリングステップでコンテンツとスタイルの融合を実現する拡散モデルに基づく,インバージョンフリーなポートレートスタイリングフレームワークを提案する。本稿では,一貫性機能における冗長な特徴をマージする機能統合戦略を提案し,注意制御の計算負荷を低減させる。
論文参考訳（メタデータ） (2024-08-10T08:53:41Z)
CreativeSynth: Creative Blending and Synthesis of Visual Arts based on Multimodal Diffusion [74.44273919041912]
大規模なテキスト・画像生成モデルは印象的な進歩を遂げ、高品質な画像を合成する能力を示している。しかし、これらのモデルを芸術的な画像編集に適用することは、2つの重要な課題を提起する。我々は,マルチモーダル入力をコーディネートする拡散モデルに基づく,革新的な統一フレームワークCreative Synthを構築した。
論文参考訳（メタデータ） (2024-01-25T10:42:09Z)
StylerDALLE: Language-Guided Style Transfer Using a Vector-Quantized Tokenizer of a Large-Scale Generative Model [64.26721402514957]
本論文では,自然言語を用いて抽象芸術スタイルを記述するスタイル転送手法であるStylerDALLEを提案する。具体的には、非自己回帰的なトークンシーケンス変換として、言語誘導型転送タスクを定式化する。スタイル情報を組み込むために,CLIPに基づく言語指導による強化学習戦略を提案する。
論文参考訳（メタデータ） (2023-03-16T12:44:44Z)
The Stable Artist: Steering Semantics in Diffusion Latent Space [17.119616029527744]
本稿では,画像生成プロセスのきめ細かい制御を可能にする画像編集手法であるStable Artistを提案する。主要なコンポーネントはセマンティックガイダンス(SEGA)であり、セマンティックな方向の変数数に沿って拡散過程を制御している。 SEGAは、モデルによって学習された概念の表現に関する洞察を得るために、潜在空間の探索を可能にする。
論文参考訳（メタデータ） (2022-12-12T16:21:24Z)
Line Search-Based Feature Transformation for Fast, Stable, and Tunable Content-Style Control in Photorealistic Style Transfer [26.657485176782934]
フォトリアリスティックなスタイル転送は、ある画像からのコンテンツが他の画像のスタイルに現れるように適応する際に、現実的な外観のイメージを合成するタスクである。モダンモデルは、コンテンツイメージとスタイルイメージを記述する機能を融合した変換を組み込み、その結果の機能をスタイリングされたイメージにデコードする。コンテントの保存量と注入スタイルの強度のバランスを制御できる汎用変換を導入する。
論文参考訳（メタデータ） (2022-10-12T08:05:49Z)
CCPL: Contrastive Coherence Preserving Loss for Versatile Style Transfer [58.020470877242865]
我々は,芸術的,写真的,映像的スタイルのトランスファーを共同で行うことができる汎用的なスタイルトランスファー手法を考案した。我々は,グローバル不整合が局所的不整合に支配されているという軽度かつ合理的な仮定を定め,局所的パッチに適用した汎用的コントラストコヒーレンス保存損失(CCPL)を考案する。 CCPLは、スタイル化を低下させることなく、スタイル転送中のコンテンツソースのコヒーレンスを保存することができる。
論文参考訳（メタデータ） (2022-07-11T12:09:41Z)
Interactive Style Transfer: All is Your Palette [74.06681967115594]
本稿では,ユーザが対話的に調和したスタイルのイメージを作成できる,図形的な対話型スタイル転送(IST)手法を提案する。私たちのISTメソッドは、どこからでもブラシやディップスタイルとして機能し、ターゲットのコンテンツイメージの任意の領域にペイントします。
論文参考訳（メタデータ） (2022-03-25T06:38:46Z)
Fine-Grained Control of Artistic Styles in Image Generation [24.524863555822837]
生成モデルと敵の訓練により、様々な芸術様式のアート作品を人工的に生成することが可能になった。スタイルの連続スペクトルを捕捉し,それをスタイル生成タスクに適用することを提案する。我々の手法は、StyleGANのような共通の生成逆ネットワークで利用することができる。
論文参考訳（メタデータ） (2021-10-19T21:51:52Z)
Anisotropic Stroke Control for Multiple Artists Style Transfer [36.92721585146738]
Stroke Control Multi-Artist Style Transferフレームワークを開発した。異方性ストロークモジュール(ASM)は、様々なスタイルで適応的なセマンティック一貫性を持つネットワークを提供する。単一スケールの条件付き識別器とは対照的に,識別器はマルチスケールのテクスチャの手がかりを捉えることができる。
論文参考訳（メタデータ） (2020-10-16T05:32:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。