論文の概要: HSI: A Holistic Style Injector for Arbitrary Style Transfer
- arxiv url: http://arxiv.org/abs/2502.04369v1
- Date: Wed, 05 Feb 2025 09:36:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 14:57:14.244488
- Title: HSI: A Holistic Style Injector for Arbitrary Style Transfer
- Title(参考訳): HSI: 任意型転送のためのホロスティックなスタイルインジェクタ
- Authors: Shuhao Zhang, Hui Kang, Yang Liu, Fang Mei, Hongjuan Li,
- Abstract要約: Holistic Style (HSI) は、ターゲットスタイルの芸術的表現を提供する新しいアテンションスタイル変換モジュールである。
HSIは、スタイル転送の特徴とより一致したグローバルなスタイル表現のみに基づいてスタイリゼーションを行う。
提案手法は, 有効性と効率の両面で最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 8.47567292281412
- License:
- Abstract: Attention-based arbitrary style transfer methods have gained significant attention recently due to their impressive ability to synthesize style details. However, the point-wise matching within the attention mechanism may overly focus on local patterns such that neglect the remarkable global features of style images. Additionally, when processing large images, the quadratic complexity of the attention mechanism will bring high computational load. To alleviate above problems, we propose Holistic Style Injector (HSI), a novel attention-style transformation module to deliver artistic expression of target style. Specifically, HSI performs stylization only based on global style representation that is more in line with the characteristics of style transfer, to avoid generating local disharmonious patterns in stylized images. Moreover, we propose a dual relation learning mechanism inside the HSI to dynamically render images by leveraging semantic similarity in content and style, ensuring the stylized images preserve the original content and improve style fidelity. Note that the proposed HSI achieves linear computational complexity because it establishes feature mapping through element-wise multiplication rather than matrix multiplication. Qualitative and quantitative results demonstrate that our method outperforms state-of-the-art approaches in both effectiveness and efficiency.
- Abstract(参考訳): 近年, 注意に基づく任意のスタイル伝達手法が注目されている。
しかし,注目機構内のポイントワイドマッチングは,スタイルイメージの顕著なグローバルな特徴を無視した局所的なパターンに過度に注目する可能性がある。
さらに、大きな画像を処理する場合、注意機構の二次的な複雑さは高い計算負荷をもたらす。
上記の問題を緩和するために,ターゲットスタイルの芸術的表現を提供する新しいアテンションスタイル変換モジュールであるHSIを提案する。
具体的には、HSIは、スタイル変換の特徴とより一致したグローバルなスタイル表現のみに基づいてスタイリングを行い、スタイリングされた画像の局所的な不調和パターンの生成を避ける。
さらに,HSI内の2つの関係学習機構を提案し,コンテンツとスタイルのセマンティックな類似性を活用して画像の動的レンダリングを行い,スタイリングされた画像が元のコンテンツを保存し,スタイルの忠実性を向上させる。
提案したHSIは、行列乗法ではなく、要素ワイド乗法による特徴写像を確立するため、線形計算複雑性を実現することに留意されたい。
定性的かつ定量的な結果から,本手法は有効性と有効性の両方において最先端の手法より優れていることが示された。
関連論文リスト
- StyleRWKV: High-Quality and High-Efficiency Style Transfer with RWKV-like Architecture [29.178246094092202]
スタイル転送は、スタイルソースの芸術的表現ではなく、コンテンツを保存する新しいイメージを生成することを目的としている。
既存の手法の多くはトランスフォーマーや拡散モデルに基づいているが、2次計算の複雑さと高い推論時間に悩まされている。
本稿では,メモリ使用量と線形時間複雑性を制限した高品質なスタイル転送を実現するための新しいフレームワークであるStyleRWKVを提案する。
論文 参考訳(メタデータ) (2024-12-27T09:01:15Z) - ZePo: Zero-Shot Portrait Stylization with Faster Sampling [61.14140480095604]
本稿では,4つのサンプリングステップでコンテンツとスタイルの融合を実現する拡散モデルに基づく,インバージョンフリーなポートレートスタイリングフレームワークを提案する。
本稿では,一貫性機能における冗長な特徴をマージする機能統合戦略を提案し,注意制御の計算負荷を低減させる。
論文 参考訳(メタデータ) (2024-08-10T08:53:41Z) - ArtWeaver: Advanced Dynamic Style Integration via Diffusion Model [73.95608242322949]
Stylized Text-to-Image Generation (STIG)は、テキストプロンプトとスタイル参照画像から画像を生成することを目的としている。
我々は、事前訓練された安定拡散を利用して、誤解釈スタイルや一貫性のない意味論といった課題に対処する新しいフレームワーク、ArtWeaverを提案する。
論文 参考訳(メタデータ) (2024-05-24T07:19:40Z) - Rethink Arbitrary Style Transfer with Transformer and Contrastive Learning [11.900404048019594]
本稿では,スタイリング画像の品質向上のための革新的手法を提案する。
まず、コンテンツとスタイルの特徴の整合性を改善する手法であるスタイル一貫性インスタンス正規化(SCIN)を提案する。
さらに,様々なスタイル間の関係を理解するために,インスタンスベースのコントラスト学習(ICL)アプローチを開発した。
論文 参考訳(メタデータ) (2024-04-21T08:52:22Z) - A Unified Arbitrary Style Transfer Framework via Adaptive Contrastive
Learning [84.8813842101747]
Unified Contrastive Arbitrary Style Transfer (UCAST)は、新しいスタイルの学習・伝達フレームワークである。
入力依存温度を導入することで,スタイル伝達のための適応型コントラスト学習方式を提案する。
本フレームワークは,スタイル表現とスタイル伝達のための並列コントラスト学習方式,スタイル分布を効果的に学習するためのドメイン拡張モジュール,スタイル伝達のための生成ネットワークという,3つの重要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-03-09T04:35:00Z) - All-to-key Attention for Arbitrary Style Transfer [98.83954812536521]
コンテンツ特徴のそれぞれの位置を,スタイル特徴の安定なキー位置と一致させる,新しいオール・ツー・キーアテンション機構を提案する。
結果、StyA2Kと呼ばれるモジュールは、セマンティック構造を保持し、一貫性のあるスタイルパターンをレンダリングする際、素晴らしいパフォーマンスを示す。
論文 参考訳(メタデータ) (2022-12-08T06:46:35Z) - Learning Graph Neural Networks for Image Style Transfer [131.73237185888215]
最先端のパラメトリックおよび非パラメトリックなスタイル転送アプローチは、グローバルな統計アライメントによる局所的なスタイルパターンの歪んだり、パッチミスマッチによるアーティファクトを減らしたりする傾向にある。
本稿では,パラメトリック型と非パラメトリック型の両方のスタイライゼーションの欠如を緩和する,新しい半パラメトリック型ニューラルスタイルトランスファーフレームワークについて検討する。
論文 参考訳(メタデータ) (2022-07-24T07:41:31Z) - Parameter-Free Style Projection for Arbitrary Style Transfer [64.06126075460722]
本稿では,パラメータフリー,高速,効果的なコンテンツスタイル変換のための特徴レベル変換手法であるStyle Projectionを提案する。
本稿では、任意の画像スタイルの転送にスタイル投影を利用するリアルタイムフィードフォワードモデルを提案する。
論文 参考訳(メタデータ) (2020-03-17T13:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。