論文の概要: Inharmonious Region Localization with Auxiliary Style Feature
- arxiv url: http://arxiv.org/abs/2210.02029v1
- Date: Wed, 5 Oct 2022 05:37:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 14:00:17.012907
- Title: Inharmonious Region Localization with Auxiliary Style Feature
- Title(参考訳): 補助的特徴を持つ不調和領域の局在
- Authors: Penghao Wu, Li Niu, Liqing Zhang
- Abstract要約: 不調和領域の局在化は、不調和領域を合成画像でローカライズすることを目的としている。
識別的特徴を抽出する新しいカラーマッピングモジュールとスタイル特徴損失を提案する。
また,抽出したスタイルの特徴に基づいて,不調和領域の局所化を導く新しいスタイル投票モジュールを提案する。
- 参考スコア(独自算出の注目度): 19.146209624835322
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the prevalence of image editing techniques, users can create fantastic
synthetic images, but the image quality may be compromised by the
color/illumination discrepancy between the manipulated region and background.
Inharmonious region localization aims to localize the inharmonious region in a
synthetic image. In this work, we attempt to leverage auxiliary style feature
to facilitate this task. Specifically, we propose a novel color mapping module
and a style feature loss to extract discriminative style features containing
task-relevant color/illumination information. Based on the extracted style
features, we also propose a novel style voting module to guide the localization
of inharmonious region. Moreover, we introduce semantic information into the
style voting module to achieve further improvement. Our method surpasses the
existing methods by a large margin on the benchmark dataset.
- Abstract(参考訳): 画像編集技術の普及により、ユーザは素晴らしい合成画像を作成することができるが、画像の品質は、操作された領域と背景の間の色/照度差によって損なわれる可能性がある。
不調和領域の局在化は、不調和領域を合成画像でローカライズすることを目的としている。
本研究では,この作業を容易にするために補助的なスタイル機能を活用する。
具体的には,新しいカラーマッピングモジュールとスタイル特徴損失を提案し,タスク関連色/輝度情報を含む識別スタイル特徴を抽出する。
また,抽出したスタイルの特徴に基づいて,不調和領域の局所化を導く新しいスタイル投票モジュールを提案する。
さらに,さらに改良を図るために,文体投票モジュールに意味情報を導入する。
提案手法はベンチマークデータセットにおいて,既存の手法をはるかに上回っている。
関連論文リスト
- ZePo: Zero-Shot Portrait Stylization with Faster Sampling [61.14140480095604]
本稿では,4つのサンプリングステップでコンテンツとスタイルの融合を実現する拡散モデルに基づく,インバージョンフリーなポートレートスタイリングフレームワークを提案する。
本稿では,一貫性機能における冗長な特徴をマージする機能統合戦略を提案し,注意制御の計算負荷を低減させる。
論文 参考訳(メタデータ) (2024-08-10T08:53:41Z) - Region-controlled Style Transfer [3.588126599266807]
本研究では,損失関数を用いて異なる領域のスタイル強度を制約する学習手法を提案する。
本手法は,スタイル画像とコンテンツ画像の勾配関係に基づいて,異なる領域におけるスタイル特徴の伝達強度を導出する。
また,その意味的関係を保ちながら,コンテンツ特徴をスタイル特徴に類似するように線形に変換する新たな特徴融合手法を提案する。
論文 参考訳(メタデータ) (2023-10-24T09:11:34Z) - Locally Stylized Neural Radiance Fields [30.037649804991315]
局所的なスタイル伝達に基づくニューラルレイディアンスフィールド(NeRF)のスタイリングフレームワークを提案する。
特に、ハッシュグリッド符号化を用いて外観や幾何学的要素の埋め込みを学習する。
提案手法は, 新規なビュー合成により, 可視なスタイリゼーション結果が得られることを示す。
論文 参考訳(メタデータ) (2023-09-19T15:08:10Z) - Any-to-Any Style Transfer: Making Picasso and Da Vinci Collaborate [58.83278629019384]
スタイル転送は、コンテンツ参照のために、ある画像のスタイルを他の画像へのスタイル参照にレンダリングすることを目的としている。
既存のアプローチでは、スタイルイメージの全体的スタイルをグローバルな方法で適用するか、あるいは、スタイルイメージのローカル色とテクスチャを、事前に定義された方法でコンテンツに移行するかのいずれかである。
本稿では,Any-to-Any Style Transferを提案する。Any-to-Any Style Transferは,スタイル画像中の領域のスタイルを対話的に選択し,所定のコンテンツ領域に適用することができる。
論文 参考訳(メタデータ) (2023-04-19T15:15:36Z) - Inharmonious Region Localization by Magnifying Domain Discrepancy [18.661683923953085]
不調和領域の局在化は、周囲の背景と相容れない合成画像における領域の局在化を目的としている。
本研究では,入力画像が別の色空間に変換され,不調和領域と背景領域との領域差が増大する傾向にある。
カラーマッピングモジュールと不調和領域ローカライゼーションネットワークからなる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-30T10:41:16Z) - Image Harmonization with Region-wise Contrastive Learning [51.309905690367835]
本稿では,外部スタイルの融合と領域単位のコントラスト学習方式を備えた新しい画像調和フレームワークを提案する。
提案手法は, 前景と背景の相互情報を最大化することにより, 対応する正と負のサンプルをまとめることを試みる。
論文 参考訳(メタデータ) (2022-05-27T15:46:55Z) - Domain Enhanced Arbitrary Image Style Transfer via Contrastive Learning [84.8813842101747]
Contrastive Arbitrary Style Transfer (CAST) は、新しいスタイル表現学習法である。
本フレームワークは,スタイルコード符号化のための多層スタイルプロジェクタ,スタイル分布を効果的に学習するためのドメイン拡張モジュール,画像スタイル転送のための生成ネットワークという,3つのキーコンポーネントから構成される。
論文 参考訳(メタデータ) (2022-05-19T13:11:24Z) - Style Transfer with Target Feature Palette and Attention Coloring [15.775618544581885]
特徴パレットをターゲットとした新しい芸術的スタイル化手法を提案し,重要な特徴を正確に伝達することができる。
このスタイリング画像は、コア構造とコンテンツ画像の詳細の保存に長けながら、最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-11-07T08:09:20Z) - Towards Controllable and Photorealistic Region-wise Image Manipulation [11.601157452472714]
地域ごとのスタイル操作のための自動エンコーダアーキテクチャを用いた生成モデルを提案する。
我々は、コンテンツとスタイルの潜在表現の明示的な乱れを強制するために、コード一貫性の損失を適用します。
このモデルは、前景編集が背景コンテンツに干渉しないように、コンテンツアライメント損失によって制約される。
論文 参考訳(メタデータ) (2021-08-19T13:29:45Z) - Drafting and Revision: Laplacian Pyramid Network for Fast High-Quality
Artistic Style Transfer [115.13853805292679]
アートスタイルの転送は、サンプルイメージからコンテンツイメージへのスタイルの移行を目的としている。
図案作成と細部改訂の共通画法に触発されて,ラプラシアンピラミッドネットワーク(LapStyle)という新しいフィードフォワード方式を導入する。
本手法は, 定型的パターンを適切に伝達した高品質なスタイリズド画像をリアルタイムで合成する。
論文 参考訳(メタデータ) (2021-04-12T11:53:53Z) - Manifold Alignment for Semantically Aligned Style Transfer [61.1274057338588]
我々は,同じ意味領域からの画像特徴が多様体を形成し,複数の意味領域を持つ画像が多次元分布に従うことを仮定する。
この仮定に基づき、スタイル伝達問題は2つの多次元分布の整列として定式化される。
提案したフレームワークは、出力とスタイルイメージの間の意味的に類似した領域を、類似したスタイルパターンを共有することができる。
論文 参考訳(メタデータ) (2020-05-21T16:52:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。