Fugu-MT 論文翻訳(概要): Style Spectroscope: Improve Interpretability and Controllability through Fourier Analysis

論文の概要: Style Spectroscope: Improve Interpretability and Controllability through Fourier Analysis

arxiv url: http://arxiv.org/abs/2208.06140v1
Date: Fri, 12 Aug 2022 07:15:33 GMT
ステータス: 翻訳完了
システム内更新日: 2022-08-15 13:19:07.544455
Title: Style Spectroscope: Improve Interpretability and Controllability through Fourier Analysis
Title（参考訳）: スタイル分光:フーリエ分析による解釈性と制御性の向上
Authors: Zhiyu Jin and Xuli Shen and Bin Li and Xiangyang Xue
Abstract要約: ユニバーサルスタイル転送(UST)は、任意の参照イメージからコンテンツイメージにスタイルを注入する。既存の手法では実験的な観察を説明できない。周波数領域におけるフレームワークの等価な形式を示す。
参考スコア（独自算出の注目度）: 42.59845771101823
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Universal style transfer (UST) infuses styles from arbitrary reference images into content images. Existing methods, while enjoying many practical successes, are unable of explaining experimental observations, including different performances of UST algorithms in preserving the spatial structure of content images. In addition, methods are limited to cumbersome global controls on stylization, so that they require additional spatial masks for desired stylization. In this work, we provide a systematic Fourier analysis on a general framework for UST. We present an equivalent form of the framework in the frequency domain. The form implies that existing algorithms treat all frequency components and pixels of feature maps equally, except for the zero-frequency component. We connect Fourier amplitude and phase with Gram matrices and a content reconstruction loss in style transfer, respectively. Based on such equivalence and connections, we can thus interpret different structure preservation behaviors between algorithms with Fourier phase. Given the interpretations we have, we propose two manipulations in practice for structure preservation and desired stylization. Both qualitative and quantitative experiments demonstrate the competitive performance of our method against the state-of-the-art methods. We also conduct experiments to demonstrate (1) the abovementioned equivalence, (2) the interpretability based on Fourier amplitude and phase and (3) the controllability associated with frequency components.
Abstract（参考訳）: universal style transfer (ust) は任意の参照画像からコンテンツ画像にスタイルを注入する。既存の手法は、多くの実践的な成功を享受しながらも、コンテンツ画像の空間構造を保存するためにUSTアルゴリズムの異なる性能を含む実験的な観察を説明することができない。さらに,タイマライゼーションの煩雑なグローバルコントロールに制限されているため,スタイリゼーションに空間マスクを追加する必要がある。本研究では,USTの汎用フレームワークについて,系統的なフーリエ解析を行う。周波数領域におけるフレームワークの等価な形式を示す。この形式は、既存のアルゴリズムがゼロ周波数成分を除く全ての周波数成分と特徴写像のピクセルを等しく扱うことを意味する。本研究では,Fourier振幅と位相をそれぞれグラム行列と接続し,スタイル伝達におけるコンテンツ再構成損失を補正する。このような等価性と接続性に基づき、フーリエ位相を持つアルゴリズム間で異なる構造保存挙動を解釈することができる。以上の解釈を前提に,構造保存と所望のスタイライゼーションのための2つの操作を提案する。定性的かつ定量的な実験は,本手法の最先端手法に対する競争性能を示すものである。また,(1)上述の等価性,(2)フーリエ振幅と位相に基づく解釈可能性,(3)周波数成分に関連する制御可能性を示す実験を行った。

関連論文リスト

Image Restoration Learning via Noisy Supervision in the Fourier Domain [22.834414140434884]
ノイズ管理とは、ノイズのあるターゲットで画像復元学習を監督することを指す。これにより、データ収集の負担を軽減し、ディープラーニング技術の実用性を高めることができる。既存の方法には2つの欠点がある。
論文参考訳（メタデータ） (2025-05-31T13:43:56Z)
Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (2025-05-25T12:23:10Z)
Spectral Dictionary Learning for Generative Image Modeling [0.0]
画像合成のためのスペクトル生成モデルを提案する。画像は、一連の学習スペクトル基底関数の線形結合として再構成される。提案手法は, 再現性, 知覚的忠実度の観点から, 競争性能の向上を図っている。
論文参考訳（メタデータ） (2025-04-21T01:11:17Z)
FreSca: Unveiling the Scaling Space in Diffusion Models [52.20473039489599]
拡散モデルは、主にタスク固有の情報をエンコードするノイズ予測と、調整可能なスケーリングを可能にするガイダンスを通じて、画像タスクに対して印象的な制御性を提供する。条件/条件付き雑音予測の違いがキーセマンティック情報を伝達するインバージョンベースの編集から始めることで、この空間を考察する。我々のコアコントリビューションは、ノイズ予測のフーリエ解析に起因し、その低周波成分と高周波成分が拡散を通して異なる進化を遂げていることを明らかにする。この知見に基づいてFreScaを導入し、FreScaはフーリエ領域の異なる周波数帯域に独立してガイダンススケーリングを適用する簡単な方法である。
論文参考訳（メタデータ） (2025-04-02T22:03:11Z)
The Empirical Watershed Wavelet [0.0]
本稿では、周波数領域の任意の分割に基づく2次元経験的ウェーブレットフィルタの構築を可能にする理論的結果を提供する。また,高調波モードと流域変換の位置を推定するために,スケール空間表現を組み合わせて画像スペクトルからそのような分割を検出するアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-24T22:36:43Z)
FourierMamba: Fourier Learning Integration with State Space Models for Image Deraining [71.46369218331215]
Image derainingは雨が降る画像から雨の跡を取り除き、透明な背景を復元することを目的としている。本稿では,FourierMambaという新しいフレームワークを提案する。
論文参考訳（メタデータ） (2024-05-29T18:58:59Z)
HoloNets: Spectral Convolutions do extend to Directed Graphs [59.851175771106625]
従来の知恵は、スペクトル畳み込みネットワークは無向グラフ上にしか展開できないと規定している。ここでは、このグラフフーリエ変換への伝統的な依存が超フルであることを示す。本稿では,新たに開発されたフィルタの周波数応答解釈を行い,フィルタ表現に使用するベースの影響を調査し,ネットワークを基盤とする特性演算子との相互作用について議論する。
論文参考訳（メタデータ） (2023-10-03T17:42:09Z)
A statistically constrained internal method for single image super-resolution [1.2891210250935146]
我々は、SinGANの学習したアップサンプリング手順を制約することにより、事前情報を内部の超解像アプローチに統合する方法を示す。本稿では,フーリエパワースペクトル,カラーヒストグラム,アップサンプリング方式の整合性など,様々な制約について考察する。
論文参考訳（メタデータ） (2023-02-03T10:48:31Z)
Deep Fourier Up-Sampling [100.59885545206744]
フーリエ領域のアップサンプリングは、そのような局所的な性質に従わないため、より難しい。これらの問題を解決するために理論的に健全なDeep Fourier Up-Sampling (FourierUp)を提案する。
論文参考訳（メタデータ） (2022-10-11T06:17:31Z)
Single Stage Virtual Try-on via Deformable Attention Flows [51.70606454288168]
仮想試行は、ショップ内服と基準人物画像が与えられた写真リアルなフィッティング結果を生成することを目的としている。マルチフロー推定に変形性アテンションスキームを適用した,変形性アテンションフロー(DAFlow)を新たに開発した。提案手法は,定性的かつ定量的に最先端の性能を実現する。
論文参考訳（メタデータ） (2022-07-19T10:01:31Z)
Seeing Implicit Neural Representations as Fourier Series [13.216389226310987]
Inlicit Neural Representation (INR)は低次元問題領域における高周波関数を表現するために多層パーセプトロンを使用する。これらの表現は、複雑な3Dオブジェクトやシーンに関連するタスクについて、最先端の結果を得た。この研究は2つの方法間の接続を分析し、フーリエ写像されたパーセプトロンが構造的に1つの隠蔽層SIRENと似ていることを示す。
論文参考訳（メタデータ） (2021-09-01T08:40:20Z)
A Fourier-based Framework for Domain Generalization [82.54650565298418]
ドメインの一般化は、複数のソースドメインから伝達可能な知識を学習して、未確認のターゲットドメインに一般化することでこの問題に対処することを目的としている。本稿では、ドメイン一般化のための新しいフーリエに基づく視点を紹介する。 3つのベンチマーク実験により,提案手法は領域一般化のための最先端性能を実現することができることを示した。
論文参考訳（メタデータ） (2021-05-24T06:50:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。