論文の概要: Attentive Normalization for Conditional Image Generation
- arxiv url: http://arxiv.org/abs/2004.03828v1
- Date: Wed, 8 Apr 2020 06:12:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 09:03:23.024276
- Title: Attentive Normalization for Conditional Image Generation
- Title(参考訳): 条件付き画像生成のための注意正規化
- Authors: Yi Wang, Ying-Cong Chen, Xiangyu Zhang, Jian Sun, Jiaya Jia
- Abstract要約: 我々は、従来のインスタンス正規化の拡張である注意的正規化(AN)により、長距離依存を特徴づける。
自己注意型GANと比較して、注意的正規化はすべての位置の相関を測る必要がない。
クラス条件の画像生成とセマンティックインパインティングの実験により,提案モジュールの有効性が検証された。
- 参考スコア(独自算出の注目度): 126.08247355367043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional convolution-based generative adversarial networks synthesize
images based on hierarchical local operations, where long-range dependency
relation is implicitly modeled with a Markov chain. It is still not sufficient
for categories with complicated structures. In this paper, we characterize
long-range dependence with attentive normalization (AN), which is an extension
to traditional instance normalization. Specifically, the input feature map is
softly divided into several regions based on its internal semantic similarity,
which are respectively normalized. It enhances consistency between distant
regions with semantic correspondence. Compared with self-attention GAN, our
attentive normalization does not need to measure the correlation of all
locations, and thus can be directly applied to large-size feature maps without
much computational burden. Extensive experiments on class-conditional image
generation and semantic inpainting verify the efficacy of our proposed module.
- Abstract(参考訳): 従来の畳み込みに基づく生成逆数ネットワークは、マルコフ連鎖によって暗黙的に長距離依存性関係がモデル化される階層的局所演算に基づいて画像を生成する。
複雑な構造を持つカテゴリに対してはまだ不十分である。
本稿では,従来のインスタンス正規化の拡張である注意正規化 (an) による長距離依存を特徴付ける。
具体的には、入力特徴マップを、その内部意味的類似性に基づいて、それぞれ正規化された複数の領域にソフト分割する。
意味的対応を伴う遠方の領域間の整合性を高める。
自己アテンションganと比較すると、我々の注意正規化は全ての位置の相関を測定する必要はないので、計算の負担なしに大きな特徴マップに直接適用することができる。
提案するモジュールの有効性を検証するために,クラス条件画像生成とセマンティックインペインティングに関する広範な実験を行った。
関連論文リスト
- EmerDiff: Emerging Pixel-level Semantic Knowledge in Diffusion Models [52.3015009878545]
我々は、追加の訓練をすることなく、きめ細かなセグメンテーションマップを生成できる画像セグメンタを開発した。
低次元特徴写像の空間的位置と画像画素間の意味的対応を同定する。
大規模な実験では、生成したセグメンテーションマップがよく説明され、画像の細部を捉えることが示されている。
論文 参考訳(メタデータ) (2024-01-22T07:34:06Z) - Smooth image-to-image translations with latent space interpolations [64.8170758294427]
マルチドメインイメージ・トゥ・イメージ(I2I)変換は、ターゲットドメインのスタイルに応じてソースイメージを変換することができる。
我々の正規化技術は、最先端のI2I翻訳を大きなマージンで改善できることを示す。
論文 参考訳(メタデータ) (2022-10-03T11:57:30Z) - An attention-driven hierarchical multi-scale representation for visual
recognition [3.3302293148249125]
畳み込みニューラルネットワーク(CNN)は、視覚内容の理解に革命をもたらした。
グラフ畳み込みネットワーク(GCN)を探索することにより,高レベルの長距離依存関係を捕捉する手法を提案する。
本手法は,細粒度と総称的な視覚的分類の両問題を解くのに極めて効果的である。
論文 参考訳(メタデータ) (2021-10-23T09:22:22Z) - Image Synthesis via Semantic Composition [74.68191130898805]
本稿では,その意味的レイアウトに基づいて現実的なイメージを合成する新しい手法を提案する。
類似した外観を持つ物体に対して、類似した表現を共有するという仮説が立てられている。
本手法は, 空間的変化と関連表現の両方を生じる, 外観相関による領域間の依存関係を確立する。
論文 参考訳(メタデータ) (2021-09-15T02:26:07Z) - Spatial and Semantic Consistency Regularizations for Pedestrian
Attribute Recognition [50.932864767867365]
本稿では,各属性に対する空間的および意味的一貫性を実現するために,2つの相補的正規化からなるフレームワークを提案する。
属性の正確な位置に基づいて,本質的および識別的意味的特徴を抽出する意味的整合性正規化を提案する。
その結果,提案手法はパラメータを増大させることなく,最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2021-09-13T03:36:44Z) - ICON: Learning Regular Maps Through Inverse Consistency [19.27928605302463]
画像登録の計算など空間変換の正則性をもたらすものについて検討する。
深いネットワークと逆整合損失とランダム化されたオフグリッド収量は、ほぼ微分同相の空間変換でよく振る舞う。
このアプローチの単純さにもかかわらず、実験は合成データと実データの両方において、明示的な正規化子と競合的な登録性能を慎重に調整せずに正規写像を得ることができるという説得力のある証拠を示している。
論文 参考訳(メタデータ) (2021-05-10T15:52:12Z) - Stride and Translation Invariance in CNNs [2.4213989921339847]
隣接する画素間の十分な類似性が組み合わさることで,ストライドは翻訳不変性に大きな恩恵をもたらすことを示す。
また,グローバル平均プーリング,アンチエイリアス,データ拡張など,他のソリューションの有効性についても検討した。
論文 参考訳(メタデータ) (2021-03-18T09:17:06Z) - HCNet: Hierarchical Context Network for Semantic Segmentation [6.4047628200011815]
本稿では,強い相関関係を持つ同質画素と弱い相関関係を持つ異質画素をモデル化する階層型コンテキストネットワークを提案する。
我々のアプローチでは、平均IoUは82.8%、全体的な精度は91.4%で、CityscapesとISPRS Vaihingenのデータセットは91.4%である。
論文 参考訳(メタデータ) (2020-10-10T09:51:17Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。