論文の概要: Efficient and Explicit Modelling of Image Hierarchies for Image
Restoration
- arxiv url: http://arxiv.org/abs/2303.00748v1
- Date: Wed, 1 Mar 2023 18:59:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-02 13:35:46.482858
- Title: Efficient and Explicit Modelling of Image Hierarchies for Image
Restoration
- Title(参考訳): 画像復元のための画像階層の効率的かつ明示的なモデリング
- Authors: Yawei Li, Yuchen Fan, Xiaoyu Xiang, Denis Demandolx, Rakesh Ranjan,
Radu Timofte, Luc Van Gool
- Abstract要約: 本研究では,画像復元のためのグローバル,地域,地域領域における画像階層を効率的に,かつ明示的にモデル化する機構を提案する。
そこで本研究では, 空間と時間的複雑性のバランスが良く, 固定されたストライプ自己注意を提案する。
そこで我々はGlobal, Regional, Local Rangeにおける画像階層を明示的にモデル化するGRLと呼ばれる新しいネットワークアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 120.35246456398738
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The aim of this paper is to propose a mechanism to efficiently and explicitly
model image hierarchies in the global, regional, and local range for image
restoration. To achieve that, we start by analyzing two important properties of
natural images including cross-scale similarity and anisotropic image features.
Inspired by that, we propose the anchored stripe self-attention which achieves
a good balance between the space and time complexity of self-attention and the
modelling capacity beyond the regional range. Then we propose a new network
architecture dubbed GRL to explicitly model image hierarchies in the Global,
Regional, and Local range via anchored stripe self-attention, window
self-attention, and channel attention enhanced convolution. Finally, the
proposed network is applied to 7 image restoration types, covering both real
and synthetic settings. The proposed method sets the new state-of-the-art for
several of those. Code will be available at
https://github.com/ofsoundof/GRL-Image-Restoration.git.
- Abstract(参考訳): 本研究の目的は,画像復元のためのグローバル,地域,地域範囲の画像階層を効率的かつ明示的にモデル化するメカニズムを提案することである。
そこで本研究では,自然画像の2つの重要な特性であるクロススケール類似性と異方性画像の特徴を解析した。
そこで本研究では,自己着脱の時間的複雑さと地域範囲を超えたモデリング能力のバランスを両立させるアンカー付きストライプ自己着脱を提案する。
そこで我々は,Global, Regional, Local Rangeにおける画像階層を,アンカー付きストライプ自己アテンション,ウインドウ自己アテンション,チャネルアテンション強化畳み込みにより明示的にモデル化するGRLと呼ばれる新しいネットワークアーキテクチャを提案する。
最後に,提案ネットワークを7種類の画像復元型に適用し,実環境と合成環境の両方をカバーする。
提案手法は, それらの新しい現状を定めている。
コードはhttps://github.com/ofsoundof/GRL-Image-Restoration.gitで入手できる。
関連論文リスト
- Lightweight single-image super-resolution network based on dual paths [0.552480439325792]
ディープラーニングのシングルイメージ超解像(SISR)アルゴリズムには,畳み込みニューラルネットワークとTransformerに基づく2つのモデルがある。
本稿では,2方向相補的畳み込みとトランスフォーマーに基づく,軽量なマルチスケール機能融合ネットワークモデルを提案する。
論文 参考訳(メタデータ) (2024-09-10T15:31:37Z) - Siamese Transformer Networks for Few-shot Image Classification [9.55588609556447]
人間は視覚分類タスクにおいて顕著な熟練度を示し、最小限の例で新しい画像を正確に認識し分類する。
既存の少数の画像分類手法は、大域的特徴と局所的特徴の両方を強調し、両者を統合することを考える研究はほとんどない。
我々は,シームズ変圧器ネットワーク(STN)に基づく新しいアプローチを提案する。
我々の戦略は, 複雑な特徴適応モジュールの必要性を回避し, 画像分類におけるグローバルな特徴と局所的な特徴の可能性を効果的に活用する。
論文 参考訳(メタデータ) (2024-07-16T14:27:23Z) - Hierarchical Dynamic Image Harmonization [15.886047676987316]
本稿では,高効率な画像調和における特徴変換のために,特徴を局所的からグローバル的視点に適応させる階層型動的ネットワーク(HDNet)を提案する。
提案したHDNetは,従来の手法と比較して,モデル全体のパラメータを80%以上削減する。
特に、HDNetはPSNRの4%改善とMSEの19%削減を実現している。
論文 参考訳(メタデータ) (2022-11-16T03:15:19Z) - A Unified Architecture of Semantic Segmentation and Hierarchical
Generative Adversarial Networks for Expression Manipulation [52.911307452212256]
セマンティックセグメンテーションと階層的GANの統一アーキテクチャを開発する。
我々のフレームワークのユニークな利点は、将来的なセマンティックセグメンテーションネットワーク条件を生成モデルに渡すことである。
我々は,AffectNetとRaFDの2つの難解な表情翻訳ベンチマークとセマンティックセグメンテーションベンチマークであるCelebAMask-HQについて評価を行った。
論文 参考訳(メタデータ) (2021-12-08T22:06:31Z) - Towards Unsupervised Deep Image Enhancement with Generative Adversarial
Network [92.01145655155374]
監視されていない画像強調生成ネットワーク(UEGAN)を提案する。
教師なしの方法で所望の特性を持つ画像の集合から、対応する画像と画像のマッピングを学習する。
その結果,提案モデルは画像の美的品質を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:22:46Z) - Feedback Graph Attention Convolutional Network for Medical Image
Enhancement [32.95483574100177]
フィードバックグラフ注意畳み込みネットワーク(FB-GACN)という新しいバイオメディカル画像強調ネットワークを提案する。
重要なイノベーションとして、画像サブリージョンからグラフネットワークを構築することにより、画像のグローバルな構造を考える。
実験の結果,提案アルゴリズムは最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-24T16:46:05Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z) - A U-Net Based Discriminator for Generative Adversarial Networks [86.67102929147592]
GAN(Generative Adversarial Network)のための代替U-Netベースの識別器アーキテクチャを提案する。
提案アーキテクチャにより,合成画像のグローバルコヒーレンスを維持しつつ,画素単位の詳細なフィードバックを生成元に提供することができる。
斬新な判別器は、標準分布と画像品質の指標の観点から、最先端の技術を向上する。
論文 参考訳(メタデータ) (2020-02-28T11:16:54Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。