論文の概要: Adaptive Cross-Layer Attention for Image Restoration
- arxiv url: http://arxiv.org/abs/2203.03619v1
- Date: Fri, 4 Mar 2022 22:16:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-10 09:51:53.196041
- Title: Adaptive Cross-Layer Attention for Image Restoration
- Title(参考訳): 画像復元のための適応型クロスレイアアテンション
- Authors: Yancheng Wang, Ning Xu, Chong Chen, Yingzhen Yang
- Abstract要約: 本稿では,CLA(Cross-Layer Attention)モジュールを提案する。
同じレイヤ内で相関するキーピクセルを見つける代わりに、各クエリピクセルは、ネットワークの以前のレイヤのキーピクセルに対応することができる。
さらに,適応型CLA(ACLA)を改良型CLAとして提案する。
- 参考スコア(独自算出の注目度): 10.76998557633559
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Non-local attention module has been proven to be crucial for image
restoration. Conventional non-local attention processes features of each layer
separately, so it risks missing correlation between features among different
layers. To address this problem, we propose Cross-Layer Attention (CLA) module
in this paper. Instead of finding correlated key pixels within the same layer,
each query pixel can attend to key pixels at previous layers of the network. In
order to further enhance the learning capability and reduce the inference cost
of CLA, we further propose Adaptive CLA, or ACLA, as an improved CLA. Two
adaptive designs are proposed for ACLA: 1) adaptively selecting the keys for
non-local attention at each layer; 2) automatically searching for the insertion
locations for ACLA modules. By these two adaptive designs, ACLA dynamically
selects the number of keys to be aggregated for non-local attention at layer.
In addition, ACLA searches for the optimal insert positions of ACLA modules by
a neural architecture search method to render a compact neural network with
compelling performance. Extensive experiments on image restoration tasks,
including single image super-resolution, image denoising, image demosaicing,
and image compression artifacts reduction, validate the effectiveness and
efficiency of ACLA.
- Abstract(参考訳): 非局所注意モジュールは画像復元に不可欠であることが証明されている。
従来の非局所的アテンションプロセスは各レイヤを別々に特徴付けるため、異なるレイヤ間の特徴の相関を欠くリスクがある。
この問題に対処するため,本論文ではクロスレイヤーアテンション(CLA)モジュールを提案する。
同じ層内で相関のあるキーピクセルを見つける代わりに、各クエリピクセルはネットワークの前の層にあるキーピクセルに出席することができる。
さらに,CLAの学習能力の向上と推論コストの削減を目的として,改良型CLAとして適応型CLA(ACLA)を提案する。
ACLAには2つの適応型設計法が提案されている。
1) 各層における非局所的注意のためのキーを適応的に選択すること。
2)ACLAモジュールの挿入位置を自動的に検索する。
これら2つの適応型設計により、ACLAは階層における非局所的な注意のために集約されるキーの数を動的に選択する。
さらに、ACLAはニューラルネットワーク探索法によりACLAモジュールの最適な挿入位置を探索し、コンパクトなニューラルネットワークを魅力的な性能でレンダリングする。
単一画像の超高解像度化、画像のデニュージング、画像のデモサイシング、画像圧縮アーティファクトの削減など、画像復元タスクに関する広範な実験は、aclaの有効性と効率を検証する。
関連論文リスト
- SCAPE: A Simple and Strong Category-Agnostic Pose Estimator [6.705257644513057]
Category-Agnostic Pose Estimation (CAPE) は、任意のカテゴリのオブジェクトにキーポイントをローカライズすることを目的としている。
本稿では,グローバルな意味情報をキーポイントに注入するグローバルなキーポイント機能パーセプタと,キーポイント間のノード間相関を強化するキーポイントアテンションリファクタという2つのキーモジュールを紹介する。
SCAPEは1ショットと5ショット設定で2.2と1.3PCKで先行技術より優れ、推論速度が速く、モデルキャパシティも軽い。
論文 参考訳(メタデータ) (2024-07-18T13:02:57Z) - Simple Drop-in LoRA Conditioning on Attention Layers Will Improve Your Diffusion Model [18.138932199576917]
現在の最先端拡散モデルでは、畳み込み層と(qkv)自己アテンション層を含むU-Netアーキテクチャを採用している。
U-Netアーキテクチャの他の部分を変更したり調整したりすることなく、LoRAコンディショニングをアテンション層に追加するだけで、画像生成の品質が向上することを示す。
論文 参考訳(メタデータ) (2024-05-07T02:45:28Z) - Efficient and Explicit Modelling of Image Hierarchies for Image
Restoration [120.35246456398738]
本研究では,画像復元のためのグローバル,地域,地域領域における画像階層を効率的に,かつ明示的にモデル化する機構を提案する。
そこで本研究では, 空間と時間的複雑性のバランスが良く, 固定されたストライプ自己注意を提案する。
そこで我々はGlobal, Regional, Local Rangeにおける画像階層を明示的にモデル化するGRLと呼ばれる新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-03-01T18:59:29Z) - Bi-directional Feature Reconstruction Network for Fine-Grained Few-Shot
Image Classification [61.411869453639845]
クラス間およびクラス内変動を同時に対応できるバイコンストラクション機構を導入する。
この設計は、モデルがより微妙で差別的な特徴を探索するのに役立つ。
広範に使用されている3つのきめ細かな画像分類データセットに対する実験結果は、一貫して大幅に改善されている。
論文 参考訳(メタデータ) (2022-11-30T16:55:14Z) - Data Augmentation Vision Transformer for Fine-grained Image
Classification [1.6211899643913996]
本稿では,データ拡張に基づくデータ拡張ビジョントランス (DAVT) を提案する。
また,階層的注意選択(HAS)手法を提案し,学習レベル間の識別マーカーの識別能力を向上させる。
実験結果から,CUB-200-2011とStanford Dogsの2つの一般データセットにおける本手法の精度は,従来の主流手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-11-23T11:34:11Z) - Self-supervised Image-specific Prototype Exploration for Weakly
Supervised Semantic Segmentation [72.33139350241044]
画像レベルのラベルをベースとしたWSSS(Weakly Supervised Semantic COCO)は,アノテーションコストの低さから注目されている。
本稿では,画像特異的なプロトタイプ探索 (IPE) と汎用一貫性 (GSC) の喪失からなる画像固有プロトタイプ探索 (SIPE) を提案する。
SIPEは,画像レベルラベルのみを用いて,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-06T09:01:03Z) - Progressive Co-Attention Network for Fine-grained Visual Classification [20.838908090777885]
きめ細かい視覚分類は、同じカテゴリ内の複数のサブカテゴリに属する画像を認識することを目的としている。
既存のほとんどの方法は個々の画像のみを入力とする。
そこで本研究では,pca-net(progressive co-attention network)と呼ばれる効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T10:19:02Z) - Single Image Super-Resolution via a Holistic Attention Network [87.42409213909269]
本稿では,階層,チャネル,位置間の全体的相互依存性をモデル化するための新しい全体論的注意ネットワーク(HAN)を提案する。
提案したHANは階層的特徴を適応的に強調し,層間相関を考慮した。
実験により、提案HANは、最先端の単一画像超解像アプローチに対して好適に機能することが示された。
論文 参考訳(メタデータ) (2020-08-20T04:13:15Z) - Learning to Compose Hypercolumns for Visual Correspondence [57.93635236871264]
本稿では,画像に条件付けされた関連レイヤを活用することで,動的に効率的な特徴を構成する視覚対応手法を提案する。
提案手法はダイナミックハイパーピクセルフロー(Dynamic Hyperpixel Flow)と呼ばれ,深層畳み込みニューラルネットワークから少数の関連層を選択することにより,高速にハイパーカラム機能を構成することを学習する。
論文 参考訳(メタデータ) (2020-07-21T04:03:22Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。