論文の概要: Adaptive Cross-Layer Attention for Image Restoration
- arxiv url: http://arxiv.org/abs/2203.03619v3
- Date: Tue, 18 Apr 2023 21:41:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-20 18:28:39.440976
- Title: Adaptive Cross-Layer Attention for Image Restoration
- Title(参考訳): 画像復元のための適応型クロスレイアアテンション
- Authors: Yancheng Wang, Ning Xu, Yingzhen Yang
- Abstract要約: 非局所的な注意プロセスは各レイヤの特徴を別々に扱うため、異なるレイヤ間の特徴の相関を欠くリスクがある。
本稿では,新しいアダプティブ・クロスレイア・アテンション(ACLA)モジュールを提案する。
1) 各層における非局所的注意のためのキーを適応的に選択すること,(2)ACLAモジュールの挿入位置を自動的に検索すること,の2つの適応設計を提案する。
- 参考スコア(独自算出の注目度): 10.795382525098917
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Non-local attention module has been proven to be crucial for image
restoration. Conventional non-local attention processes features of each layer
separately, so it risks missing correlation between features among different
layers. To address this problem, we aim to design attention modules that
aggregate information from different layers. Instead of finding correlated key
pixels within the same layer, each query pixel is encouraged to attend to key
pixels at multiple previous layers of the network. In order to efficiently
embed such attention design into neural network backbones, we propose a novel
Adaptive Cross-Layer Attention (ACLA) module. Two adaptive designs are proposed
for ACLA: (1) adaptively selecting the keys for non-local attention at each
layer; (2) automatically searching for the insertion locations for ACLA
modules. By these two adaptive designs, ACLA dynamically selects a flexible
number of keys to be aggregated for non-local attention at previous layer while
maintaining a compact neural network with compelling performance. Extensive
experiments on image restoration tasks, including single image
super-resolution, image denoising, image demosaicing, and image compression
artifacts reduction, validate the effectiveness and efficiency of ACLA. The
code of ACLA is available at \url{https://github.com/SDL-ASU/ACLA}.
- Abstract(参考訳): 非局所注意モジュールは画像復元に不可欠であることが証明されている。
従来の非局所的アテンションプロセスは各レイヤを別々に特徴付けるため、異なるレイヤ間の特徴の相関を欠くリスクがある。
この問題に対処するために、異なるレイヤから情報を集約するアテンションモジュールを設計することを目的とする。
同じ層内で相関のあるキーピクセルを見つける代わりに、各クエリピクセルは、ネットワークの複数のレイヤでキーピクセルに出席することが推奨される。
このような注意設計をニューラルネットワークのバックボーンに効率的に組み込むために,新しい適応的クロスレイヤーアテンション(acla)モジュールを提案する。
1) 各層における非局所的注意のためのキーを適応的に選択すること,(2)ACLAモジュールの挿入位置を自動的に検索すること,の2つの適応設計を提案する。
これら2つの適応設計により、ACLAは、魅力的な性能を持つコンパクトニューラルネットワークを維持しながら、前層の非局所的な注意のために集約されるキーのフレキシブルな数を動的に選択する。
単一画像の超高解像度化、画像のデニュージング、画像のデモサイシング、画像圧縮アーティファクトの削減など、画像復元タスクに関する広範な実験は、aclaの有効性と効率を検証する。
ACLAのコードは \url{https://github.com/SDL-ASU/ACLA} で公開されている。
関連論文リスト
- SCAPE: A Simple and Strong Category-Agnostic Pose Estimator [6.705257644513057]
Category-Agnostic Pose Estimation (CAPE) は、任意のカテゴリのオブジェクトにキーポイントをローカライズすることを目的としている。
本稿では,グローバルな意味情報をキーポイントに注入するグローバルなキーポイント機能パーセプタと,キーポイント間のノード間相関を強化するキーポイントアテンションリファクタという2つのキーモジュールを紹介する。
SCAPEは1ショットと5ショット設定で2.2と1.3PCKで先行技術より優れ、推論速度が速く、モデルキャパシティも軽い。
論文 参考訳(メタデータ) (2024-07-18T13:02:57Z) - Simple Drop-in LoRA Conditioning on Attention Layers Will Improve Your Diffusion Model [18.138932199576917]
現在の最先端拡散モデルでは、畳み込み層と(qkv)自己アテンション層を含むU-Netアーキテクチャを採用している。
U-Netアーキテクチャの他の部分を変更したり調整したりすることなく、LoRAコンディショニングをアテンション層に追加するだけで、画像生成の品質が向上することを示す。
論文 参考訳(メタデータ) (2024-05-07T02:45:28Z) - Efficient and Explicit Modelling of Image Hierarchies for Image
Restoration [120.35246456398738]
本研究では,画像復元のためのグローバル,地域,地域領域における画像階層を効率的に,かつ明示的にモデル化する機構を提案する。
そこで本研究では, 空間と時間的複雑性のバランスが良く, 固定されたストライプ自己注意を提案する。
そこで我々はGlobal, Regional, Local Rangeにおける画像階層を明示的にモデル化するGRLと呼ばれる新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-03-01T18:59:29Z) - Bi-directional Feature Reconstruction Network for Fine-Grained Few-Shot
Image Classification [61.411869453639845]
クラス間およびクラス内変動を同時に対応できるバイコンストラクション機構を導入する。
この設計は、モデルがより微妙で差別的な特徴を探索するのに役立つ。
広範に使用されている3つのきめ細かな画像分類データセットに対する実験結果は、一貫して大幅に改善されている。
論文 参考訳(メタデータ) (2022-11-30T16:55:14Z) - Data Augmentation Vision Transformer for Fine-grained Image
Classification [1.6211899643913996]
本稿では,データ拡張に基づくデータ拡張ビジョントランス (DAVT) を提案する。
また,階層的注意選択(HAS)手法を提案し,学習レベル間の識別マーカーの識別能力を向上させる。
実験結果から,CUB-200-2011とStanford Dogsの2つの一般データセットにおける本手法の精度は,従来の主流手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-11-23T11:34:11Z) - Self-supervised Image-specific Prototype Exploration for Weakly
Supervised Semantic Segmentation [72.33139350241044]
画像レベルのラベルをベースとしたWSSS(Weakly Supervised Semantic COCO)は,アノテーションコストの低さから注目されている。
本稿では,画像特異的なプロトタイプ探索 (IPE) と汎用一貫性 (GSC) の喪失からなる画像固有プロトタイプ探索 (SIPE) を提案する。
SIPEは,画像レベルラベルのみを用いて,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-06T09:01:03Z) - Progressive Co-Attention Network for Fine-grained Visual Classification [20.838908090777885]
きめ細かい視覚分類は、同じカテゴリ内の複数のサブカテゴリに属する画像を認識することを目的としている。
既存のほとんどの方法は個々の画像のみを入力とする。
そこで本研究では,pca-net(progressive co-attention network)と呼ばれる効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T10:19:02Z) - Single Image Super-Resolution via a Holistic Attention Network [87.42409213909269]
本稿では,階層,チャネル,位置間の全体的相互依存性をモデル化するための新しい全体論的注意ネットワーク(HAN)を提案する。
提案したHANは階層的特徴を適応的に強調し,層間相関を考慮した。
実験により、提案HANは、最先端の単一画像超解像アプローチに対して好適に機能することが示された。
論文 参考訳(メタデータ) (2020-08-20T04:13:15Z) - Learning to Compose Hypercolumns for Visual Correspondence [57.93635236871264]
本稿では,画像に条件付けされた関連レイヤを活用することで,動的に効率的な特徴を構成する視覚対応手法を提案する。
提案手法はダイナミックハイパーピクセルフロー(Dynamic Hyperpixel Flow)と呼ばれ,深層畳み込みニューラルネットワークから少数の関連層を選択することにより,高速にハイパーカラム機能を構成することを学習する。
論文 参考訳(メタデータ) (2020-07-21T04:03:22Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。