論文の概要: GridFormer: Residual Dense Transformer with Grid Structure for Image Restoration in Adverse Weather Conditions
- arxiv url: http://arxiv.org/abs/2305.17863v2
- Date: Fri, 21 Jun 2024 07:46:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-24 20:47:12.360178
- Title: GridFormer: Residual Dense Transformer with Grid Structure for Image Restoration in Adverse Weather Conditions
- Title(参考訳): GridFormer: 逆気象条件における画像復元のためのグリッド構造を有する残差変換器
- Authors: Tao Wang, Kaihao Zhang, Ziqian Shao, Wenhan Luo, Bjorn Stenger, Tong Lu, Tae-Kyun Kim, Wei Liu, Hongdong Li,
- Abstract要約: 我々はGridFormerと呼ばれる新しいトランスフォーマーベースのフレームワークを提案する。
GridFormerは、悪天候下でのイメージ復元のバックボーンとして機能する。
このフレームワークは5つの多様な画像復元タスクに対して最先端の結果を達成する。
- 参考スコア(独自算出の注目度): 97.45751035126548
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image restoration in adverse weather conditions is a difficult task in computer vision. In this paper, we propose a novel transformer-based framework called GridFormer which serves as a backbone for image restoration under adverse weather conditions. GridFormer is designed in a grid structure using a residual dense transformer block, and it introduces two core designs. First, it uses an enhanced attention mechanism in the transformer layer. The mechanism includes stages of the sampler and compact self-attention to improve efficiency, and a local enhancement stage to strengthen local information. Second, we introduce a residual dense transformer block (RDTB) as the final GridFormer layer. This design further improves the network's ability to learn effective features from both preceding and current local features. The GridFormer framework achieves state-of-the-art results on five diverse image restoration tasks in adverse weather conditions, including image deraining, dehazing, deraining \& dehazing, desnowing, and multi-weather restoration. The source code and pre-trained models are available at https://github.com/TaoWangzj/GridFormer.
- Abstract(参考訳): 悪天候下での画像復元はコンピュータビジョンでは難しい課題である。
本稿では,悪天候下での画像復元のバックボーンとして機能するGridFormerというトランスフォーマーベースの新しいフレームワークを提案する。
GridFormerは高密度トランスブロックを使ってグリッド構造を設計し、2つのコア設計を導入している。
まず、トランス層に強化されたアテンション機構を使用する。
この機構は、サンプリング装置のステージと、効率を向上させるためのコンパクトな自己アテンションと、ローカル情報を強化するローカルエンハンスメントステージとを含む。
次に,最後のGridFormer層として高密度変圧器ブロック(RDTB)を導入する。
この設計により、前と現在の両方のローカル特徴から効果的な特徴を学習するネットワークの能力はさらに向上する。
GridFormerフレームワークは、画像のデアライニング、デアライジング、デアライジング、デアライジング、マルチウェザー修復など、悪天候下での5つのさまざまなイメージ復元タスクに対して、最先端の成果を達成する。
ソースコードと事前訓練されたモデルはhttps://github.com/TaoWangzj/GridFormer.comで入手できる。
関連論文リスト
- MWFormer: Multi-Weather Image Restoration Using Degradation-Aware Transformers [44.600209414790854]
悪天候下で撮影された画像の復元は、多くのコンピュータビジョンアプリケーションにとって基本的な課題である。
本稿では,マルチウェザー変換器 (MWFormer) を提案する。
MWFormerは,既存の最先端手法と比較して,大幅な性能向上を実現していることを示す。
論文 参考訳(メタデータ) (2024-11-26T08:47:39Z) - Joint multi-dimensional dynamic attention and transformer for general image restoration [14.987034136856463]
屋外のイメージは 雨や迷路、騒音などによって 深刻な劣化に苦しむことが多い
現在の画像復元法は、効率を保ちながら複雑な劣化を扱うのに苦労している。
本稿では,多次元動的注意と自己注意を組み合わせた新しい画像復元アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-11-12T15:58:09Z) - SwinStyleformer is a favorable choice for image inversion [2.8115030277940947]
本稿では,SwinStyleformerと呼ばれるトランスフォーマー構造インバージョンネットワークを提案する。
実験の結果、トランスフォーマーのバックボーンによるインバージョンネットワークは、画像の反転に成功しなかった。
論文 参考訳(メタデータ) (2024-06-19T02:08:45Z) - Segmentation Guided Sparse Transformer for Under-Display Camera Image
Restoration [91.65248635837145]
Under-Display Camera(UDC)は、ディスプレイパネルの下にカメラを隠してフルスクリーン表示を実現する新興技術である。
本稿では,UDC 画像復元に Vision Transformer を用いることで,大量の冗長情報やノイズを大域的注目度で検出する。
UDC劣化画像から高品質な画像を復元するためのガイドスパース変換器(SGSFormer)を提案する。
論文 参考訳(メタデータ) (2024-03-09T13:11:59Z) - Gradient Adjusting Networks for Domain Inversion [82.72289618025084]
StyleGAN2はセマンティック編集をサポートする強力な画像生成エンジンであることが実証された。
本稿では,画像毎の最適化手法を提案する。この手法は,生成元の重みを局所的に編集できるように,StyleGAN2ジェネレータをチューニングする。
我々の実験は、この非常にアクティブな領域における最先端技術よりも大きなパフォーマンス差を示している。
論文 参考訳(メタデータ) (2023-02-22T14:47:57Z) - RePre: Improving Self-Supervised Vision Transformer with Reconstructive
Pre-training [80.44284270879028]
本稿では,Reconstructive Pre-Training (RePre) を用いて,局所特徴学習を自己教師型視覚変換器に組み込む。
我々のRePreは、既存のコントラストの目的と平行して生画像のピクセルを再構成するブランチを追加することで、コントラストのフレームワークを拡張します。
論文 参考訳(メタデータ) (2022-01-18T10:24:58Z) - U2-Former: A Nested U-shaped Transformer for Image Restoration [30.187257111046556]
U2-Formerと呼ばれる画像復元のための深く効果的なトランスフォーマーネットワークを提案する。
コア操作としてTransformerを使用して、ディープエンコーディングとデコード空間でイメージ復元を行うことができる。
論文 参考訳(メタデータ) (2021-12-04T08:37:04Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - Uformer: A General U-Shaped Transformer for Image Restoration [47.60420806106756]
画像復元のためにTransformerブロックを用いた階層型エンコーダデコーダネットワークを構築した。
いくつかの画像復元タスクの実験は、Uformerの優位性を示している。
論文 参考訳(メタデータ) (2021-06-06T12:33:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。