論文の概要: Image-specific Convolutional Kernel Modulation for Single Image
Super-resolution
- arxiv url: http://arxiv.org/abs/2111.08362v1
- Date: Tue, 16 Nov 2021 11:05:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-17 15:22:33.440823
- Title: Image-specific Convolutional Kernel Modulation for Single Image
Super-resolution
- Title(参考訳): 単一画像超解像のための画像特異的畳み込みカーネル変調
- Authors: Yuanfei Huang, Jie Li, Yanting Hu, Xinbo Gao, Hua Huang
- Abstract要約: 本稿では,新しい画像特異的畳み込み変調カーネル(IKM)を提案する。
我々は、画像や特徴のグローバルな文脈情報を利用して、畳み込みカーネルを適応的に調整するための注意重みを生成する。
単一画像超解像実験により,提案手法は最先端手法よりも優れた性能を示した。
- 参考スコア(独自算出の注目度): 85.09413241502209
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, deep-learning-based super-resolution methods have achieved
excellent performances, but mainly focus on training a single generalized deep
network by feeding numerous samples. Yet intuitively, each image has its
representation, and is expected to acquire an adaptive model. For this issue,
we propose a novel image-specific convolutional kernel modulation (IKM) by
exploiting the global contextual information of image or feature to generate an
attention weight for adaptively modulating the convolutional kernels, which
outperforms the vanilla convolution and several existing attention mechanisms
while embedding into the state-of-the-art architectures without any additional
parameters. Particularly, to optimize our IKM in mini-batch training, we
introduce an image-specific optimization (IsO) algorithm, which is more
effective than the conventional mini-batch SGD optimization. Furthermore, we
investigate the effect of IKM on the state-of-the-art architectures and exploit
a new backbone with U-style residual learning and hourglass dense block
learning, terms U-Hourglass Dense Network (U-HDN), which is an appropriate
architecture to utmost improve the effectiveness of IKM theoretically and
experimentally. Extensive experiments on single image super-resolution show
that the proposed methods achieve superior performances over state-of-the-art
methods. Code is available at github.com/YuanfeiHuang/IKM.
- Abstract(参考訳): 近年,深層学習に基づく超解像法が優れた成果を上げているが,多くのサンプルを投入することで,単一の一般化深層ネットワークの訓練に重点を置いている。
しかし直感的には、各画像は表現を持ち、適応モデルを取得することが期待されている。
本稿では,画像や特徴の全体的文脈情報を利用して,バニラ畳み込みや既存の注意機構よりも優れる畳み込みカーネルを適応的に変調するための注意重みを生成する,新たなイメージ固有畳み込みカーネル変調(ikm)を提案する。
特に、IKMをミニバッチトレーニングで最適化するために、従来のミニバッチSGD最適化よりも効果的である画像固有最適化(IsO)アルゴリズムを導入する。
さらに,最先端アーキテクチャに対するicmの効果を調査し,u型残差学習と砂時計高密度ブロック学習(u-hourglass dense network,u-hdn)を用いた新しいバックボーンを活用し,理論的および実験的にicmの有効性を最大限に高めるための適切なアーキテクチャである。
単一画像の超解像に関する広範囲な実験により,提案手法が最先端手法よりも優れた性能を得られた。
コードはgithub.com/YuanfeiHuang/IKMで入手できる。
関連論文リスト
- Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening [2.874893537471256]
展開融合法は、ディープラーニングの強力な表現能力とモデルベースアプローチの堅牢性を統合する。
本稿では,衛星画像融合のためのモデルに基づく深部展開手法を提案する。
PRISMA、Quickbird、WorldView2データセットの実験結果から、本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-09-04T13:05:00Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - TcGAN: Semantic-Aware and Structure-Preserved GANs with Individual
Vision Transformer for Fast Arbitrary One-Shot Image Generation [11.207512995742999]
画像の内部パッチから学習する生成的敵ネットワークを持つワンショット画像生成(OSG)は、世界中で注目を集めている。
本稿では,既存のワンショット画像生成手法の欠点を克服するために,個々の視覚変換器を用いた構造保存方式TcGANを提案する。
論文 参考訳(メタデータ) (2023-02-16T03:05:59Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - A Unifying Multi-sampling-ratio CS-MRI Framework With Two-grid-cycle
Correction and Geometric Prior Distillation [7.643154460109723]
本稿では,モデルベースと深層学習に基づく手法の利点を融合して,深層展開型マルチサンプリング比CS-MRIフレームワークを提案する。
マルチグリッドアルゴリズムにインスパイアされ、まずCS-MRIに基づく最適化アルゴリズムを補正蒸留方式に組み込む。
各段の圧縮サンプリング比から適応的なステップ長と雑音レベルを学習するために条件モジュールを用いる。
論文 参考訳(メタデータ) (2022-05-14T13:36:27Z) - A Generic Approach for Enhancing GANs by Regularized Latent Optimization [79.00740660219256]
本稿では,事前学習したGANを効果的かつシームレスに拡張できる,エミュレーティブモデル推論と呼ばれる汎用フレームワークを提案する。
我々の基本的な考え方は、ワッサーシュタイン勾配流法を用いて与えられた要求に対する最適潜時分布を効率的に推算することである。
論文 参考訳(メタデータ) (2021-12-07T05:22:50Z) - Optimization-Inspired Learning with Architecture Augmentations and
Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。
フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。
低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2020-12-10T03:24:53Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。