論文の概要: Sebica: Lightweight Spatial and Efficient Bidirectional Channel Attention Super Resolution Network
- arxiv url: http://arxiv.org/abs/2410.20546v1
- Date: Sun, 27 Oct 2024 18:27:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:21:22.505781
- Title: Sebica: Lightweight Spatial and Efficient Bidirectional Channel Attention Super Resolution Network
- Title(参考訳): Sebica: 軽量で高効率な双方向チャネルアテンションスーパーレゾリューションネットワーク
- Authors: Chongxiao Liu,
- Abstract要約: SISR(Single Image Super-Resolution)は,低解像度画像の画質向上のための重要な技術である。
本稿では,空間的および効率的な双方向チャネルアテンション機構を組み込んだ軽量ネットワークSebicaを提案する。
セビカは高い復元品質を維持しながら計算コストを大幅に削減する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Single Image Super-Resolution (SISR) is a vital technique for improving the visual quality of low-resolution images. While recent deep learning models have made significant advancements in SISR, they often encounter computational challenges that hinder their deployment in resource-limited or time-sensitive environments. To overcome these issues, we present Sebica, a lightweight network that incorporates spatial and efficient bidirectional channel attention mechanisms. Sebica significantly reduces computational costs while maintaining high reconstruction quality, achieving PSNR/SSIM scores of 28.29/0.7976 and 30.18/0.8330 on the Div2K and Flickr2K datasets, respectively. These results surpass most baseline lightweight models and are comparable to the highest-performing model, but with only 17% and 15% of the parameters and GFLOPs. Additionally, our small version of Sebica has only 7.9K parameters and 0.41 GFLOPS, representing just 3% of the parameters and GFLOPs of the highest-performing model, while still achieving PSNR and SSIM metrics of 28.12/0.7931 and 0.3009/0.8317, on the Flickr2K dataset respectively. In addition, Sebica demonstrates significant improvements in real-world applications, specifically in object detection tasks, where it enhances detection accuracy in traffic video scenarios.
- Abstract(参考訳): SISR(Single Image Super-Resolution)は,低解像度画像の画質向上のための重要な技術である。
最近のディープラーニングモデルはSISRに大きな進歩を遂げているが、リソース制限や時間に敏感な環境でのデプロイメントを妨げる計算上の課題に遭遇することが多い。
これらの問題を解決するために,空間的かつ効率的な双方向チャネルアテンション機構を組み込んだ軽量ネットワークSebicaを提案する。
Sebicaは、Div2KデータセットとFlickr2Kデータセットでそれぞれ28.29/0.7976と30.18/0.8330のPSNR/SSIMスコアを達成し、高い再構成品質を維持しながら計算コストを大幅に削減する。
これらの結果は、ほとんどのベースライン軽量モデルを超え、最高性能モデルに匹敵するが、パラメータとGFLOPの17%と15%しか持たない。
さらに、私たちの小さなバージョンのSebicaは7.9Kパラメータと0.41GFLOPSしか持たず、最もパフォーマンスの高いモデルのパラメータのわずか3%とGFLOPを表す一方で、Flickr2KデータセットではPSNRとSSIMのメトリクスが28.12/0.7931と0.3009/0.8317である。
さらに、Sebicaは現実世界のアプリケーション、特にオブジェクト検出タスクにおいて、トラフィックビデオのシナリオにおける検出精度を高めるために、大幅に改善されている。
関連論文リスト
- Patch-Level Contrasting without Patch Correspondence for Accurate and
Dense Contrastive Representation Learning [79.43940012723539]
ADCLRは、正確で高密度な視覚表現を学習するための自己教師型学習フレームワークである。
提案手法は, コントラッシブな手法のための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-23T07:38:09Z) - EBSR: Enhanced Binary Neural Network for Image Super-Resolution [18.93043462670991]
画像超解像のための量子ネットワーク、特にバイナリニューラルネットワーク(BNN)は、大きな性能劣化に悩まされている。
本稿では,より空間的・チャネル的情報を保持することにより,二元的畳み込みを増大させる,空間的再スケーリングとチャネル的シフトと再スケーリングの2つの効果的な手法を提案する。
EBSRと呼ばれる提案モデルは,異なるデータセットと異なるモデルサイズにまたがって,定量的かつ質的に先行技術よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-03-22T02:36:13Z) - Deep Residual Axial Networks [1.370633147306388]
本稿では,空間的2次元畳み込み操作を2つの連続的に分離可能な1次元操作に置き換える,新しいアーキテクチャである軸CNNを提案する。
残留軸ネットワーク(RAN)は77%,86%,75%,34%のパラメータで少なくとも1%高い性能を示した。
論文 参考訳(メタデータ) (2023-01-11T18:36:54Z) - Efficient Image Super-Resolution using Vast-Receptive-Field Attention [49.87316814164699]
注意機構は、高度な超解像(SR)ネットワークの設計において重要な役割を果たす。
本研究では,アテンション機構の改善により,効率的なSRネットワークを設計する。
VAst-receptive-field Pixel attention networkであるVapSRを提案する。
論文 参考訳(メタデータ) (2022-10-12T07:01:00Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - Towards Simple and Accurate Human Pose Estimation with Stair Network [34.421529219040295]
精度の高い多段階ポーズ推定システムに積み重ねることができるStair Networkと呼ばれる小さな判別モデルを開発した。
計算コストを削減するため、Stair Networkは、新しい基本的な特徴抽出ブロックで構成されている。
2つの標準データセットに対するStair Networkの有効性を示す。
論文 参考訳(メタデータ) (2022-02-18T10:37:13Z) - A New Backbone for Hyperspectral Image Reconstruction [90.48427561874402]
3次元ハイパースペクトル画像(HSI)再構成は、スナップショット圧縮画像の逆過程を指す。
空間/スペクトル不変Residual U-Net、すなわちSSI-ResU-Netを提案する。
SSI-ResU-Net は浮動小数点演算の 77.3% 以上で競合する性能を実現する。
論文 参考訳(メタデータ) (2021-08-17T16:20:51Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Boosting High-Level Vision with Joint Compression Artifacts Reduction
and Super-Resolution [10.960291115491504]
任意の品質係数で圧縮された低解像度画像から、アーティファクトフリーの高解像度画像を生成する。
文脈認識型CARとSRニューラルネットワーク(CAJNN)は、局所的特徴と非局所的特徴を統合し、CARとSRを1段階で解く。
高品質で高解像度な画像を予測するために、ディープ・リコンストラクション・ネットワークが採用されている。
論文 参考訳(メタデータ) (2020-10-18T04:17:08Z) - Highly Efficient Salient Object Detection with 100K Parameters [137.74898755102387]
そこで我々は,段階内および複数ステージのマルチスケール機能を効率的に活用するために,フレキシブルな畳み込みモジュールであるOctoConv(gOctConv)を提案する。
我々は、非常に軽量なモデル、すなわちCSNetを構築し、一般的なオブジェクト検出ベンチマークで、約0.2%(100k)の大規模モデルで同等のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-03-12T07:00:46Z) - Pre-defined Sparsity for Low-Complexity Convolutional Neural Networks [9.409651543514615]
この研究は、フィルタ内で定期的に繰り返されるサポートセットを持つ、事前に定義されたスパース2Dカーネルを持つ畳み込みレイヤを導入している。
周期的なスパースカーネルの効率的な保存のため、パラメータの節約はエネルギー効率を大幅に向上させることができる。
論文 参考訳(メタデータ) (2020-01-29T07:10:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。