論文の概要: edge-SR: Super-Resolution For The Masses
- arxiv url: http://arxiv.org/abs/2108.10335v1
- Date: Mon, 23 Aug 2021 18:00:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-26 00:34:37.007954
- Title: edge-SR: Super-Resolution For The Masses
- Title(参考訳): edge-SR: 大衆の超解答
- Authors: Pablo Navarrete Michelini, Yunhua Lu, Xingqun Jiang
- Abstract要約: エッジAIチップは、ディープラーニングタスクを効率的に実行可能なハードウェアの迅速な開発において、将来性を示す。
画像の超解像度では、限界を極端に小さなサイズまで押し上げ、エッジデバイス上でリアルタイムで実行できるアーキテクチャはごくわずかである。
画像のスケールアップに解釈可能な機構を用いる一層アーキテクチャの集合であるエッジSR(eSR)を提案する。
- 参考スコア(独自算出の注目度): 9.316821586509484
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Classic image scaling (e.g. bicubic) can be seen as one convolutional layer
and a single upscaling filter. Its implementation is ubiquitous in all display
devices and image processing software. In the last decade deep learning systems
have been introduced for the task of image super-resolution (SR), using several
convolutional layers and numerous filters. These methods have taken over the
benchmarks of image quality for upscaling tasks. Would it be possible to
replace classic upscalers with deep learning architectures on edge devices such
as display panels, tablets, laptop computers, etc.? On one hand, the current
trend in Edge-AI chips shows a promising future in this direction, with rapid
development of hardware that can run deep-learning tasks efficiently. On the
other hand, in image SR only few architectures have pushed the limit to extreme
small sizes that can actually run on edge devices at real-time. We explore
possible solutions to this problem with the aim to fill the gap between classic
upscalers and small deep learning configurations. As a transition from classic
to deep-learning upscaling we propose edge-SR (eSR), a set of one-layer
architectures that use interpretable mechanisms to upscale images. Certainly, a
one-layer architecture cannot reach the quality of deep learning systems.
Nevertheless, we find that for high speed requirements, eSR becomes better at
trading-off image quality and runtime performance. Filling the gap between
classic and deep-learning architectures for image upscaling is critical for
massive adoption of this technology. It is equally important to have an
interpretable system that can reveal the inner strategies to solve this problem
and guide us to future improvements and better understanding of larger
networks.
- Abstract(参考訳): 古典的な画像スケーリング(例)
bicubic)は1つの畳み込み層と1つのアップスケーリングフィルタと見なすことができる。
その実装は、すべてのディスプレイデバイスと画像処理ソフトウェアでユビキタスである。
過去10年間、複数の畳み込み層と多数のフィルタを用いた画像超解像(sr)タスクのためにディープラーニングシステムが導入された。
これらの手法は、アップスケールタスクのための画像品質のベンチマークを引き継いだ。
ディスプレイパネルやタブレット,ラップトップなど,エッジデバイス上でのディープラーニングアーキテクチャを,古典的なアップスケールに置き換えることは可能でしょうか?
一方、Edge-AIチップの現在のトレンドは、ディープラーニングタスクを効率的に実行できるハードウェアの急速な開発によって、この方向への有望な未来を示している。
一方、画像SRでは、エッジデバイス上でリアルタイムに実行可能な極端に小さなサイズに制限を押し上げるアーキテクチャはごくわずかである。
古典的なアップスケーラと小さなディープラーニング構成のギャップを埋めることを目的として,この問題に対する潜在的な解決策を探究する。
古典的なアップスケーリングからディープラーニングへの遷移として、画像のスケールアップに解釈可能なメカニズムを使用する一層アーキテクチャのセットであるエッジSR(eSR)を提案する。
確かに、一層アーキテクチャはディープラーニングシステムの品質に到達できない。
それでも、高速要求では、esrは画像品質と実行時のパフォーマンスのトレードオフがより良くなります。
イメージアップスケールのための古典的アーキテクチャとディープラーニングアーキテクチャのギャップを埋めることが、このテクノロジの大規模採用に不可欠である。
同様に、この問題を解決するための内部戦略を明らかにし、将来の改善と大規模ネットワークの理解を深めるための解釈可能なシステムを持つことが重要である。
関連論文リスト
- A Heterogeneous Dynamic Convolutional Neural Network for Image
Super-resolution [111.97970576223622]
画像超解像(HDSRNet)における異種動的畳み込みネットワークを提案する。
下位のネットワークは対称アーキテクチャを使用して、異なるレイヤの関係を強化し、より構造的な情報をマイニングする。
実験結果から,HDSRNetは画像解決に有効であることが示唆された。
論文 参考訳(メタデータ) (2024-02-24T03:44:06Z) - Embracing Compact and Robust Architectures for Multi-Exposure Image
Fusion [50.598654017728045]
本稿では,堅牢なマルチ露光画像融合のための自己アライメントとディテールリプレクションモジュールを含む探索型パラダイムを提案する。
シーンリライティングと変形可能な畳み込みを利用して、カメラの動きに拘わらず、画像を正確に調整することができる。
我々は、様々な競争方式と比較して最先端の性能を実現し、一般的なシナリオと不整合シナリオに対するPSNRの4.02%と29.34%の改善を実現した。
論文 参考訳(メタデータ) (2023-05-20T17:01:52Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - LR-Net: A Block-based Convolutional Neural Network for Low-Resolution
Image Classification [0.0]
ノイズや低解像度の画像から低レベル特徴と大域特徴の両方を学習するためのブロックで構成された,新しい画像分類アーキテクチャを開発した。
ブロックの設計は,性能向上とパラメータサイズ削減のために,Residual ConnectionとInceptionモジュールの影響を強く受けていた。
我々は、提示されたアーキテクチャが既存の最先端畳み込みニューラルネットワークよりも高速で正確であることを示す詳細なテストを実施した。
論文 参考訳(メタデータ) (2022-07-19T20:01:11Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Pixel Distillation: A New Knowledge Distillation Scheme for
Low-Resolution Image Recognition [85.78793763053798]
我々は、高解像度(HR)画像から学習した重いネットワークモデルから、コンパクトなネットワークモデルに有用な知識を抽出する先駆的な試みを行っている。
本稿では,知識蒸留をモデル圧縮段階と高分解能表現伝達段階に分散させるTAS(Teacher-Assistant-Student)フレームワークを提案する。
提案手法では,重度教師モデルと同等の精度で,パラメータがはるかに少なく,推論速度が速く,低解像度の入力が可能な軽量ネットワークモデルを学習することができる。
論文 参考訳(メタデータ) (2021-12-17T14:31:40Z) - Learning to Resize Images for Computer Vision Tasks [15.381549764216134]
そこで本研究では,リニアリシライザを学習リシライザに置き換えることで,性能を大幅に向上できることを示す。
我々の学習画像復調器はベースライン視覚モデルで共同で訓練されている。
提案手法は,他の視覚タスクの分類ベースラインの微調整にも有用であることを示す。
論文 参考訳(メタデータ) (2021-03-17T23:43:44Z) - ClassSR: A General Framework to Accelerate Super-Resolution Networks by
Data Characteristic [35.02837100573671]
大型画像(2K-8K)上での超解像(SR)ネットワークの高速化を目指す。
異なる画像領域は復元の困難度が異なり、異なるキャパシティを持つネットワークで処理できることがわかった。
分類とSRを統一したフレームワークで組み合わせた新しいソリューションパイプラインであるClassSRを提案する。
論文 参考訳(メタデータ) (2021-03-06T06:00:31Z) - Deep Unrolled Network for Video Super-Resolution [0.45880283710344055]
ビデオスーパーリゾリューション(VSR)は、対応する低リゾリューション(LR)バージョンから高リゾリューション(HR)画像のシーケンスを再構築することを目的としています。
伝統的に、VSR問題の解法は、画像形成や動きの仮定に関する事前知識を利用する反復アルゴリズムに基づいている。
ディープラーニング(DL)アルゴリズムは、大量の画像から空間パターンを効率的に学習できます。
未使用の最適化技術に基づく新しいVSRニューラルネットワークを提案し,その性能を議論する。
論文 参考訳(メタデータ) (2021-02-23T14:35:09Z) - GLEAN: Generative Latent Bank for Large-Factor Image Super-Resolution [85.53811497840725]
我々は,大因子画像超解像(SR)の復元品質を向上させるために,GAN(Generative Adversarial Networks),例えばStyleGAN(StyleGAN)が潜時バンクとして使用できることを示す。
我々の手法であるGenerative LatEnt bANk(GLEAN)は、事前訓練されたGANにカプセル化されているリッチで多様な事前情報を直接活用することで、既存のプラクティスを越えている。
GLEANによってアップスケールされた画像は、既存の方法と比較して忠実さとテクスチャ忠実さの点で明らかに改善されている。
論文 参考訳(メタデータ) (2020-12-01T18:56:14Z) - Lightweight Modules for Efficient Deep Learning based Image Restoration [20.701733377216932]
そこで我々は,与えられたベースラインモデルの計算的低コストな変種を生成するために,いくつかの軽量な低レベルモジュールを提案する。
その結果,提案するネットワークは,全容量ベースラインと比較して,視覚的に類似した再構成を一貫して出力することがわかった。
論文 参考訳(メタデータ) (2020-07-11T19:35:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。