論文の概要: BSRA: Block-based Super Resolution Accelerator with Hardware Efficient
Pixel Attention
- arxiv url: http://arxiv.org/abs/2205.00777v1
- Date: Mon, 2 May 2022 09:56:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 20:51:33.049585
- Title: BSRA: Block-based Super Resolution Accelerator with Hardware Efficient
Pixel Attention
- Title(参考訳): BSRA: ハードウェア効率の良い画素アテンションを用いたブロック型超解像加速器
- Authors: Dun-Hao Yang, and Tian-Sheuan Chang
- Abstract要約: 本稿では,ハードウェア効率のよいハードウェアアクセラレーションを提案する。
最終的な実装は、TSMC 40nm CMOSプロセスで毎秒30フレームのフルHD画像再構成をサポートすることができる。
- 参考スコア(独自算出の注目度): 0.10547353841674209
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Increasingly, convolution neural network (CNN) based super resolution models
have been proposed for better reconstruction results, but their large model
size and complicated structure inhibit their real-time hardware implementation.
Current hardware designs are limited to a plain network and suffer from lower
quality and high memory bandwidth requirements. This paper proposes a super
resolution hardware accelerator with hardware efficient pixel attention that
just needs 25.9K parameters and simple structure but achieves 0.38dB better
reconstruction images than the widely used FSRCNN. The accelerator adopts full
model block wise convolution for full model layer fusion to reduce external
memory access to model input and output only. In addition, CNN and pixel
attention are well supported by PE arrays with distributed weights. The final
implementation can support full HD image reconstruction at 30 frames per second
with TSMC 40nm CMOS process.
- Abstract(参考訳): コンボリューションニューラルネットワーク(CNN)をベースとした超解像モデルでは,再構成結果の改善が提案されているが,その大きなモデルサイズと複雑な構造は,そのリアルタイムハードウェア実装を阻害する。
現在のハードウェア設計は普通のネットワークに限られており、低品質と高メモリ帯域幅の要求に悩まされている。
本稿では,25.9Kパラメータと単純な構造しか必要とせず,広く使用されているFSRCNNよりも0.38dB優れた再構成画像が得られる,ハードウェア効率のよいハードウェアアクセラレーションを提案する。
このアクセラレータはフルモデル層融合のためにフルモデルブロックワイズ畳み込みを採用し、モデル入力と出力のみに対する外部メモリアクセスを減らす。
加えて、cnnとpixel attentionは、分散重みを持つpe配列によってよくサポートされている。
最終的な実装は、TSMC 40nm CMOSプロセスで毎秒30フレームのフルHD画像再構成をサポートすることができる。
関連論文リスト
- Hierarchical Patch Diffusion Models for High-Resolution Video Generation [50.42746357450949]
我々は,階層的な方法で,コンテキスト情報を低スケールから高スケールのパッチに伝播する深層文脈融合を開発する。
また,ネットワーク容量の増大と,粗い画像の細部への演算を行う適応計算を提案する。
得られたモデルは、クラス条件のビデオ生成において66.32の最先端FVDスコアと87.68のインセプションスコアを新たに設定する。
論文 参考訳(メタデータ) (2024-06-12T01:12:53Z) - Image super-resolution via dynamic network [19.404066956727885]
画像超解像(DSRNet)のための動的ネットワークを提案する。
残余の増築ブロック、広範囲の増築ブロック、特徴の増築ブロック、建設ブロックを含む。
画像の超解像と複雑性の回復時間に関して,本手法はより競争力がある。
論文 参考訳(メタデータ) (2023-10-16T13:56:56Z) - ACNPU: A 4.75TOPS/W 1080P@30FPS Super Resolution Accelerator with
Decoupled Asymmetric Convolution [0.0502254944841629]
深層学習駆動型超解像(SR)は従来の技術より優れているが、高複雑性とメモリ帯域幅の課題に直面している。
本稿では,エネルギー効率の高いSR加速器ACNPUを提案する。
ACNPUは27層モデルで画質を0.34dB向上させるが、FSRCNNよりも36%の複雑さを必要とする。
論文 参考訳(メタデータ) (2023-08-30T07:23:32Z) - ShuffleMixer: An Efficient ConvNet for Image Super-Resolution [88.86376017828773]
本稿では、大きな畳み込みとチャネル分割シャッフル操作を探索する軽量画像超解像のためのShuffleMixerを提案する。
具体的には,チャネル分割とシャッフルを基本成分とする2つのプロジェクション層を効率よく混合する。
実験結果から,ShuffleMixerはモデルパラメータやFLOPの手法に比べて約6倍小さいことがわかった。
論文 参考訳(メタデータ) (2022-05-30T15:26:52Z) - EfficientViT: Multi-Scale Linear Attention for High-Resolution Dense
Prediction [67.11722682878722]
この研究は、新しいマルチスケール線形注意を持つ高解像度ビジョンモデルのファミリーであるEfficientViTを提示する。
マルチスケール線形注意は,グローバルな受容場とマルチスケール学習を実現する。
EfficientViTは従来の最先端モデルよりも優れたパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2022-05-29T20:07:23Z) - Hybrid Pixel-Unshuffled Network for Lightweight Image Super-Resolution [64.54162195322246]
畳み込みニューラルネットワーク(CNN)は画像超解像(SR)において大きな成功を収めた
ほとんどのディープCNNベースのSRモデルは、高い性能を得るために大量の計算を処理している。
SRタスクに効率的かつ効果的なダウンサンプリングモジュールを導入することで,HPUN(Hybrid Pixel-Unshuffled Network)を提案する。
論文 参考訳(メタデータ) (2022-03-16T20:10:41Z) - Super-Efficient Super Resolution for Fast Adversarial Defense at the
Edge [4.2698418800007865]
画像分類のDeep Neural Networks (DNN) に対する攻撃を緩和する新しい手法が登場した。
超解像は計算コストが高い。
超高効率超解像(SESR)は,2倍から330倍のMultiply-Accumulate(MAC)演算を必要としながら,先行技術と類似あるいは良好な画像品質を実現する。
論文 参考訳(メタデータ) (2021-12-29T00:35:41Z) - Projected GANs Converge Faster [50.23237734403834]
GAN(Generative Adversarial Networks)は高品質な画像を生成するが、訓練は難しい。
生成したサンプルと実際のサンプルを固定された事前訓練された特徴空間に投影することで、これらの問題に大きく取り組みます。
我々の投影GANは画像品質、サンプル効率、収束速度を改善する。
論文 参考訳(メタデータ) (2021-11-01T15:11:01Z) - Generating Superpixels for High-resolution Images with Decoupled Patch
Calibration [82.21559299694555]
Patch Networks (PCNet) は高解像度のスーパーピクセルセグメンテーションを効率的かつ正確に実装するように設計されている。
DPCは高解像度画像から局所パッチを取得し、動的にバイナリマスクを生成し、ネットワークを領域境界に集中させる。
特に、DPCは高解像度画像からローカルパッチを取り、動的にバイナリマスクを生成して、ネットワークを領域境界に集中させる。
論文 参考訳(メタデータ) (2021-08-19T10:33:05Z) - Extremely Lightweight Quantization Robust Real-Time Single-Image Super
Resolution for Mobile Devices [0.0]
シングルイメージ・スーパーレゾリューション(SISR)は古典的なコンピュータビジョンの問題であり、数十年にわたって研究されてきた。
SISRに関する最近の研究は、ディープラーニングの方法論に焦点を合わせ、最先端の結果を得る。
ハードウェア(Synaptics Dolphin NPU)を意識した超軽量量子化ロバストリアルタイム超解像ネットワーク(XLSR)を提案する。
論文 参考訳(メタデータ) (2021-05-21T11:29:48Z) - Towards Fast and Light-Weight Restoration of Dark Images [26.779714419544085]
我々は,CPU上でも3秒の球場で,2848 x 4256,極暗の単一イメージをフル解像度で拡張できることを実証した。
2~7倍のモデルパラメータ,2~3倍のメモリ使用率,5~20倍のスピードアップで実現しています。
論文 参考訳(メタデータ) (2020-11-28T13:53:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。