論文の概要: Towards Fast and Light-Weight Restoration of Dark Images
- arxiv url: http://arxiv.org/abs/2011.14133v1
- Date: Sat, 28 Nov 2020 13:53:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-19 19:47:25.316879
- Title: Towards Fast and Light-Weight Restoration of Dark Images
- Title(参考訳): 暗黒画像の高速・軽量復元に向けて
- Authors: Mohit Lamba and Atul Balaji and Kaushik Mitra
- Abstract要約: 我々は,CPU上でも3秒の球場で,2848 x 4256,極暗の単一イメージをフル解像度で拡張できることを実証した。
2~7倍のモデルパラメータ,2~3倍のメモリ使用率,5~20倍のスピードアップで実現しています。
- 参考スコア(独自算出の注目度): 26.779714419544085
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ability to capture good quality images in the dark and near-zero lux
conditions has been a long-standing pursuit of the computer vision community.
The seminal work by Chen et al. [5] has especially caused renewed interest in
this area, resulting in methods that build on top of their work in a bid to
improve the reconstruction. However, for practical utility and deployment of
low-light enhancement algorithms on edge devices such as embedded systems,
surveillance cameras, autonomous robots and smartphones, the solution must
respect additional constraints such as limited GPU memory and processing power.
With this in mind, we propose a deep neural network architecture that aims to
strike a balance between the network latency, memory utilization, model
parameters, and reconstruction quality. The key idea is to forbid computations
in the High-Resolution (HR) space and limit them to a Low-Resolution (LR)
space. However, doing the bulk of computations in the LR space causes artifacts
in the restored image. We thus propose Pack and UnPack operations, which allow
us to effectively transit between the HR and LR spaces without incurring much
artifacts in the restored image. We show that we can enhance a full resolution,
2848 x 4256, extremely dark single-image in the ballpark of 3 seconds even on a
CPU. We achieve this with 2 - 7x fewer model parameters, 2 - 3x lower memory
utilization, 5 - 20x speed up and yet maintain a competitive image
reconstruction quality compared to the state-of-the-art algorithms.
- Abstract(参考訳): 暗黒とほぼゼロのラックス条件下で高品質な画像をキャプチャする能力は、長い間コンピュータビジョンコミュニティを追求してきた。
チェンらによる独創的な作品。
[5]は特にこの領域に新たな関心を呼び起こし、復興を改善するために彼らの作業の上に構築する手法を生み出した。
しかし、組み込みシステム、監視カメラ、自律ロボット、スマートフォンなどのエッジデバイスに低照度拡張アルゴリズムを実用的に導入するためには、GPUメモリや処理能力の制限といった追加の制約を遵守する必要がある。
このことを念頭に,ネットワークレイテンシ,メモリ使用率,モデルパラメータ,コンストラクション品質のバランスを取ることを目的とした,ディープニューラルネットワークアーキテクチャを提案する。
鍵となる考え方は、高解法(HR)空間における計算を禁止し、低解法(LR)空間に制限することである。
しかし、LR空間で多くの計算を行うと、復元された画像のアーティファクトが発生する。
そこで我々は、復元された画像に多くのアーティファクトを発生させることなく、HR空間とLR空間を効果的に移動できるPackとUnPack演算を提案する。
我々は,CPU上でも3秒の球場で,2848 x 4256,極暗い単一イメージのフル解像度を向上できることを示す。
2~7倍のモデルパラメータ,2~3倍のメモリ使用率,5~20倍のスピードアップで実現し,最先端アルゴリズムと比較して画像再構成の競争力を維持した。
関連論文リスト
- DarkShot: Lighting Dark Images with Low-Compute and High-Quality [11.256790804961563]
本稿では,従来のSOTA(State-of-the-art)手法を低照度拡張タスクで上回る軽量ネットワークを提案する。
我々のモデルは、SOTAの復元品質を維持しながら、最小限の計算でUHD 4K解像度画像を復元することができる。
論文 参考訳(メタデータ) (2023-12-28T03:26:50Z) - Real-time 6K Image Rescaling with Rate-distortion Optimization [53.61374658914277]
リアルタイム6Kレート歪み認識画像再スケーリングのための新しいフレームワークを提案する。
我々のフレームワークは、HR画像をエンコーダによってJPEG LRサムネイルに埋め込む。
そして、効率的な周波数認識復号器は、LR1から高忠実度HR画像をリアルタイムに再構成する。
論文 参考訳(メタデータ) (2023-04-03T15:21:56Z) - Perceptual Image Enhancement for Smartphone Real-Time Applications [60.45737626529091]
本稿では,知覚的画像強調のための軽量ネットワークLPIENetを提案する。
我々のモデルは、ノイズアーティファクト、回折アーティファクト、ぼかし、HDR過剰露光を扱うことができる。
我々のモデルは、中級商用スマートフォンで1秒未満で2K解像度画像を処理することができる。
論文 参考訳(メタデータ) (2022-10-24T19:16:33Z) - BSRA: Block-based Super Resolution Accelerator with Hardware Efficient
Pixel Attention [0.10547353841674209]
本稿では,ハードウェア効率のよいハードウェアアクセラレーションを提案する。
最終的な実装は、TSMC 40nm CMOSプロセスで毎秒30フレームのフルHD画像再構成をサポートすることができる。
論文 参考訳(メタデータ) (2022-05-02T09:56:29Z) - NeRFusion: Fusing Radiance Fields for Large-Scale Scene Reconstruction [50.54946139497575]
我々は,NeRF と TSDF をベースとした核融合技術の利点を組み合わせて,大規模再構築とフォトリアリスティックレンダリングを実現する手法であるNeRFusion を提案する。
我々は,大規模な屋内・小規模の両方の物体シーンにおいて,NeRFの最先端性を達成し,NeRFや他の最近の手法よりも大幅に高速に再現できることを実証した。
論文 参考訳(メタデータ) (2022-03-21T18:56:35Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - SPI-GAN: Towards Single-Pixel Imaging through Generative Adversarial
Network [6.722629246312285]
本稿では,SPI-GANと呼ばれる一画素イメージングのための生成的対向的ネットワークベース再構成フレームワークを提案する。
サンプリング比が5%に低下しても、17.92dBのPSNRと0.487のSSIMで画像を再構成することができる。
論文 参考訳(メタデータ) (2021-07-03T03:06:09Z) - Exploiting Raw Images for Real-Scene Super-Resolution [105.18021110372133]
本稿では,合成データと実撮影画像とのギャップを埋めるために,実シーンにおける単一画像の超解像化の問題について検討する。
本稿では,デジタルカメラの撮像過程を模倣して,よりリアルなトレーニングデータを生成する手法を提案する。
また、原画像に記録された放射情報を活用するために、2分岐畳み込みニューラルネットワークを開発した。
論文 参考訳(メタデータ) (2021-02-02T16:10:15Z) - CooGAN: A Memory-Efficient Framework for High-Resolution Facial
Attribute Editing [84.92009553462384]
HR顔画像編集のためのNOVEL画素変換フレームワークCooperative GAN(CooGAN)を提案する。
このフレームワークは、きめ細かい局所的な顔パッチ生成のためのローカルパス(パッチレベルHR、ローメモリ)と、グローバル低解像度(LR)顔構造監視のためのグローバルパス(画像レベルLR、ローメモリ)を備えている。
さらに,より効率的なマルチスケール機能融合のための軽量な選択転写ユニットを提案する。
論文 参考訳(メタデータ) (2020-11-03T08:40:00Z) - Contextual Residual Aggregation for Ultra High-Resolution Image
Inpainting [12.839962012888199]
そこで本稿では,CRA(Contextual Residual Aggregation)機構を提案する。
CRA機構は、コンテキストパッチからの残基の重み付けにより、欠落した内容に対して高周波残基を生成する。
提案手法は,解像度512×512の小型画像に対して学習し,高解像度画像に対する推論を行い,良好な塗装品質を実現する。
論文 参考訳(メタデータ) (2020-05-19T18:55:32Z) - Perceptual Image Super-Resolution with Progressive Adversarial Network [17.289101902846358]
Single Image Super-Resolution (SISR) は、小型の低画質画像の解像度を1つの画像から改善することを目的としている。
本稿では,現在最先端のアルゴリズムの性能を制限している理由として,次元の呪いを論じる。
本稿では,ドメイン固有画像の超解像化の難しさに対処できるプログレッシブ・アドバイサル・ネットワーク(PAN)を提案する。
論文 参考訳(メタデータ) (2020-03-08T10:19:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。