論文の概要: AWNet: Attentive Wavelet Network for Image ISP
- arxiv url: http://arxiv.org/abs/2008.09228v2
- Date: Sun, 13 Sep 2020 17:38:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 04:09:32.511304
- Title: AWNet: Attentive Wavelet Network for Image ISP
- Title(参考訳): AWNet: Image ISPのための注意ウェーブレットネットワーク
- Authors: Linhui Dai, Xiaohong Liu, Chengqi Li, and Jun Chen
- Abstract要約: 本稿では,この学習可能な画像ISP問題に対処するために,AWNetと呼ばれるアテンション機構とウェーブレット変換を利用する新しいネットワークを提案する。
提案手法により,RAW情報から好意的な画像の詳細を復元し,より広い受容領域を実現することができる。
実験結果から,定性的,定量的両測定における設計の進歩が示唆された。
- 参考スコア(独自算出の注目度): 14.58067200317891
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the revolutionary improvement being made on the performance of smartphones
over the last decade, mobile photography becomes one of the most common
practices among the majority of smartphone users. However, due to the limited
size of camera sensors on phone, the photographed image is still visually
distinct to the one taken by the digital single-lens reflex (DSLR) camera. To
narrow this performance gap, one is to redesign the camera image signal
processor (ISP) to improve the image quality. Owing to the rapid rise of deep
learning, recent works resort to the deep convolutional neural network (CNN) to
develop a sophisticated data-driven ISP that directly maps the phone-captured
image to the DSLR-captured one. In this paper, we introduce a novel network
that utilizes the attention mechanism and wavelet transform, dubbed AWNet, to
tackle this learnable image ISP problem. By adding the wavelet transform, our
proposed method enables us to restore favorable image details from RAW
information and achieve a larger receptive field while remaining high
efficiency in terms of computational cost. The global context block is adopted
in our method to learn the non-local color mapping for the generation of
appealing RGB images. More importantly, this block alleviates the influence of
image misalignment occurred on the provided dataset. Experimental results
indicate the advances of our design in both qualitative and quantitative
measurements. The code is available publically.
- Abstract(参考訳): 過去10年でスマートフォンのパフォーマンスが劇的に向上した今、モバイル写真は大部分のスマートフォンユーザーの間でもっとも一般的な方法の1つになっている。
しかし、携帯電話のカメラセンサーのサイズが限られているため、撮影された画像はデジタル一眼レフ(dslr)カメラで撮影されたものとは視覚的に区別されている。
この性能ギャップを狭めるためには、カメラ画像信号処理装置(isp)を再設計し、画質を改善することである。
ディープラーニングの急速な普及に伴い、最近の研究は、深層畳み込みニューラルネットワーク(CNN)を利用して、電話でキャプチャされた画像をDSLRにマッピングする高度なデータ駆動ISPを開発している。
本稿では,この学習可能な画像ISP問題に対処するために,AWNetと呼ばれるアテンション機構とウェーブレット変換を利用する新しいネットワークを提案する。
提案手法では,ウェーブレット変換を付加することにより,生情報から良好な画像詳細を復元し,計算コストの面で高い効率を維持しつつ,より大きな受容場を実現することができる。
グローバルコンテキストブロックは,rgb画像生成のための非局所色マッピングを学習するために用いられる。
さらに、このブロックは、提供されたデータセットで起きた画像の不一致の影響を軽減する。
実験結果から,定性的,定量的両測定における設計の進歩が示唆された。
コードは一般に公開されている。
関連論文リスト
- Simple Image Signal Processing using Global Context Guidance [56.41827271721955]
ディープラーニングベースのISPは、深層ニューラルネットワークを使用してRAW画像をDSLRライクなRGBイメージに変換することを目指している。
我々は,全RAW画像からグローバルなコンテキスト情報をキャプチャするために,任意のニューラルISPに統合可能な新しいモジュールを提案する。
本モデルでは,多種多様な実スマートフォン画像を用いて,様々なベンチマークで最新の結果が得られる。
論文 参考訳(メタデータ) (2024-04-17T17:11:47Z) - Rawformer: Unpaired Raw-to-Raw Translation for Learnable Camera ISPs [53.68932498994655]
本稿では,多種多様なカメラを用いた生と生の翻訳の未ペアリング学習手法を提案する。
特定のカメラが捉えた生画像をターゲットカメラに正確にマッピングし、学習可能なISPを新しい目に見えないカメラに一般化する。
提案手法は,従来の最先端技術と比較して精度が高く,実際のカメラデータセットに優れた性能を示す。
論文 参考訳(メタデータ) (2024-04-16T16:17:48Z) - Transform your Smartphone into a DSLR Camera: Learning the ISP in the
Wild [159.71025525493354]
本稿では,スマートフォンが取得したRAW画像に基づいて,DSLRの品質画像を生成する訓練可能な画像信号処理フレームワークを提案する。
トレーニング画像ペア間の色ずれに対処するために、カラー条件ISPネットワークを使用し、各入力RAWと基準DSLR画像間の新しいパラメトリック色マッピングを最適化する。
論文 参考訳(メタデータ) (2022-03-20T20:13:59Z) - RBSRICNN: Raw Burst Super-Resolution through Iterative Convolutional
Neural Network [23.451063587138393]
RBSRICNN(Row Burst Super-Resolution Iterative Convolutional Neural Network)を提案する。
提案したネットワークは、中間SR推定を反復的に洗練することにより最終的な出力を生成する。
定量的および定性的な実験において提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-10-25T19:01:28Z) - Del-Net: A Single-Stage Network for Mobile Camera ISP [14.168130234198467]
スマートフォンカメラにおける従来の画像信号処理(ISP)パイプラインは、原センサーデータから高品質のsRGBイメージを順次再構成するための画像処理ステップで構成されている。
畳み込みニューラルネットワーク(CNN)を用いたディープラーニング手法は、画像のデノイング、コントラストの強化、超解像、デブロアリングなど、多くの画像関連タスクの解決に人気がある。
本稿では,スマートフォンの展開に適した複雑さでISPパイプライン全体を学ぶために,単一のエンドツーエンドディープラーニングモデルであるDelNetを提案する。
論文 参考訳(メタデータ) (2021-08-03T16:51:11Z) - Beyond Joint Demosaicking and Denoising: An Image Processing Pipeline
for a Pixel-bin Image Sensor [0.883717274344425]
Pixel binningは、スマートフォンカメラのハードウェア制限に対処する最も顕著なソリューションの1つだと考えられている。
本稿では,新しい学習手法を導入することで,このような画像センサ上でのJDD(Joint Desaicing and Denoising)の課題に対処する。
提案手法は,視覚可能な画像を生成するための2つの新しい知覚損失を含む多項目的関数によって導かれる。
論文 参考訳(メタデータ) (2021-04-19T15:41:28Z) - Exploiting Raw Images for Real-Scene Super-Resolution [105.18021110372133]
本稿では,合成データと実撮影画像とのギャップを埋めるために,実シーンにおける単一画像の超解像化の問題について検討する。
本稿では,デジタルカメラの撮像過程を模倣して,よりリアルなトレーニングデータを生成する手法を提案する。
また、原画像に記録された放射情報を活用するために、2分岐畳み込みニューラルネットワークを開発した。
論文 参考訳(メタデータ) (2021-02-02T16:10:15Z) - Deep Burst Super-Resolution [165.90445859851448]
バースト超解像タスクのための新しいアーキテクチャを提案する。
我々のネットワークは複数のノイズRAW画像を入力として取り出し、出力として分解された超解像RGB画像を生成する。
実世界のデータのトレーニングと評価を可能にするため,BurstSRデータセットも導入する。
論文 参考訳(メタデータ) (2021-01-26T18:57:21Z) - Replacing Mobile Camera ISP with a Single Deep Learning Model [171.49776472948957]
PyNETは、きめ細かい画像復元のために設計された新しいピラミッド型CNNアーキテクチャである。
このモデルは、モバイルカメラセンサーから直接得たRAW Bayerデータを、プロのハイエンドDSLRカメラで撮影した写真に変換するように訓練されている。
論文 参考訳(メタデータ) (2020-02-13T14:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。