論文の概要: PyNET-CA: Enhanced PyNET with Channel Attention for End-to-End Mobile
Image Signal Processing
- arxiv url: http://arxiv.org/abs/2104.02895v1
- Date: Wed, 7 Apr 2021 03:40:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 12:57:24.130801
- Title: PyNET-CA: Enhanced PyNET with Channel Attention for End-to-End Mobile
Image Signal Processing
- Title(参考訳): PyNET-CA: エンドツーエンドのモバイル画像処理のためのチャネルアテンションを備えた拡張PyNET
- Authors: Byung-Hoon Kim, Joonyoung Song, Jong Chul Ye, JaeHyun Baek
- Abstract要約: RAWからRGBへの再構築のためのエンドツーエンドのモバイルISPディープラーニングアルゴリズムであるPyNET-CAを提案する。
本稿では,AIM 2020 学習スマートフォン ISP チャレンジの結果と比較実験により,提案手法の性能を実証する。
- 参考スコア(独自算出の注目度): 32.7355302269855
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reconstructing RGB image from RAW data obtained with a mobile device is
related to a number of image signal processing (ISP) tasks, such as
demosaicing, denoising, etc. Deep neural networks have shown promising results
over hand-crafted ISP algorithms on solving these tasks separately, or even
replacing the whole reconstruction process with one model. Here, we propose
PyNET-CA, an end-to-end mobile ISP deep learning algorithm for RAW to RGB
reconstruction. The model enhances PyNET, a recently proposed state-of-the-art
model for mobile ISP, and improve its performance with channel attention and
subpixel reconstruction module. We demonstrate the performance of the proposed
method with comparative experiments and results from the AIM 2020 learned
smartphone ISP challenge. The source code of our implementation is available at
https://github.com/egyptdj/skyb-aim2020-public
- Abstract(参考訳): モバイルデバイスで取得したRAWデータからRGBイメージを再構成することは、デモサイティング、デノナイジングなど、多数の画像信号処理(ISP)タスクに関係している。
ディープニューラルネットワークは、これらのタスクを別々に解決したり、再構築プロセス全体をひとつのモデルに置き換えたり、手作りのISPアルゴリズムよりも有望な結果を示している。
本稿では、RAWからRGB再構成のためのエンドツーエンドのモバイルISPディープラーニングアルゴリズムであるPyNET-CAを提案する。
このモデルは、最近提案されたモバイルispの最先端モデルであるpynetを強化し、チャンネルアテンションとサブピクセルリコンストラクションモジュールによってパフォーマンスを向上させる。
本稿では,AIM 2020学習スマートフォンISPチャレンジの結果と比較実験により,提案手法の性能を実証する。
実装のソースコードはhttps://github.com/egyptdj/skyb-aim2020-publicで入手できます。
関連論文リスト
- Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Simple Image Signal Processing using Global Context Guidance [56.41827271721955]
ディープラーニングベースのISPは、深層ニューラルネットワークを使用してRAW画像をDSLRライクなRGBイメージに変換することを目指している。
我々は,全RAW画像からグローバルなコンテキスト情報をキャプチャするために,任意のニューラルISPに統合可能な新しいモジュールを提案する。
本モデルでは,多種多様な実スマートフォン画像を用いて,様々なベンチマークで最新の結果が得られる。
論文 参考訳(メタデータ) (2024-04-17T17:11:47Z) - Rawformer: Unpaired Raw-to-Raw Translation for Learnable Camera ISPs [53.68932498994655]
本稿では,多種多様なカメラを用いた生と生の翻訳の未ペアリング学習手法を提案する。
特定のカメラが捉えた生画像をターゲットカメラに正確にマッピングし、学習可能なISPを新しい目に見えないカメラに一般化する。
提案手法は,従来の最先端技術と比較して精度が高く,実際のカメラデータセットに優れた性能を示す。
論文 参考訳(メタデータ) (2024-04-16T16:17:48Z) - Dual-Scale Transformer for Large-Scale Single-Pixel Imaging [11.064806978728457]
本研究では,HATNet と呼ばれる Kronecker SPI モデル上でのハイブリッドアテンショントランスフォーマを用いた深部展開ネットワークを提案し,実際の SPI カメラの画質向上を図る。
勾配降下モジュールはベクトル化されたSPIに基づいて、以前の勾配降下モジュールに根付いた高い計算オーバーヘッドを回避することができる。
このデノナイジングモジュールは,高周波・低周波アグリゲーションのための2次元空間アグリゲーションと,グローバル情報再構成のためのチャネルアグリゲーションを利用したエンコーダデコーダアーキテクチャである。
論文 参考訳(メタデータ) (2024-04-07T15:53:21Z) - PyNet-V2 Mobile: Efficient On-Device Photo Processing With Neural
Networks [115.97113917000145]
エッジデバイス用に設計された新しいPyNET-V2 Mobile CNNアーキテクチャを提案する。
提案アーキテクチャでは,携帯電話から直接RAW 12MPの写真を1.5秒で処理することができる。
提案したアーキテクチャは,最新のモバイルAIアクセラレータとも互換性があることが示されている。
論文 参考訳(メタデータ) (2022-11-08T17:18:01Z) - LW-ISP: A Lightweight Model with ISP and Deep Learning [17.972611191715888]
ISPパイプラインにおけるリアルタイム高速処理を実現するための学習ベース手法の可能性を示す。
RAWデータからRGB画像へのイメージマッピングを暗黙的に学習する新しいアーキテクチャであるLW-ISPを提案する。
実験により、LW-ISPはPSNRの0.38dB改善を達成した。
論文 参考訳(メタデータ) (2022-10-08T04:00:03Z) - Del-Net: A Single-Stage Network for Mobile Camera ISP [14.168130234198467]
スマートフォンカメラにおける従来の画像信号処理(ISP)パイプラインは、原センサーデータから高品質のsRGBイメージを順次再構成するための画像処理ステップで構成されている。
畳み込みニューラルネットワーク(CNN)を用いたディープラーニング手法は、画像のデノイング、コントラストの強化、超解像、デブロアリングなど、多くの画像関連タスクの解決に人気がある。
本稿では,スマートフォンの展開に適した複雑さでISPパイプライン全体を学ぶために,単一のエンドツーエンドディープラーニングモデルであるDelNetを提案する。
論文 参考訳(メタデータ) (2021-08-03T16:51:11Z) - CNNs for JPEGs: A Study in Computational Cost [49.97673761305336]
畳み込みニューラルネットワーク(CNN)は過去10年間で驚くべき進歩を遂げてきた。
CNNはRGBピクセルから直接データの堅牢な表現を学習することができる。
近年,圧縮領域から直接学習できる深層学習手法が注目されている。
論文 参考訳(メタデータ) (2020-12-26T15:00:10Z) - AWNet: Attentive Wavelet Network for Image ISP [14.58067200317891]
本稿では,この学習可能な画像ISP問題に対処するために,AWNetと呼ばれるアテンション機構とウェーブレット変換を利用する新しいネットワークを提案する。
提案手法により,RAW情報から好意的な画像の詳細を復元し,より広い受容領域を実現することができる。
実験結果から,定性的,定量的両測定における設計の進歩が示唆された。
論文 参考訳(メタデータ) (2020-08-20T23:28:41Z) - Replacing Mobile Camera ISP with a Single Deep Learning Model [171.49776472948957]
PyNETは、きめ細かい画像復元のために設計された新しいピラミッド型CNNアーキテクチャである。
このモデルは、モバイルカメラセンサーから直接得たRAW Bayerデータを、プロのハイエンドDSLRカメラで撮影した写真に変換するように訓練されている。
論文 参考訳(メタデータ) (2020-02-13T14:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。