論文の概要: Rethinking Learning-based Demosaicing, Denoising, and Super-Resolution
Pipeline
- arxiv url: http://arxiv.org/abs/1905.02538v3
- Date: Fri, 24 Mar 2023 19:28:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 05:09:57.572927
- Title: Rethinking Learning-based Demosaicing, Denoising, and Super-Resolution
Pipeline
- Title(参考訳): 学習に基づくデモサイシング,デノイジング,超解像パイプラインの再考
- Authors: Guocheng Qian, Yuanhao Wang, Jinjin Gu, Chao Dong, Wolfgang Heidrich,
Bernard Ghanem, Jimmy S. Ren
- Abstract要約: 本研究では,パイプラインが学習ベースDN,DM,SRの混合問題に与える影響について,逐次解とジョイント解の両方で検討する。
我々の提案するパイプラインDN$to$SR$to$DMは、他のシーケンシャルパイプラインよりも一貫してパフォーマンスが向上する。
混合問題に対する最先端の性能を実現するために, エンドツーエンドのトリニティ・カメラ・エンハンスメント・ネットワーク(TENet)を提案する。
- 参考スコア(独自算出の注目度): 86.01209981642005
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Imaging is usually a mixture problem of incomplete color sampling, noise
degradation, and limited resolution. This mixture problem is typically solved
by a sequential solution that applies demosaicing (DM), denoising (DN), and
super-resolution (SR) sequentially in a fixed and predefined pipeline
(execution order of tasks), DM$\to$DN$\to$SR. The most recent work on image
processing focuses on developing more sophisticated architectures to achieve
higher image quality. Little attention has been paid to the design of the
pipeline, and it is still not clear how significant the pipeline is to image
quality. In this work, we comprehensively study the effects of pipelines on the
mixture problem of learning-based DN, DM, and SR, in both sequential and joint
solutions. On the one hand, in sequential solutions, we find that the pipeline
has a non-trivial effect on the resulted image quality. Our suggested pipeline
DN$\to$SR$\to$DM yields consistently better performance than other sequential
pipelines in various experimental settings and benchmarks. On the other hand,
in joint solutions, we propose an end-to-end Trinity Pixel Enhancement NETwork
(TENet) that achieves state-of-the-art performance for the mixture problem. We
further present a novel and simple method that can integrate a certain pipeline
into a given end-to-end network by providing intermediate supervision using a
detachable head. Extensive experiments show that an end-to-end network with the
proposed pipeline can attain only a consistent but insignificant improvement.
Our work indicates that the investigation of pipelines is applicable in
sequential solutions, but is not very necessary in end-to-end networks.
\RR{Code, models, and our contributed PixelShift200 dataset are available at
\url{https://github.com/guochengqian/TENet}
- Abstract(参考訳): イメージングは通常、不完全色サンプリング、ノイズ劣化、解像度制限の混合問題である。
この混合問題は典型的にはデモサイシング(dm)、デノイジング(dn)、スーパーレゾリューション(sr)を固定および事前定義されたパイプライン(タスクの実行順序)dm$\to$dn$\to$srで順次適用する逐次解によって解決される。
画像処理に関する最近の研究は、より高い画質を実現するためのより洗練されたアーキテクチャの開発に焦点を当てている。
パイプラインの設計にはほとんど注意が払われておらず、パイプラインが画像品質にどの程度重要かは、まだ明らかではない。
本研究では,学習ベースDN,DM,SRの混合問題に対するパイプラインの効果を,逐次的および共同解法の両方において包括的に研究する。
一方で、シーケンシャルなソリューションでは、パイプラインが結果の画像品質に非自明な影響を与えていることが分かりました。
我々の提案するパイプラインDN$\to$SR$\to$DMは、様々な実験設定やベンチマークにおいて、他のシーケンシャルパイプラインよりも一貫してパフォーマンスが向上する。
一方,共同ソリューションでは,混合問題に対する最先端の性能を実現するエンドツーエンドトリニティ画素拡張ネットワーク(tenet)を提案する。
さらに,分離可能なヘッドを用いた中間管理を提供することにより,特定のパイプラインを所定のエンドツーエンドネットワークに統合する,新規でシンプルな手法を提案する。
広範な実験により、提案するパイプラインとのエンドツーエンドネットワークは、一貫性があるが重要でない改善しか達成できないことが示された。
私たちの研究は、パイプラインの調査はシーケンシャルなソリューションに適用できるが、エンドツーエンドネットワークではそれほど必要ではないことを示している。
RR{Code, model, and our contribute PixelShift200 data is available at \url{https://github.com/guochengqian/TENet}
関連論文リスト
- PRISTA-Net: Deep Iterative Shrinkage Thresholding Network for Coded
Diffraction Patterns Phase Retrieval [6.982256124089]
位相検索は、計算画像および画像処理における非線型逆問題である。
我々は,1次反復しきい値しきい値アルゴリズム(ISTA)に基づく深層展開ネットワークであるPRISTA-Netを開発した。
非線形変換,しきい値,ステップサイズなど,提案するPRISTA-Netフレームワークのパラメータはすべて,設定されるのではなく,エンドツーエンドで学習される。
論文 参考訳(メタデータ) (2023-09-08T07:37:15Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - RDRN: Recursively Defined Residual Network for Image Super-Resolution [58.64907136562178]
深部畳み込みニューラルネットワーク(CNN)は、単一画像超解像において顕著な性能を得た。
本稿では,注目ブロックを効率的に活用する新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-17T11:06:29Z) - Signal Processing for Implicit Neural Representations [80.38097216996164]
Inlicit Neural Representation (INR)は、マルチ層パーセプトロンを介して連続したマルチメディアデータを符号化する。
既存の作業は、その離散化されたインスタンスの処理を通じて、そのような連続的な表現を操作する。
本稿では,INSP-Netと呼ばれる暗黙的ニューラル信号処理ネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-17T06:29:07Z) - ParaColorizer: Realistic Image Colorization using Parallel Generative
Networks [1.7778609937758327]
グレースケール画像のカラー化は、情報復元のためのAIの魅力的な応用である。
並列なGANベースのカラー化フレームワークを提案する。
マルチモーダル問題を評価するために一般的に使用される非知覚的評価指標の欠点を示す。
論文 参考訳(メタデータ) (2022-08-17T13:49:44Z) - End-to-End Adaptive Monte Carlo Denoising and Super-Resolution [11.928318461220355]
モンテカルロ経路の追跡は, 後処理における共同超解像とデノイングによりさらに加速できることを示す。
この新しいタイプのジョイントフィルタリングでは、パストレースによって低解像度で少ない(雑音の多い)イメージのみをレンダリングできる。
この作業の主な貢献は、SRDタスク用に特別に設計された、新しいエンドツーエンドのネットワークアーキテクチャである。
論文 参考訳(メタデータ) (2021-08-16T06:32:23Z) - LAPAR: Linearly-Assembled Pixel-Adaptive Regression Network for Single
Image Super-Resolution and Beyond [75.37541439447314]
単一画像超解像(SISR)は、低解像度(LR)画像を高解像度(HR)バージョンにアップサンプリングする根本的な問題を扱う。
本稿では,線形組立画素適応回帰ネットワーク (LAPAR) を提案する。
論文 参考訳(メタデータ) (2021-05-21T15:47:18Z) - Beyond Joint Demosaicking and Denoising: An Image Processing Pipeline
for a Pixel-bin Image Sensor [0.883717274344425]
Pixel binningは、スマートフォンカメラのハードウェア制限に対処する最も顕著なソリューションの1つだと考えられている。
本稿では,新しい学習手法を導入することで,このような画像センサ上でのJDD(Joint Desaicing and Denoising)の課題に対処する。
提案手法は,視覚可能な画像を生成するための2つの新しい知覚損失を含む多項目的関数によって導かれる。
論文 参考訳(メタデータ) (2021-04-19T15:41:28Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z) - Blind Image Super-Resolution with Spatial Context Hallucination [5.849485167287474]
本稿では, 劣化カーネルを知らずに, 視覚的超解像のための空間文脈幻覚ネットワーク(SCHN)を提案する。
DIV2KとFlickr2Kという2つの高品質データセットでモデルをトレーニングします。
入力画像がランダムなぼかしとノイズで劣化した場合, 最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-09-25T22:36:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。