論文の概要: Deep Photo Scan: Semi-supervised learning for dealing with the
real-world degradation in smartphone photo scanning
- arxiv url: http://arxiv.org/abs/2102.06120v1
- Date: Thu, 11 Feb 2021 17:00:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-12 14:14:06.316556
- Title: Deep Photo Scan: Semi-supervised learning for dealing with the
real-world degradation in smartphone photo scanning
- Title(参考訳): Deep Photo Scan:スマートフォンの写真スキャンにおける現実世界の劣化処理のための半教師付き学習
- Authors: Man M. Ho, Jinjia Zhou
- Abstract要約: 半教師付き学習に基づくディープフォトスキャン(DPScan)を提案する。
まず,DIV2K-SCANデータセットをスマートフォンでスキャンした写真復元のために提案する。
第二に、DIV2K-SCANを用いて、ジェネレーティブ・アドリア・ネットワーク(Generative Adrial Networks)という概念を用いて、本物のスマートフォンでスキャンされたような高品質な画像を分解する方法を学び、スキャンされていない写真の擬似スキャン写真を生成する。
- 参考スコア(独自算出の注目度): 12.160561868046122
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Physical photographs now can be conveniently scanned by smartphones and
stored forever as a digital version, but the scanned photos are not restored
well. One solution is to train a supervised deep neural network on many digital
photos and the corresponding scanned photos. However, human annotation costs a
huge resource leading to limited training data. Previous works create training
pairs by simulating degradation using image processing techniques. Their
synthetic images are formed with perfectly scanned photos in latent space. Even
so, the real-world degradation in smartphone photo scanning remains unsolved
since it is more complicated due to real lens defocus, lighting conditions,
losing details via printing, various photo materials, and more. To solve these
problems, we propose a Deep Photo Scan (DPScan) based on semi-supervised
learning. First, we present the way to produce real-world degradation and
provide the DIV2K-SCAN dataset for smartphone-scanned photo restoration.
Second, by using DIV2K-SCAN, we adopt the concept of Generative Adversarial
Networks to learn how to degrade a high-quality image as if it were scanned by
a real smartphone, then generate pseudo-scanned photos for unscanned photos.
Finally, we propose to train on the scanned and pseudo-scanned photos
representing a semi-supervised approach with a cycle process as: high-quality
images --> real-/pseudo-scanned photos --> reconstructed images. The proposed
semi-supervised scheme can balance between supervised and unsupervised errors
while optimizing to limit imperfect pseudo inputs but still enhance
restoration. As a result, the proposed DPScan quantitatively and qualitatively
outperforms its baseline architecture, state-of-the-art academic research, and
industrial products in smartphone photo scanning.
- Abstract(参考訳): 物理的写真はスマートフォンで便利にスキャンでき、デジタル版として永久に保存できるが、スキャンされた写真は正常に復元されない。
1つの解決策は、監視されたディープニューラルネットワークを多くのデジタル写真と対応するスキャンされた写真にトレーニングすることです。
しかし、人間のアノテーションは、限られたトレーニングデータに繋がる膨大なリソースを消費する。
以前の作品では、画像処理技術を使って劣化をシミュレートしてトレーニングペアを作成する。
合成画像は、宇宙空間で完全にスキャンされた写真で作られています。
それでも、実際のレンズのデフォーカス、照明条件、印刷による詳細の喪失、さまざまな写真素材などにより、スマートフォンの写真スキャンの実際の劣化は未解決のままだ。
そこで本研究では,半教師学習に基づくDPS(Deep Photo Scan)を提案する。
まず,DIV2K-SCANデータセットをスマートフォンでスキャンした写真復元のために提案する。
第2に,div2k-scanを用いて,高品質画像を実際のスマートフォンでスキャンしたかのようにデグレードする方法を学習し,非スキャン写真の擬似スキャン写真を生成する。
最後に, 半監督的手法のスキャン・擬似スキャン写真について, 高品質画像 --> 実/擬似スキャン写真 --> 再構成画像というサイクルプロセスで訓練することを提案する。
提案する半教師付きスキームは教師付きエラーと教師なしエラーのバランスを保ちつつ、不完全な擬似入力を制限するよう最適化する。
その結果,提案したDPScanは,スマートフォン写真スキャンにおけるベースラインアーキテクチャ,最先端の学術研究,産業製品よりも定量的に,質的に優れていることがわかった。
関連論文リスト
- Descanning: From Scanned to the Original Images with a Color Correction
Diffusion Model [11.179584649698134]
我々はDESCAN-18Kという,高品質で大規模なデータセットを新たに導入する。
これは、複数の複雑な劣化を含む野生で収集された18K対の原画像とスキャンされた画像を含んでいる。
本研究では,大域的な色劣化を補正するカラーエンコーダと,局所的な劣化を除去する条件付き拡散確率モデル(DDPM)からなる,DescanDiffusionと呼ばれる新しい画像復元モデルを提案する。
論文 参考訳(メタデータ) (2024-02-08T02:11:52Z) - Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks [50.822601495422916]
本稿では,露光ブラケット写真を利用して画像復元と拡張作業を統合することを提案する。
実世界のペアの収集が困難であるため,まず合成ペアデータを用いてモデルを事前学習する手法を提案する。
特に,時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文 参考訳(メタデータ) (2024-01-01T14:14:35Z) - Perceptual Image Enhancement for Smartphone Real-Time Applications [60.45737626529091]
本稿では,知覚的画像強調のための軽量ネットワークLPIENetを提案する。
我々のモデルは、ノイズアーティファクト、回折アーティファクト、ぼかし、HDR過剰露光を扱うことができる。
我々のモデルは、中級商用スマートフォンで1秒未満で2K解像度画像を処理することができる。
論文 参考訳(メタデータ) (2022-10-24T19:16:33Z) - High Dynamic Range and Super-Resolution from Raw Image Bursts [52.341483902624006]
本稿では,露光ブラケット付きハンドヘルドカメラで撮影した原写真からの高解像度・高ダイナミックレンジカラー画像の再構成について紹介する。
提案アルゴリズムは,画像復元における最先端の学習手法と比較して,メモリ要求の少ない高速なアルゴリズムである。
実験では、ハンドヘルドカメラで野生で撮影された実際の写真に最大4ドル(約4,800円)の超高解像度な要素で優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-29T13:31:28Z) - Measuring Perceptual Color Differences of Smartphone Photographs [55.9434603885868]
知覚CD評価のための最大の画像データセットをまとめた。
我々は、軽量ニューラルネットワークに基づいて、エンドツーエンドで学習可能なCD公式を構築するための最初の試みの1つである。
論文 参考訳(メタデータ) (2022-05-26T16:57:04Z) - Dual-reference Training Data Acquisition and CNN Construction for Image
Super-Resolution [33.388234549922025]
そこで本研究では,実写カメラを用いたLR$sim$HR画像ペアを多数取得する新しい手法を提案する。
私たちのイノベーションは、解像度の異なる超高品質のスクリーンに表示される画像を撮影することです。
実験の結果,LR$sim$HRデータセットによる超解像CNNのトレーニングは,実画像上の既存のデータセットによるトレーニングよりも,復元性能が優れていることがわかった。
論文 参考訳(メタデータ) (2021-08-05T03:31:50Z) - Stereo Matching by Self-supervision of Multiscopic Vision [65.38359887232025]
カメラ位置の整列で撮影した複数の画像を利用したステレオマッチングのための新しい自己監視フレームワークを提案する。
ネットワークを最適化するために、クロスフォトメトリックロス、不確実性を認識した相互監督損失、および新しい平滑性損失が導入されます。
我々のモデルは、KITTIデータセット上の以前の教師なし手法よりも、より良い不均一性マップを得る。
論文 参考訳(メタデータ) (2021-04-09T02:58:59Z) - Exploiting Raw Images for Real-Scene Super-Resolution [105.18021110372133]
本稿では,合成データと実撮影画像とのギャップを埋めるために,実シーンにおける単一画像の超解像化の問題について検討する。
本稿では,デジタルカメラの撮像過程を模倣して,よりリアルなトレーニングデータを生成する手法を提案する。
また、原画像に記録された放射情報を活用するために、2分岐畳み込みニューラルネットワークを開発した。
論文 参考訳(メタデータ) (2021-02-02T16:10:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。