論文の概要: Learning Foveated Reconstruction to Preserve Perceived Image Statistics
- arxiv url: http://arxiv.org/abs/2108.03499v1
- Date: Sat, 7 Aug 2021 18:39:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-11 11:18:59.504274
- Title: Learning Foveated Reconstruction to Preserve Perceived Image Statistics
- Title(参考訳): 知覚的画像統計を保存するための学習フォブレーション再構成法
- Authors: Luca Surace (Universit\`a della Svizzera italiana), Marek Wernikowski
(West Pomeranian University of Technology), Okan Tursun (Universit\`a della
Svizzera italiana), Karol Myszkowski (Max Planck Institute for Informatics),
Rados{\l}aw Mantiuk (West Pomeranian University of Technology), Piotr Didyk
(Universit\`a della Svizzera italiana)
- Abstract要約: 織布された画像再構成は、人間の視覚系の網膜感度に応じて分散されたスパースセットのサンプルからフルイメージを復元する。
本稿では,新たな心理物理実験,データセット,画像再構成の訓練手順について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foveated image reconstruction recovers full image from a sparse set of
samples distributed according to the human visual system's retinal sensitivity
that rapidly drops with eccentricity. Recently, the use of Generative
Adversarial Networks was shown to be a promising solution for such a task as
they can successfully hallucinate missing image information. Like for other
supervised learning approaches, also for this one, the definition of the loss
function and training strategy heavily influences the output quality. In this
work, we pose the question of how to efficiently guide the training of foveated
reconstruction techniques such that they are fully aware of the human visual
system's capabilities and limitations, and therefore, reconstruct visually
important image features. Due to the nature of GAN-based solutions, we
concentrate on the human's sensitivity to hallucination for different input
sample densities. We present new psychophysical experiments, a dataset, and a
procedure for training foveated image reconstruction. The strategy provides
flexibility to the generator network by penalizing only perceptually important
deviations in the output. As a result, the method aims to preserve perceived
image statistics rather than natural image statistics. We evaluate our strategy
and compare it to alternative solutions using a newly trained objective metric
and user experiments.
- Abstract(参考訳): foveated image reconstructionは、人間の視覚系の網膜の感度に応じて分布するわずかなサンプルセットからフルイメージを回復し、離心性によって急速に低下する。
近年,ジェネレーティブ・アドバイサル・ネットワークの利用は画像情報の幻覚化に成功し,そのような課題に対して有望な解決策であることが示されている。
他の教師付き学習手法と同様に、この手法では損失関数の定義とトレーニング戦略が出力品質に大きな影響を及ぼす。
本研究では,人間の視覚システムの能力や限界を十分に認識し,視覚的に重要な特徴を再構築するなど,望ましくない再建技術の訓練を効率的に指導する方法を疑問視する。
GANをベースとした解法の性質から,異なるサンプル密度に対する幻覚に対する人間の感受性に着目する。
本稿では,新しい心理物理学実験,データセット,foveated image reconstructionのトレーニング手順を提案する。
この戦略は、出力における知覚上重要なずれのみを罰することによって、ジェネレータネットワークに柔軟性を提供する。
その結果,自然画像統計よりも知覚画像統計を保存することを目的とした。
我々は,新たに訓練した客観的指標とユーザ実験を用いて,戦略を評価し,代替ソリューションと比較する。
関連論文リスト
- Improving Neural Surface Reconstruction with Feature Priors from Multi-View Image [87.00660347447494]
ニューラルサーフェス・コンストラクション(NSR)の最近の進歩は、ボリュームレンダリングと組み合わせることで、マルチビュー・コンストラクションを著しく改善している。
本稿では,多種多様な視覚的タスクから価値ある特徴を活用すべく,特徴レベルの一貫した損失について検討する。
DTU と EPFL を用いて解析した結果,画像マッチングと多視点ステレオデータセットによる特徴が,他のプリテキストタスクよりも優れていたことが判明した。
論文 参考訳(メタデータ) (2024-08-04T16:09:46Z) - Analysis of Deep Image Prior and Exploiting Self-Guidance for Image
Reconstruction [13.277067849874756]
DIPがアンダーサンプドイメージング計測からどのように情報を回収するかを検討する。
ネットワーク重みと入力の両方を同時に最適化する自己駆動型再構築プロセスを導入する。
提案手法は,ネットワーク入力画像と再構成画像の両方の堅牢かつ安定した関節推定を可能にする,新しいデノイザ正規化項を組み込んだものである。
論文 参考訳(メタデータ) (2024-02-06T15:52:23Z) - Iterative-in-Iterative Super-Resolution Biomedical Imaging Using One
Real Image [8.412910029745762]
本稿では,1つの実画像のみを用いて深層学習に基づく超解像モデルを訓練する手法を提案する。
我々は,地中真実に類似した分布を持つ画像を自動的に選択するために,画像スクリーニングの混合指標を用いる。
5回のトレーニングの後、提案されたディープラーニングベースの超解像モデルでは、構造的類似性とピーク信号対雑音比が7.5%と5.49%改善した。
論文 参考訳(メタデータ) (2023-06-26T07:57:03Z) - Domain-Aware Few-Shot Learning for Optical Coherence Tomography Noise
Reduction [0.0]
光コヒーレンストモグラフィ(OCT)ノイズ低減のための数発の教師付き学習フレームワークを提案する。
このフレームワークは、トレーニング速度を劇的に向上させ、単一の画像または画像の一部だけを必要とし、対応するスペックルが地面の真実を抑圧する。
この結果から, 試料の複雑さ, 一般化, 時間効率を向上する可能性が示唆された。
論文 参考訳(メタデータ) (2023-06-13T19:46:40Z) - Generalizable Denoising of Microscopy Images using Generative
Adversarial Networks and Contrastive Learning [0.0]
数発の顕微鏡画像復調のための新しいフレームワークを提案する。
提案手法は,比較学習(CL)を用いて学習したGAN(Generative Adversarial Network)と,損失項を保存する2つの構造を組み合わせたものである。
本手法が3つのよく知られた顕微鏡画像データセットに対して有効であることを示す。
論文 参考訳(メタデータ) (2023-03-27T13:55:07Z) - Real-World Image Super-Resolution by Exclusionary Dual-Learning [98.36096041099906]
実世界の画像超解像は,高品質な画像を得るための実用的な画像復元問題である。
深層学習に基づく手法は、現実世界の超解像データセットの復元に期待できる品質を実現している。
本稿では,RWSR-EDL(Real-World Image Super-Resolution by Exclusionary Dual-Learning)を提案する。
論文 参考訳(メタデータ) (2022-06-06T13:28:15Z) - Is Deep Image Prior in Need of a Good Education? [57.3399060347311]
画像再構成に有効な先行画像として, 奥行き画像が導入された。
その印象的な再建性にもかかわらず、学習技術や伝統的な再建技術と比べてアプローチは遅い。
計算課題に対処する2段階の学習パラダイムを開発する。
論文 参考訳(メタデータ) (2021-11-23T15:08:26Z) - On the Robustness of Pretraining and Self-Supervision for a Deep
Learning-based Analysis of Diabetic Retinopathy [70.71457102672545]
糖尿病網膜症における訓練方法の違いによる影響を比較検討した。
本稿では,定量的性能,学習した特徴表現の統計,解釈可能性,画像歪みに対する頑健性など,さまざまな側面について検討する。
以上の結果から,ImageNet事前学習モデルでは,画像歪みに対する性能,一般化,堅牢性が著しく向上していることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T08:32:45Z) - Enhancing Perceptual Loss with Adversarial Feature Matching for
Super-Resolution [5.258555266148511]
単一画像超解法 (SISR) は不確定な数の有効解を持つ不確定問題である。
これらのパターンアーティファクトの根本原因は、知覚的損失の事前学習目標と超解答目標とのミスマッチに遡ることができる。
論文 参考訳(メタデータ) (2020-05-15T12:36:54Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。