論文の概要: Predicting the Blur Visual Discomfort for Natural Scenes by the Loss of
Positional Information
- arxiv url: http://arxiv.org/abs/2008.01429v2
- Date: Thu, 12 Nov 2020 19:17:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 00:59:17.208987
- Title: Predicting the Blur Visual Discomfort for Natural Scenes by the Loss of
Positional Information
- Title(参考訳): 位置情報の喪失による自然景観の視覚的不快感の予測
- Authors: Elio D. Di Claudio, Paolo Giannitrapani, Giovanni Jacovitti
- Abstract要約: 調節不良、光学的補正の不十分、あるいは不完全な画像再生によるぼやけの認識は、視覚的不快感の一般的な源である。
本報告では, この不快感は, 観測されたパターンの局所化精度の低下に起因すると考えられる。
自然界の一般的な特徴に合わせて調整された受容野機能モデルを用いて視覚的不快感を予測する。
- 参考スコア(独自算出の注目度): 2.5782420501870287
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The perception of the blur due to accommodation failures, insufficient
optical correction or imperfect image reproduction is a common source of visual
discomfort, usually attributed to an anomalous and annoying distribution of the
image spectrum in the spatial frequency domain. In the present paper, this
discomfort is attributed to a loss of the localization accuracy of the observed
patterns. It is assumed, as a starting perceptual principle, that the visual
system is optimally adapted to pattern localization in a natural environment.
Thus, since the best possible accuracy of the image patterns localization is
indicated by the positional Fisher Information, it is argued that the blur
discomfort is strictly related to a loss of this information. Following this
concept, a receptive field functional model, tuned to common features of
natural scenes, is adopted to predict the visual discomfort. It is a
complex-valued operator, orientation-selective both in the space domain and in
the spatial frequency domain. Starting from the case of Gaussian blur, the
analysis is extended to a generic type of blur by applying a positional Fisher
Information equivalence criterion. Out-of-focus blur and astigmatic blur are
presented as significant examples. The validity of the proposed model is
verified by comparing its predictions with subjective ratings. The model fits
linearly with the experiments reported in independent databases, based on
different protocols and settings.
- Abstract(参考訳): 空間周波数領域における画像スペクトルの異常な分布と異常に起因する視覚的不快感の一般的な原因は、調節不良、光学的補正不足、あるいは不完全な画像再生によるぼやけの認識である。
本稿では,この不快感は,観測されたパターンの局所化精度の低下に起因すると考えられる。
視覚系は、開始知覚原理として、自然環境におけるパターン局在に最適に適応していると仮定される。
したがって、画像パターンの局在化の最良の精度は位置フィッシャー情報によって示されるため、この曖昧な不快感は、この情報の損失と厳密に関連していると論じられる。
この概念に従い、自然シーンの共通特徴に合わせて調整された受容的場汎関数モデルが視覚不快を予測するために採用されている。
複素数値演算子であり、空間領域と空間周波数領域の両方において配向選択的である。
gaussian blurの場合から、位置フィッシャー情報等価性基準を適用することにより、解析を汎用型のぼかしに拡張する。
フォーカス外ボケと乱視ボケが重要な例である。
提案モデルの有効性は,その予測と主観評価を比較して検証する。
このモデルは、異なるプロトコルと設定に基づいて、独立したデータベースで報告された実験と線形に適合する。
関連論文リスト
- GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.78684630040313]
拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。
世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。
本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文 参考訳(メタデータ) (2024-06-11T17:27:23Z) - Common-Sense Bias Discovery and Mitigation for Classification Tasks [16.8259488742528]
画像記述に基づいてデータセットの特徴クラスタを抽出するフレームワークを提案する。
解析された特徴と相関は人間に解釈可能であるので、我々はCommon-Sense Bias Discovery (CSBD) という手法を名づける。
実験の結果,2つのベンチマーク画像データセットに対して,複数の分類タスクに新たなバイアスが生じることがわかった。
論文 参考訳(メタデータ) (2024-01-24T03:56:07Z) - QUIZ: An Arbitrary Volumetric Point Matching Method for Medical Image
Registration [10.788848900099385]
クエリポイントキッザ(QUIZ)という,任意の利害関係のボクセル点に基づく医用画像登録手法を提案する。
本研究は, 頸部がん患者の大変形データセットを用いて本手法の有効性を検証した。
論文 参考訳(メタデータ) (2023-09-30T08:13:40Z) - Breaking Modality Disparity: Harmonized Representation for Infrared and
Visible Image Registration [66.33746403815283]
シーン適応型赤外線と可視画像の登録を提案する。
我々は、異なる平面間の変形をシミュレートするためにホモグラフィーを用いる。
我々は、まず、赤外線と可視画像のデータセットが不一致であることを示す。
論文 参考訳(メタデータ) (2023-04-12T06:49:56Z) - CRADL: Contrastive Representations for Unsupervised Anomaly Detection
and Localization [2.8659934481869715]
医用画像における教師なし異常検出は、訓練中に異常データを必要とせず、任意の異常を検出し、位置決めすることを目的としている。
現在の最先端の手法のほとんどは、画像上で直接動作する潜在変数生成モデルを使用している。
コントラストプレテクストタスクで訓練されたエンコーダの低次元表現空間において,正規サンプルの分布を直接モデル化するCRADLを提案する。
論文 参考訳(メタデータ) (2023-01-05T16:07:49Z) - Sampling Based On Natural Image Statistics Improves Local Surrogate
Explainers [111.31448606885672]
代理説明器は、モデルが予測にどのように到着するかをさらに理解するために、ポストホック解釈法として人気がある。
そこで本研究では,(1)局所領域のサンプリング方法を変更すること,(2)自然画像の分布特性を知覚的指標を用いて伝達すること,の2つの手法を提案する。
論文 参考訳(メタデータ) (2022-08-08T08:10:13Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Unsupervised Foggy Scene Understanding via Self Spatial-Temporal Label
Diffusion [51.11295961195151]
運転シーンの霧画像列の特徴を利用して、自信ある擬似ラベルを密度化する。
局所的な空間的類似性と逐次画像データの隣接時間対応の2つの発見に基づいて,新たなターゲット・ドメイン駆動擬似ラベル拡散方式を提案する。
本手法は,2つの天然霧のデータセット上で51.92%,53.84%の平均交叉結合(mIoU)を達成するのに有効である。
論文 参考訳(メタデータ) (2022-06-10T05:16:50Z) - AnoViT: Unsupervised Anomaly Detection and Localization with Vision
Transformer-based Encoder-Decoder [3.31490164885582]
我々は,画像パッチ間のグローバルな関係を学習することにより,通常の情報を反映する視覚変換器を用いたエンコーダデコーダモデルAnoViTを提案する。
提案モデルは,3つのベンチマークデータセット上での畳み込みモデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-03-21T09:01:37Z) - Consistent Posterior Distributions under Vessel-Mixing: A Regularization
for Cross-Domain Retinal Artery/Vein Classification [30.30848090813239]
網膜A/V分類におけるクロスドメイン学習のための船舶混合型整合性正規化フレームワークを提案する。
提案手法は,対象ドメインに対する教師付き学習によって得られる上界に近い,最先端のクロスドメイン性能を実現する。
論文 参考訳(メタデータ) (2021-03-16T14:18:35Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。