論文の概要: Predicting Eye Fixations Under Distortion Using Bayesian Observers
- arxiv url: http://arxiv.org/abs/2102.03675v1
- Date: Sat, 6 Feb 2021 21:57:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:27:41.645324
- Title: Predicting Eye Fixations Under Distortion Using Bayesian Observers
- Title(参考訳): ベイズオブザーバを用いた歪下眼球固定の予測
- Authors: Zhengzhong Tu
- Abstract要約: 本稿では,ベイズ視覚探索モデルを用いて,画像の歪みが人間の視覚的注意を損なう可能性について検討する。
JPEG圧縮画像上でのMAPおよびEMMモデルの改良実験を行った。
- 参考スコア(独自算出の注目度): 2.132096006921048
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Visual attention is very an essential factor that affects how human perceives
visual signals. This report investigates how distortions in an image could
distract human's visual attention using Bayesian visual search models,
specifically, Maximum-a-posteriori (MAP)
\cite{findlay1982global}\cite{eckstein2001quantifying} and Entropy Limit
Minimization (ELM) \cite{najemnik2009simple}, which predict eye fixation
movements based on a Bayesian probabilistic framework. Experiments on modified
MAP and ELM models on JPEG-compressed images containing blocking or ringing
artifacts were conducted and we observed that compression artifacts can affect
visual attention. We hope this work sheds light on the interactions between
visual attention and perceptual quality.
- Abstract(参考訳): 視覚の注意は、人間の視覚信号の知覚に影響を与える重要な要素である。
本報告は,画像中の歪みがベイズ視覚探索モデル,特にベイズ確率的枠組みに基づく眼球固定運動を予測する最大-a-posteriori (map) \cite{findlay1982[3]}\cite{eckstein2001quantifying} と entropy limit minimization (elm) \cite{najemnik2009simple} を用いて人間の視覚注意を乱す可能性について検討する。
JPEG圧縮画像に対するMAPおよびEMMモデルの改良実験を行い, 圧縮アーチファクトが視覚的注意に影響を及ぼすことを示した。
この作品が視覚的注意と知覚的品質の相互作用に光を当てることを願っています。
関連論文リスト
- Low-Light Enhancement Effect on Classification and Detection: An Empirical Study [48.6762437869172]
我々は,低照度画像強調法(LLIE)が高レベル視覚タスクに与える影響を評価する。
本研究は,人間の視覚知覚における画像強調と,機械解析における切り離しを示唆するものである。
この洞察は、人間と機械の視覚の両方のニーズに合致するLLIE技術の開発に不可欠である。
論文 参考訳(メタデータ) (2024-09-22T14:21:31Z) - Pupil-Adaptive 3D Holography Beyond Coherent Depth-of-Field [42.427021878005405]
ホログラフィックディスプレイのコヒーレントな奥行きと、非コヒーレントな光によって現実世界で見られるものとのギャップを埋める枠組みを提案する。
本稿では,現在のコンピュータによるホログラフィー手法では不可能な画像効果を生み出すために,観察者の眼球の現在の状態に基づいて,その受容場をその場で調整する学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-17T11:01:54Z) - GEM: Context-Aware Gaze EstiMation with Visual Search Behavior Matching for Chest Radiograph [32.1234295417225]
本稿では,放射線科医が収集した視線データを用いて視覚的な探索行動パターンをシミュレートする,文脈対応型Gaze EstiMation (GEM) ネットワークを提案する。
コンテキスト認識モジュール、視覚行動グラフ構築、視覚行動マッチングで構成される。
4つの公開データセットの実験は、既存の方法よりもGEMの方が優れていることを示している。
論文 参考訳(メタデータ) (2024-08-10T09:46:25Z) - Understanding Inhibition Through Maximally Tense Images [0.4999814847776098]
与えられた特徴を同時に励起・抑制する「最大時制画像」(MTI)について検討する。
本稿では,MTIを2つの新しい可視化手法,+/- 帰属インバージョンにより,単一画像を興奮成分と抑制成分に分割する,+/- 帰属アトラスと,画像を興奮・抑制する様々な方法のグローバルな可視化を提供する,属性アトラスについて述べる。
論文 参考訳(メタデータ) (2024-06-08T23:53:13Z) - GazeFusion: Saliency-guided Image Generation [50.37783903347613]
拡散モデルは、テキストプロンプトだけを前提として、前例のない画像生成機能を提供する。
本稿では,人間の視覚的注意の先行するデータを生成プロセスに組み込むためのサリエンシ誘導フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-16T21:01:35Z) - Bridging the Gap: Gaze Events as Interpretable Concepts to Explain Deep
Neural Sequence Models [0.7829352305480283]
本研究では,固定およびサケードに確立された視線事象検出アルゴリズムを用いる。
これらの事象が与える影響を定量的に評価し,その概念的影響を判断する。
論文 参考訳(メタデータ) (2023-04-12T10:15:31Z) - Exploring CLIP for Assessing the Look and Feel of Images [87.97623543523858]
ゼロショット方式で画像の品質知覚(ルック)と抽象知覚(フィール)の両方を評価するために,コントラスト言語-画像事前学習(CLIP)モデルを導入する。
以上の結果から,CLIPは知覚的評価によく適合する有意義な先行情報を捉えることが示唆された。
論文 参考訳(メタデータ) (2022-07-25T17:58:16Z) - Causal Transportability for Visual Recognition [70.13627281087325]
画像とラベルの関連性は、設定間では転送できないため、標準分類器がフェールすることを示す。
次に、すべての共起源を摂食する因果効果が、ドメイン間で不変であることを示す。
これにより、画像分類における因果効果を推定するアルゴリズムを開発する動機付けとなる。
論文 参考訳(メタデータ) (2022-04-26T15:02:11Z) - Bayesian Eye Tracking [63.21413628808946]
モデルに基づく視線追跡は、目の特徴検出エラーの影響を受けやすい。
モデルベースアイトラッキングのためのベイズフレームワークを提案する。
提案手法は,最先端のモデルベースおよび学習ベースの手法と比較して,一般化能力の大幅な向上を示す。
論文 参考訳(メタデータ) (2021-06-25T02:08:03Z) - Just Noticeable Difference for Machine Perception and Generation of
Regularized Adversarial Images with Minimal Perturbation [8.920717493647121]
人間の知覚のジャスト通知差(JND)の概念に触発された機械知覚の尺度を紹介します。
本稿では,機械学習モデルが偽ラベルを出力することで画像の変化を検出するまで,画像を付加雑音で反復的に歪曲する逆画像生成アルゴリズムを提案する。
CIFAR10、ImageNet、MS COCOデータセット上で、アルゴリズムが生成する対向画像の定性的および定量的評価を行います。
論文 参考訳(メタデータ) (2021-02-16T11:01:55Z) - Targeted Adversarial Perturbations for Monocular Depth Prediction [74.61708733460927]
対向摂動が単眼深度予測の課題に及ぼす影響について検討した。
具体的には、シーンの知覚的幾何学を選択的に変化させる、小さくて知覚できない付加的摂動の能力を探求する。
このような摂動は、カメラから予測される距離を世界規模で再スケールするだけでなく、異なるターゲットシーンにマッチするように予測を変更することが可能である。
論文 参考訳(メタデータ) (2020-06-12T19:29:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。