論文の概要: Color Visual Illusions: A Statistics-based Computational Model
- arxiv url: http://arxiv.org/abs/2005.08772v2
- Date: Thu, 22 Oct 2020 10:45:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 23:58:47.877480
- Title: Color Visual Illusions: A Statistics-based Computational Model
- Title(参考訳): カラービジュアルイリュージョン:統計に基づく計算モデル
- Authors: Elad Hirsch, Ayellet Tal
- Abstract要約: 大規模なデータセットから学ぶと、パッチの可能性を計算するツールを導入します。
本稿では,鮮明さと色覚の錯覚を統一的に説明できるモデルを提案する。
我々のモデルは、逆向きに同じツールを適用することで、自然画像の視覚錯覚を生成する。
- 参考スコア(独自算出の注目度): 20.204147875108976
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual illusions may be explained by the likelihood of patches in real-world
images, as argued by input-driven paradigms in Neuro-Science. However, neither
the data nor the tools existed in the past to extensively support these
explanations. The era of big data opens a new opportunity to study input-driven
approaches. We introduce a tool that computes the likelihood of patches, given
a large dataset to learn from. Given this tool, we present a model that
supports the approach and explains lightness and color visual illusions in a
unified manner. Furthermore, our model generates visual illusions in natural
images, by applying the same tool, reversely.
- Abstract(参考訳): 視覚錯視は、神経科学の入力駆動パラダイムによって議論されているように、現実世界の画像のパッチの可能性によって説明できる。
しかし、これらの説明を広く支持するデータもツールも過去には存在しなかった。
ビッグデータの時代は、入力駆動アプローチを研究する新しい機会を開く。
大規模なデータセットから学ぶと、パッチの可能性を計算するツールを導入します。
このツールを応用して,アプローチを支援するモデルを提案し,光度と色覚の錯覚を統一的に説明する。
さらに,本モデルでは,同じツールを用いて自然画像の視覚錯覚を逆方向に生成する。
関連論文リスト
- See or Guess: Counterfactually Regularized Image Captioning [32.82695612178604]
本稿では、因果推論を利用して、既存のモデルを介入作業に役立てる汎用画像キャプションフレームワークを提案する。
本手法は幻覚を効果的に低減し,画像への忠実さを向上し,小型および大規模の画像・テキスト・モデル間で高い可搬性を示す。
論文 参考訳(メタデータ) (2024-08-29T17:59:57Z) - Preliminary Report on Mantis Shrimp: a Multi-Survey Computer Vision
Photometric Redshift Model [0.431625343223275]
光度赤偏移推定は天文学の確立されたサブフィールドである。
Mantis Shrimpは、超紫外(GALEX)、光学(PanSTARRS)、赤外線(UnWISE)画像を融合する、測光赤方偏移推定のためのコンピュータビジョンモデルである。
論文 参考訳(メタデータ) (2024-02-05T21:44:19Z) - InDL: A New Dataset and Benchmark for In-Diagram Logic Interpretation
based on Visual Illusion [1.7980584146314789]
本稿では,深層学習モデルの論理解釈能力を評価するための新しい手法を提案する。
これらのモデルを厳格にテストし、ベンチマークするために設計された、ユニークなデータセットであるInDLを構築します。
我々は、6つの古典的な幾何学的錯視を利用して、人間と機械の視覚知覚の比較フレームワークを構築した。
論文 参考訳(メタデータ) (2023-05-28T13:01:32Z) - Interactive Visual Feature Search [8.255656003475268]
視覚特徴探索(Visual Feature Search)は,任意のCNNに適応可能な,インタラクティブな可視化技術である。
このツールを使うと、ユーザーは画像領域をハイライトし、最もよく似たモデル機能を持つデータセットから画像を検索できる。
我々は,医療画像や野生生物の分類など,様々な応用実験を行うことで,モデル行動の異なる側面を解明する方法を実証する。
論文 参考訳(メタデータ) (2022-11-28T04:39:03Z) - Perception Visualization: Seeing Through the Eyes of a DNN [5.9557391359320375]
我々は、Grad-CAMのような現在の説明方法と本質的に異なる、新しい説明形式を開発する。
知覚可視化は、DNNが入力画像で知覚するものの視覚的表現を提供する。
ユーザスタディの結果から,認識の可視化が可能になった場合,人間がシステムの判断をよりよく理解し,予測できることが示される。
論文 参考訳(メタデータ) (2022-04-21T07:18:55Z) - The Intrinsic Dimension of Images and Its Impact on Learning [60.811039723427676]
自然画像データは従来の画素表現の高次元にもかかわらず低次元構造を示すと広く信じられている。
本研究では,一般的なデータセットに次元推定ツールを適用し,深層学習における低次元構造の役割を検討する。
論文 参考訳(メタデータ) (2021-04-18T16:29:23Z) - Visualising Deep Network's Time-Series Representations [93.73198973454944]
機械学習モデルの普及にもかかわらず、多くの場合、モデルの内部で起きていることに関する洞察のないブラックボックスとして運用される。
本稿では,多次元時系列データの可視化に着目し,この問題に対処する手法を提案する。
高周波在庫市場データセットの実験は、この方法が迅速かつ識別可能な可視化を提供することを示しています。
論文 参考訳(メタデータ) (2021-03-12T09:53:34Z) - Explainers in the Wild: Making Surrogate Explainers Robust to
Distortions through Perception [77.34726150561087]
説明における歪みの影響を知覚距離を埋め込むことで評価する手法を提案する。
Imagenet-Cデータセットの画像の説明を生成し、サロゲート説明書の知覚距離を使用して歪んだ画像と参照画像のより一貫性のある説明を作成する方法を示しています。
論文 参考訳(メタデータ) (2021-02-22T12:38:53Z) - ShaRF: Shape-conditioned Radiance Fields from a Single View [54.39347002226309]
本稿では,単一の画像のみのオブジェクトの神経シーン表現を推定する手法を提案する。
この手法の核心は,対象物の幾何学的足場の推定である。
合成画像と実画像の両方において,提案手法の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2021-02-17T16:40:28Z) - This is not the Texture you are looking for! Introducing Novel
Counterfactual Explanations for Non-Experts using Generative Adversarial
Learning [59.17685450892182]
反実用説明システムは、入力画像を変更して反実用推論を可能にする。
本稿では, 対向画像から画像への変換技術に基づく, 対向画像の説明を新たに生成する手法を提案する。
その結果,我々のアプローチは,2つの最先端技術システムよりも,メンタルモデル,説明満足度,信頼度,感情,自己効力に関して有意に優れた結果をもたらすことがわかった。
論文 参考訳(メタデータ) (2020-12-22T10:08:05Z) - NiLBS: Neural Inverse Linear Blend Skinning [59.22647012489496]
本稿では, 従来のスキン加工技術を用いて, ポーズによってパラメータ化されたニューラルネットワークを用いて変形を反転させる手法を提案する。
これらの変形を逆転する能力は、例えば距離関数、符号付き距離関数、占有率)の値を静止ポーズで事前計算し、文字が変形したときに効率的にクエリすることができる。
論文 参考訳(メタデータ) (2020-04-06T20:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。