論文の概要: Inference via Sparse Coding in a Hierarchical Vision Model
- arxiv url: http://arxiv.org/abs/2108.01548v1
- Date: Tue, 3 Aug 2021 14:55:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-04 16:42:58.422729
- Title: Inference via Sparse Coding in a Hierarchical Vision Model
- Title(参考訳): 階層的ビジョンモデルにおけるスパース符号化による推論
- Authors: Joshua Bowren, Luis Sanchez-Giraldo, and Odelia Schwartz
- Abstract要約: この研究において、スパースコーディングは既存の階層型V2モデルに統合されている。
モデルのコントリビューションは,画像分類タスクを用いて評価された。
スパース符号化のみにより、V2のテクスチャ感度レベルと削除画像領域の推論が向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sparse coding has been incorporated in models of the visual cortex for its
computational advantages and connection to biology. But how the level of
sparsity contributes to performance on visual tasks is not well understood. In
this work, sparse coding has been integrated into an existing hierarchical V2
model (Hosoya and Hyv\"arinen, 2015), but replacing the Independent Component
Analysis (ICA) with an explicit sparse coding in which the degree of sparsity
can be controlled. After training, the sparse coding basis functions with a
higher degree of sparsity resembled qualitatively different structures, such as
curves and corners. The contributions of the models were assessed with image
classification tasks, including object classification, and tasks associated
with mid-level vision including figure-ground classification, texture
classification, and angle prediction between two line stimuli. In addition, the
models were assessed in comparison to a texture sensitivity measure that has
been reported in V2 (Freeman et al., 2013), and a deleted-region inference
task. The results from the experiments show that while sparse coding performed
worse than ICA at classifying images, only sparse coding was able to better
match the texture sensitivity level of V2 and infer deleted image regions, both
by increasing the degree of sparsity in sparse coding. Higher degrees of
sparsity allowed for inference over larger deleted image regions. The mechanism
that allows for this inference capability in sparse coding is described here.
- Abstract(参考訳): スパースコーディングは、計算の利点と生物学とのつながりのために、視覚野のモデルに取り入れられている。
しかし、空間性のレベルが視覚的タスクのパフォーマンスにどのように貢献するかはよく理解されていない。
本研究では、スパース符号化を既存の階層型v2モデル(hosoya and hyv\"arinen, 2015)に統合しているが、独立成分分析(ica)をスパース度を制御する明示的なスパース符号化に置き換えている。
トレーニング後、スパース符号化基底は、曲線やコーナーのような質的に異なる構造に類似した高いスパース度で機能する。
モデルの寄与度は,物体の分類を含む画像分類タスクと,図形の分類,テクスチャの分類,二線刺激間の角度予測を含む中レベルの視覚に関連するタスクで評価した。
さらに,v2 (freeman et al., 2013) で報告されたテクスチャ感度尺度と,削除された領域推定タスクとの比較検討を行った。
実験の結果,スパース符号化は画像の分類においてICAよりも悪い結果を示したが,スパース符号化の疎度を増大させることで,V2のテクスチャ感度レベルと削除画像領域の推測に適合できるのはスパース符号化のみであった。
より大きな削除画像領域に対する推論が可能になった。
スパース符号化におけるこの推論機能を実現するメカニズムを以下に説明する。
関連論文リスト
- Clustering Inductive Biases with Unrolled Networks [4.47196217712431]
本稿では,2部グラフのラプラシア二次形式を通してスペクトルクラスタリングを行うために,潜在表現を暗黙的に局所的に整理したオートエンコーダアーキテクチャ(WLSC)を提案する。
我々の正規化は、ある種の刺激のクラスに対する受容野の早期特殊化と解釈できることを示す。
論文 参考訳(メタデータ) (2023-11-30T02:02:30Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - SC-VAE: Sparse Coding-based Variational Autoencoder with Learned ISTA [0.6770292596301478]
そこで本研究では,ISTA (SC-VAE) を用いたスパース符号化に基づくVAEを新たに導入し,スパース符号化を可変オートエンコーダフレームワークに統合する。
2つの画像データセットに対する実験により、我々のモデルは、最先端の手法と比較して、画像再構成結果の改善を実現していることが示された。
論文 参考訳(メタデータ) (2023-03-29T13:18:33Z) - Dynamic Sub-Cluster-Aware Network for Few-Shot Skin Disease
Classification [31.539129126161978]
本稿では,まれな皮膚疾患の診断における精度を高めるためのサブクラスタ・アウェア・ネットワーク(SCAN)という新しいアプローチを提案する。
SCANの設計を動機づける重要な洞察は、クラス内の皮膚疾患の画像が複数のサブクラスタを示すことが多いという観察である。
数発の皮膚疾患分類のための2つのパブリックデータセットに対する提案手法の評価を行った。
論文 参考訳(メタデータ) (2022-07-03T16:06:04Z) - Large-Margin Representation Learning for Texture Classification [67.94823375350433]
本稿では,テクスチャ分類のための小さなデータセット上で教師付きモデルをトレーニングするために,畳み込み層(CL)と大規模計量学習を組み合わせた新しいアプローチを提案する。
テクスチャと病理画像データセットの実験結果から,提案手法は同等のCNNと比較して計算コストが低く,収束が早く,競争精度が向上することが示された。
論文 参考訳(メタデータ) (2022-06-17T04:07:45Z) - Top-down inference in an early visual cortex inspired hierarchical
Variational Autoencoder [0.0]
我々は変分オートエンコーダの進歩を利用して、自然画像に基づいて訓練された疎い符号化階層型VAEを用いて、初期視覚野を調査する。
一次および二次視覚皮質に見られるものと類似した表現は、軽度の誘導バイアスの下で自然に現れる。
生成モデルを用いた2つの計算のシグネチャに対して,ニューロサイエンスに着想を得た認識モデルの選択が重要であることを示す。
論文 参考訳(メタデータ) (2022-06-01T12:21:58Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - Orthogonal Projection Loss [59.61277381836491]
直交射影損失(OPL)と呼ばれる新しい損失関数を開発する。
OPLは、機能空間におけるクラス内クラスタリングとクラス間分離を直接実施する。
OPLは、慎重な負のマイニングを必要とせず、バッチサイズに敏感であるため、ユニークな利点がある。
論文 参考訳(メタデータ) (2021-03-25T17:58:00Z) - Spatial Dependency Networks: Neural Layers for Improved Generative Image
Modeling [79.15521784128102]
画像生成装置(デコーダ)を構築するための新しいニューラルネットワークを導入し、可変オートエンコーダ(VAE)に適用する。
空間依存ネットワーク(sdns)では、ディープニューラルネットの各レベルにおける特徴マップを空間的にコヒーレントな方法で計算する。
空間依存層による階層型vaeのデコーダの強化は密度推定を大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-03-16T07:01:08Z) - Explainable-by-design Semi-Supervised Representation Learning for
COVID-19 Diagnosis from CT Imaging [23.918269366873567]
本稿では,変分オートエンコーダを用いて効率的な特徴埋め込みを抽出する半教師付き分類パイプラインに基づく説明可能なディープラーニング手法を提案する。
説明可能な分類結果から, 提案する診断システムは, 新型コロナウイルスの分類に極めて有効である。
論文 参考訳(メタデータ) (2020-11-23T20:51:22Z) - Generative Hierarchical Features from Synthesizing Images [65.66756821069124]
画像合成の学習は、広範囲のアプリケーションにまたがって一般化可能な顕著な階層的な視覚的特徴をもたらす可能性があることを示す。
生成的階層的特徴(Generative Hierarchical Feature, GH-Feat)と呼ばれるエンコーダが生成する視覚的特徴は、生成的タスクと識別的タスクの両方に強い伝達性を有する。
論文 参考訳(メタデータ) (2020-07-20T18:04:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。