論文の概要: Sensitivity of sparse codes to image distortions
- arxiv url: http://arxiv.org/abs/2204.07466v1
- Date: Fri, 15 Apr 2022 13:58:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-18 11:54:27.000474
- Title: Sensitivity of sparse codes to image distortions
- Title(参考訳): 画像歪みに対するスパース符号の感度
- Authors: Kyle Luther, H. Sebastian Seung
- Abstract要約: スパース符号は画像歪みに非常に敏感であることを示す。
この感度は、アクティブ辞書要素と高いキャンセル率の線形結合が存在するためである。
- 参考スコア(独自算出の注目度): 4.209801809583906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sparse coding has been proposed as a theory of visual cortex and as an
unsupervised algorithm for learning representations. We show empirically with
the MNIST dataset that sparse codes can be very sensitive to image distortions,
a behavior that may hinder invariant object recognition. A locally linear
analysis suggests that the sensitivity is due to the existence of linear
combinations of active dictionary elements with high cancellation. A nearest
neighbor classifier is shown to perform worse on sparse codes than original
images. For a linear classifier with a sufficiently large number of labeled
examples, sparse codes are shown to yield higher accuracy than original images,
but no higher than a representation computed by a random feedforward net.
Sensitivity to distortions seems to be a basic property of sparse codes, and
one should be aware of this property when applying sparse codes to invariant
object recognition.
- Abstract(参考訳): スパース符号化は視覚野の理論として、および学習表現のための教師なしアルゴリズムとして提案されている。
mnistデータセットでは、スパース符号は画像歪みに非常に敏感であり、不変物体認識を阻害する可能性があることを実証的に示す。
局所線形解析では、この感度はアクティブ辞書要素と高いキャンセル率の線形結合の存在に起因することが示唆されている。
最寄りの隣接分類器は、元の画像よりもスパース符号でパフォーマンスが悪くなる。
ラベル付き例が十分に多い線形分類器では、スパース符号は元の画像よりも高い精度を示すが、ランダムフィードフォワードネットで計算された表現よりも高いものではない。
歪みに対する感度はスパース符号の基本的な性質であり、不変物体認識にスパース符号を適用する際には、この性質に注意する必要がある。
関連論文リスト
- Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Improving Deep Representation Learning via Auxiliary Learnable Target Coding [69.79343510578877]
本稿では,深層表現学習の補助的正規化として,新たな学習対象符号化を提案する。
具体的には、より差別的な表現を促進するために、マージンベースの三重項損失と、提案した目標符号上の相関整合損失を設計する。
論文 参考訳(メタデータ) (2023-05-30T01:38:54Z) - SC-VAE: Sparse Coding-based Variational Autoencoder with Learned ISTA [0.6770292596301478]
そこで本研究では,ISTA (SC-VAE) を用いたスパース符号化に基づくVAEを新たに導入し,スパース符号化を可変オートエンコーダフレームワークに統合する。
2つの画像データセットに対する実験により、我々のモデルは、最先端の手法と比較して、画像再構成結果の改善を実現していることが示された。
論文 参考訳(メタデータ) (2023-03-29T13:18:33Z) - Traditional Classification Neural Networks are Good Generators: They are
Competitive with DDPMs and GANs [104.72108627191041]
従来のニューラルネットワーク分類器は、最先端の生成モデルに匹敵する高品質な画像を生成することができることを示す。
マスクをベースとした再構成モジュールを提案し, 意味的勾配を意識し, 可視画像の合成を行う。
また,本手法は,画像テキスト基盤モデルに関して,テキスト・画像生成にも適用可能であることを示す。
論文 参考訳(メタデータ) (2022-11-27T11:25:35Z) - Dictionary Learning with Uniform Sparse Representations for Anomaly
Detection [2.277447144331876]
本研究では,信号のデータセットにおける異常サンプルの検出において,辞書学習(DL)が果たす役割について検討する。
数値シミュレーションにより、この結果のサブスペースを効率よく利用し、正規データ点上の異常を識別できることが示されている。
論文 参考訳(メタデータ) (2022-01-11T10:22:46Z) - Sparse Coding with Multi-Layer Decoders using Variance Regularization [19.8572592390623]
本稿では,デコーダの正規化を必要とせずに,符号の崩壊を防止する新しいスパース符号化プロトコルを提案する。
本手法は,各潜時符号成分が一定の閾値を超える分散を有するように,直接正規化する。
分散正規化法を用いて訓練した多層デコーダを用いたスパースオートエンコーダは、スペーサー表現を用いた高品質な再構成を実現する。
論文 参考訳(メタデータ) (2021-12-16T21:46:23Z) - Inverse Problems Leveraging Pre-trained Contrastive Representations [88.70821497369785]
破損したデータの表現を復元するための新しい逆問題群について検討する。
コントラスト目的を用いた教師付きインバージョン手法を提案する。
提案手法は,幅広いフォワード演算子においてラベル付きデータのごく一部であっても,エンド・ツー・エンドのベースラインよりも優れる。
論文 参考訳(メタデータ) (2021-10-14T15:06:30Z) - MLF-SC: Incorporating multi-layer features to sparse coding for anomaly
detection [2.2276675054266395]
画像の異常は、カーペットの上の小さな穴から大きな汚れまで、様々なスケールで発生する。
広く使われている異常検出方法の1つであるスパースコーディング(sparse coding)は、画像のスパース表現に使用されるパッチサイズから外れた異常を扱う際に問題となる。
本稿では,マルチスケール機能をスパース符号化に取り入れ,異常検出の性能を向上させることを提案する。
論文 参考訳(メタデータ) (2021-04-09T10:20:34Z) - Adversarial Robustness Across Representation Spaces [35.58913661509278]
逆サロバスト性は、テスト時の知覚できない摂動に対するディープニューラルネットワークの感受性に対応している。
本研究では、複数の自然表現空間に適用された摂動に同時に頑健にできるディープニューラルネットワークのトレーニング問題を考察するために、設定を拡張した。
論文 参考訳(メタデータ) (2020-12-01T19:55:58Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。