論文の概要: Turning old models fashion again: Recycling classical CNN networks using
the Lattice Transformation
- arxiv url: http://arxiv.org/abs/2109.13885v1
- Date: Tue, 28 Sep 2021 17:24:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-29 16:33:10.953637
- Title: Turning old models fashion again: Recycling classical CNN networks using
the Lattice Transformation
- Title(参考訳): 古いモデルを再びファッションに変える:格子変換を用いた古典的CNNネットワークのリサイクル
- Authors: Ana Paula G. S. de Almeida and Flavio de Barros Vidal
- Abstract要約: 1990年代初頭、LeCunらは手書き数字の低解像度画像を分類するためにバックプロパゲーションアルゴリズムによって訓練されたCNNモデルを提案した。
2012年、Krizhevskyらは、ImageNetの課題に対して、画像分類の精度を大幅に向上させることで、CNNへの関心を復活させた。
基地としてのマルチストリームネットワークとプリセプション・インフュージョンを用いて,従来の状態のバックボーンを利用するLCNNクロスフュージョン戦略について検討する。
- 参考スコア(独自算出の注目度): 0.5837881923712392
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the early 1990s, the first signs of life of the CNN era were given: LeCun
et al. proposed a CNN model trained by the backpropagation algorithm to
classify low-resolution images of handwritten digits. Undoubtedly, it was a
breakthrough in the field of computer vision. But with the rise of other
classification methods, it fell out fashion. That was until 2012, when
Krizhevsky et al. revived the interest in CNNs by exhibiting considerably
higher image classification accuracy on the ImageNet challenge. Since then, the
complexity of the architectures are exponentially increasing and many
structures are rapidly becoming obsolete. Using multistream networks as a base
and the feature infusion precept, we explore the proposed LCNN cross-fusion
strategy to use the backbones of former state-of-the-art networks on image
classification in order to discover if the technique is able to put these
designs back in the game. In this paper, we showed that we can obtain an
increase of accuracy up to 63.21% on the NORB dataset we comparing with the
original structure. However, no technique is definitive. While our goal is to
try to reuse previous state-of-the-art architectures with few modifications, we
also expose the disadvantages of our explored strategy.
- Abstract(参考訳): 1990年代初期、cnn時代の生命の兆候が示され、lecunらはバックプロパゲーションアルゴリズムによって訓練されたcnnモデルを提案し、手書き文字の低解像度画像を分類した。
コンピュータビジョンの分野では画期的だったことは間違いない。
しかし、他の分類方法の台頭とともに、流行は廃れていった。
これは2012年まで続き、krizhevskyらはimagenetチャレンジでかなり高い画像分類精度を示し、cnnへの関心を復活させた。
それ以来、アーキテクチャの複雑さは指数関数的に増加し、多くの構造が急速に廃れつつある。
マルチストリームネットワークをベースとして機能注入を前提として,従来の最先端ネットワークのバックボーンを画像分類に利用するLCNNクロスフュージョン戦略を探索し,これらの設計をゲームに戻すことができるかどうかを確かめる。
そこで本研究では,本構造との比較により,norbデータセットの精度が63.21%まで向上することを示した。
しかし、その技術は確定していない。
私たちの目標は、ほとんど変更することなく、以前の最先端アーキテクチャを再利用することですが、検討した戦略のデメリットも公開しています。
関連論文リスト
- Training Convolutional Neural Networks with the Forward-Forward
algorithm [1.74440662023704]
Forward Forward (FF)アルゴリズムは、現在まで完全に接続されたネットワークでしか使われていない。
FFパラダイムをCNNに拡張する方法を示す。
我々のFF学習したCNNは、空間的に拡張された新しいラベリング手法を特徴とし、MNISTの手書き桁データセットにおいて99.16%の分類精度を実現している。
論文 参考訳(メタデータ) (2023-12-22T18:56:35Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Variational Deep Image Restoration [20.195082841065947]
本稿では,画像復元のための新しい変分推論フレームワークと,提案フレームワークで記述した復元問題を解決する畳み込みニューラルネットワーク(CNN)構造を提案する。
具体的には,ガウス雑音の除去,実環境雑音の低減,ブラインド画像の超解像,JPEG圧縮アーティファクトの低減について,最先端の性能を提供する。
論文 参考訳(メタデータ) (2022-07-03T16:32:15Z) - Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。
本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。
事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文 参考訳(メタデータ) (2022-01-24T14:12:29Z) - Geometric Data Augmentation Based on Feature Map Ensemble [17.522601831197854]
既存のCNNのバックボーンを変更することなく、幾何学変換に対するロバスト性を向上できる新しいCNNアーキテクチャを提案する。
提案手法は, 最先端データ拡張アルゴリズムと組み合わせて, 性能向上に有効である。
論文 参考訳(メタデータ) (2021-07-22T08:48:54Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - Adaptive Signal Variances: CNN Initialization Through Modern
Architectures [0.7646713951724012]
深層畳み込みニューラルネットワーク(CNN)は、画像処理タスクにおけるそのパフォーマンスに対する不安定な信頼を達成している。
CNN実践者は、学習の安定性が各層でモデルパラメータを初期化する方法に依存するという事実を広く理解している。
論文 参考訳(メタデータ) (2020-08-16T11:26:29Z) - Learning CNN filters from user-drawn image markers for coconut-tree
image classification [78.42152902652215]
本稿では,CNNの特徴抽出器を訓練するために,最小限のユーザ選択画像を必要とする手法を提案する。
本手法は,クラスを識別する画像領域のユーザ描画マーカーから,各畳み込み層のフィルタを学習する。
バックプロパゲーションに基づく最適化には依存せず、ココナッツツリー空中画像のバイナリ分類にその利点を実証する。
論文 参考訳(メタデータ) (2020-08-08T15:50:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。