論文の概要: Incorporating Image Gradients as Secondary Input Associated with Input
Image to Improve the Performance of the CNN Model
- arxiv url: http://arxiv.org/abs/2006.04570v1
- Date: Fri, 5 Jun 2020 14:01:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 03:54:35.710677
- Title: Incorporating Image Gradients as Secondary Input Associated with Input
Image to Improve the Performance of the CNN Model
- Title(参考訳): CNNモデルの性能向上のための入力画像関連二次入力としての画像勾配の導入
- Authors: Vijay Pandey, Shashi Bhushan Jha
- Abstract要約: 既存のCNNアーキテクチャでは、与えられた入力の1つの形式のみがネットワークに供給される。
与えられた入力を複数の形式で同時にネットワークに渡す新しいアーキテクチャが提案されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: CNN is very popular neural network architecture in modern days. It is
primarily most used tool for vision related task to extract the important
features from the given image. Moreover, CNN works as a filter to extract the
important features using convolutional operation in distinct layers. In
existing CNN architectures, to train the network on given input, only single
form of given input is fed to the network. In this paper, new architecture has
been proposed where given input is passed in more than one form to the network
simultaneously by sharing the layers with both forms of input. We incorporate
image gradient as second form of the input associated with the original input
image and allowing both inputs to flow in the network using same number of
parameters to improve the performance of the model for better generalization.
The results of the proposed CNN architecture, applying on diverse set of
datasets such as MNIST, CIFAR10 and CIFAR100 show superior result compared to
the benchmark CNN architecture considering inputs in single form.
- Abstract(参考訳): CNNは、現代において非常に人気のあるニューラルネットワークアーキテクチャである。
主に視覚関連タスクにおいて、与えられた画像から重要な特徴を抽出するために使用される。
さらに、cnnはフィルターとして働き、異なる層で畳み込み操作を使用して重要な特徴を抽出する。
既存のcnnアーキテクチャでは、与えられた入力でネットワークをトレーニングするために、与えられた入力の1つの形式のみがネットワークに供給される。
本稿では,入力層を2つの入力形式で共有することにより,入力を複数の形式でネットワークに同時に渡す新しいアーキテクチャを提案する。
画像勾配を元の入力画像に付随する入力の2番目の形として取り入れ、同じ数のパラメータを用いて両方の入力をネットワーク内へ流し、より一般化するためにモデルの性能を向上させる。
MNIST, CIFAR10, CIFAR100などの多様なデータセットに適用したCNNアーキテクチャの結果は, 単一形式の入力を考慮したベンチマークCNNアーキテクチャと比較して, 優れた結果を示した。
関連論文リスト
- Model Parallel Training and Transfer Learning for Convolutional Neural Networks by Domain Decomposition [0.0]
ディープ畳み込みニューラルネットワーク(CNN)は、幅広い画像処理アプリケーションで非常に成功したことが示されている。
モデルパラメータの増大と大量のトレーニングデータの増加により、複雑なCNNを効率的に訓練するための並列化戦略が必要である。
論文 参考訳(メタデータ) (2024-08-26T17:35:01Z) - CNN2GNN: How to Bridge CNN with GNN [59.42117676779735]
蒸留によりCNNとGNNを統一する新しいCNN2GNNフレームワークを提案する。
Mini-ImageNetにおける蒸留ブースターの2層GNNの性能は、ResNet152のような数十層を含むCNNよりもはるかに高い。
論文 参考訳(メタデータ) (2024-04-23T08:19:08Z) - Training Convolutional Neural Networks with the Forward-Forward
algorithm [1.74440662023704]
Forward Forward (FF)アルゴリズムは、現在まで完全に接続されたネットワークでしか使われていない。
FFパラダイムをCNNに拡張する方法を示す。
我々のFF学習したCNNは、空間的に拡張された新しいラベリング手法を特徴とし、MNISTの手書き桁データセットにおいて99.16%の分類精度を実現している。
論文 参考訳(メタデータ) (2023-12-22T18:56:35Z) - HAT: Hierarchical Aggregation Transformers for Person Re-identification [87.02828084991062]
我々は,CNNとトランスフォーマーの両方の利点を,高性能な画像ベース人物Re-IDに適用する。
作業は、画像ベースのRe-IDのためのCNNとTransformerの両方の利点を初めて活用する。
論文 参考訳(メタデータ) (2021-07-13T09:34:54Z) - ResMLP: Feedforward networks for image classification with
data-efficient training [73.26364887378597]
画像分類のための多層パーセプトロン上に構築されたアーキテクチャであるResMLPを提案する。
Timmライブラリと事前トレーニングされたモデルに基づいたコードを共有します。
論文 参考訳(メタデータ) (2021-05-07T17:31:44Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Combining pretrained CNN feature extractors to enhance clustering of
complex natural images [27.784346095205358]
本稿では,画像クラスタリング(IC)における事前学習CNN機能の利用に関する知見を提供することを目的とする。
そこで本研究では,IC問題をマルチビュークラスタリング(MVC)問題として再構成することを提案する。
次に、MVC問題を効果的に解くためにエンドツーエンドに訓練されたマルチインプットニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-01-07T21:23:04Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z) - Dynamic Graph: Learning Instance-aware Connectivity for Neural Networks [78.65792427542672]
動的グラフネットワーク(DG-Net)は完全な有向非巡回グラフであり、ノードは畳み込みブロックを表し、エッジは接続経路を表す。
ネットワークの同じパスを使用する代わりに、DG-Netは各ノードの機能を動的に集約する。
論文 参考訳(メタデータ) (2020-10-02T16:50:26Z) - Efficient and Model-Based Infrared and Visible Image Fusion Via
Algorithm Unrolling [24.83209572888164]
赤外線および可視画像融合(IVIF)は、赤外線画像からの熱放射情報を保持する画像と、可視画像からテクスチャの詳細を取得することを期待している。
従来のCNNベースのIVIFモデルの欠点を克服するために,モデルベース畳み込みニューラルネットワーク(CNN)モデルを提案する。
論文 参考訳(メタデータ) (2020-05-12T16:15:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。