論文の概要: Geometric Data Augmentation Based on Feature Map Ensemble
- arxiv url: http://arxiv.org/abs/2107.10524v1
- Date: Thu, 22 Jul 2021 08:48:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-23 12:53:44.277253
- Title: Geometric Data Augmentation Based on Feature Map Ensemble
- Title(参考訳): 特徴マップアンサンブルに基づく幾何学的データ拡張
- Authors: Takashi Shibata, Masayuki Tanaka, Masatoshi Okutomi
- Abstract要約: 既存のCNNのバックボーンを変更することなく、幾何学変換に対するロバスト性を向上できる新しいCNNアーキテクチャを提案する。
提案手法は, 最先端データ拡張アルゴリズムと組み合わせて, 性能向上に有効である。
- 参考スコア(独自算出の注目度): 17.522601831197854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep convolutional networks have become the mainstream in computer vision
applications. Although CNNs have been successful in many computer vision tasks,
it is not free from drawbacks. The performance of CNN is dramatically degraded
by geometric transformation, such as large rotations. In this paper, we propose
a novel CNN architecture that can improve the robustness against geometric
transformations without modifying the existing backbones of their CNNs. The key
is to enclose the existing backbone with a geometric transformation (and the
corresponding reverse transformation) and a feature map ensemble. The proposed
method can inherit the strengths of existing CNNs that have been presented so
far. Furthermore, the proposed method can be employed in combination with
state-of-the-art data augmentation algorithms to improve their performance. We
demonstrate the effectiveness of the proposed method using standard datasets
such as CIFAR, CUB-200, and Mnist-rot-12k.
- Abstract(参考訳): 深層畳み込みネットワークはコンピュータビジョンアプリケーションで主流となっている。
CNNは多くのコンピュータビジョンタスクで成功したが、欠点はない。
CNNの性能は、大きな回転のような幾何変換によって劇的に劣化する。
本稿では,CNNの既存のバックボーンを変更することなく,幾何変換に対する堅牢性を向上させる新しいCNNアーキテクチャを提案する。
鍵となるのは、既存のバックボーンを幾何学変換(および対応する逆変換)と特徴写像アンサンブルで囲むことである。
提案手法はこれまでに提示された既存のCNNの強みを継承することができる。
さらに,提案手法を最先端データ拡張アルゴリズムと組み合わせることで,その性能を向上させることができる。
CIFAR, CUB-200, Mnist-rot-12kなどの標準データセットを用いて提案手法の有効性を示す。
関連論文リスト
- Model Parallel Training and Transfer Learning for Convolutional Neural Networks by Domain Decomposition [0.0]
ディープ畳み込みニューラルネットワーク(CNN)は、幅広い画像処理アプリケーションで非常に成功したことが示されている。
モデルパラメータの増大と大量のトレーニングデータの増加により、複雑なCNNを効率的に訓練するための並列化戦略が必要である。
論文 参考訳(メタデータ) (2024-08-26T17:35:01Z) - Training Convolutional Neural Networks with the Forward-Forward
algorithm [1.74440662023704]
Forward Forward (FF)アルゴリズムは、現在まで完全に接続されたネットワークでしか使われていない。
FFパラダイムをCNNに拡張する方法を示す。
我々のFF学習したCNNは、空間的に拡張された新しいラベリング手法を特徴とし、MNISTの手書き桁データセットにおいて99.16%の分類精度を実現している。
論文 参考訳(メタデータ) (2023-12-22T18:56:35Z) - An Efficient Evolutionary Deep Learning Framework Based on Multi-source
Transfer Learning to Evolve Deep Convolutional Neural Networks [8.40112153818812]
畳み込みニューラルネットワーク(CNN)は、より複雑なトポロジを導入し、より深くより広いCNNへのキャパシティを拡大することで、長年にわたって、より優れたパフォーマンスを実現してきた。
計算コストは依然としてCNNを自動設計するボトルネックである。
本稿では, CNNを効率的に進化させるために, トランスファーラーニングにヒントを得て, 新たな進化的計算ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-07T20:22:58Z) - Deeply Explain CNN via Hierarchical Decomposition [75.01251659472584]
コンピュータビジョンにおいて、CNNの説明に寄与するいくつかの手法は、中間的特徴がネットワーク予測にどのように影響するかを研究する。
本稿では,CNNの意思決定過程をトップダウンで説明する階層的な分解フレームワークを提案する。
論文 参考訳(メタデータ) (2022-01-23T07:56:04Z) - An Acceleration Method Based on Deep Learning and Multilinear Feature
Space [0.0]
本稿では,大規模CNNアーキテクチャからの学習を伝達するために,Multilinear Feature Space (MFS)法に基づく代替手法を提案する。
提案手法はCNNを用いて特徴マップを生成するが,複雑性低減手法として機能しない。
AMFCと呼ばれる本手法では,事前学習したCNNからの移動学習を用いて,新しいサンプル画像の分類時間を最小限に抑える。
論文 参考訳(メタデータ) (2021-10-16T23:49:12Z) - Turning old models fashion again: Recycling classical CNN networks using
the Lattice Transformation [0.5837881923712392]
1990年代初頭、LeCunらは手書き数字の低解像度画像を分類するためにバックプロパゲーションアルゴリズムによって訓練されたCNNモデルを提案した。
2012年、Krizhevskyらは、ImageNetの課題に対して、画像分類の精度を大幅に向上させることで、CNNへの関心を復活させた。
基地としてのマルチストリームネットワークとプリセプション・インフュージョンを用いて,従来の状態のバックボーンを利用するLCNNクロスフュージョン戦略について検討する。
論文 参考訳(メタデータ) (2021-09-28T17:24:48Z) - Container: Context Aggregation Network [83.12004501984043]
最近の発見は、従来の畳み込みやトランスフォーマーコンポーネントを使わずに、シンプルなベースのソリューションが効果的な視覚表現を生成できることを示している。
マルチヘッドコンテキストアグリゲーションのための汎用ビルディングブロックCONText Ion NERtwokを提案する。
より大規模な入力画像解像度に依存する下流タスクにはスケールしないTransformerベースの手法とは対照的に、当社の効率的なネットワークであるModellightは、オブジェクト検出やインスタンスセグメンテーションネットワークに利用することができる。
論文 参考訳(メタデータ) (2021-06-02T18:09:11Z) - FILTRA: Rethinking Steerable CNN by Filter Transform [59.412570807426135]
操舵可能なCNNの問題は群表現論の側面から研究されている。
フィルタ変換によって構築されたカーネルは群表現論でも解釈可能であることを示す。
この解釈は、ステアブルCNN理論のパズルを完成させ、ステアブル畳み込み演算子を実装するための、新しく簡単なアプローチを提供する。
論文 参考訳(メタデータ) (2021-05-25T03:32:34Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Spherical Transformer: Adapting Spherical Signal to CNNs [53.18482213611481]
Spherical Transformerは、球状信号を標準CNNで直接処理できるベクトルに変換できます。
我々は,球面MNIST認識,3次元オブジェクト分類,全方向画像セマンティックセグメンテーションの課題に対するアプローチを評価する。
論文 参考訳(メタデータ) (2021-01-11T12:33:16Z) - Fusion of CNNs and statistical indicators to improve image
classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。
この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。
我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文 参考訳(メタデータ) (2020-12-20T23:24:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。