論文の概要: RIC-CNN: Rotation-Invariant Coordinate Convolutional Neural Network
- arxiv url: http://arxiv.org/abs/2211.11812v1
- Date: Mon, 21 Nov 2022 19:27:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 17:44:45.512342
- Title: RIC-CNN: Rotation-Invariant Coordinate Convolutional Neural Network
- Title(参考訳): RIC-CNN:回転不変座標畳み込みニューラルネットワーク
- Authors: Hanlin Mo and Guoying Zhao
- Abstract要約: 回転不変座標変換(RIC-C)と呼ばれる新しい畳み込み演算を提案する。
CNNの標準畳み込み層を対応するRCC-Cに置き換えることで、RCC-CNNを導出することができる。
RIC-CNNはMNISTの回転試験データセット上で最先端の分類を実現することが観察できる。
- 参考スコア(独自算出の注目度): 56.42518353373004
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent years, convolutional neural network has shown good performance in
many image processing and computer vision tasks. However, a standard CNN model
is not invariant to image rotations. In fact, even slight rotation of an input
image will seriously degrade its performance. This shortcoming precludes the
use of CNN in some practical scenarios. Thus, in this paper, we focus on
designing convolutional layer with good rotation invariance. Specifically,
based on a simple rotation-invariant coordinate system, we propose a new
convolutional operation, called Rotation-Invariant Coordinate Convolution
(RIC-C). Without additional trainable parameters and data augmentation, RIC-C
is naturally invariant to arbitrary rotations around the input center.
Furthermore, we find the connection between RIC-C and deformable convolution,
and propose a simple but efficient approach to implement RIC-C using Pytorch.
By replacing all standard convolutional layers in a CNN with the corresponding
RIC-C, a RIC-CNN can be derived. Using MNIST dataset, we first evaluate the
rotation invariance of RIC-CNN and compare its performance with most of
existing rotation-invariant CNN models. It can be observed that RIC-CNN
achieves the state-of-the-art classification on the rotated test dataset of
MNIST. Then, we deploy RIC-C to VGG, ResNet and DenseNet, and conduct the
classification experiments on two real image datasets. Also, a shallow CNN and
the corresponding RIC-CNN are trained to extract image patch descriptors, and
we compare their performance in patch verification. These experimental results
again show that RIC-C can be easily used as drop in replacement for standard
convolutions, and greatly enhances the rotation invariance of CNN models
designed for different applications.
- Abstract(参考訳): 近年,多くの画像処理やコンピュータビジョンタスクにおいて,畳み込みニューラルネットワークの性能が向上している。
しかし、標準的なCNNモデルは画像回転に不変ではない。
実際、入力画像がわずかに回転しても、その性能は著しく低下する。
この欠点は、いくつかの現実的なシナリオにおいてCNNの使用を妨げる。
そこで本稿では,回転不変性に優れた畳み込み層の設計に着目する。
具体的には、単純な回転不変座標系に基づいて、回転不変座標変換(RIC-C)と呼ばれる新しい畳み込み演算を提案する。
追加のトレーニング可能なパラメータやデータ拡張がなければ、RIC-Cは入力中心周辺の任意の回転に自然に不変である。
さらに, RIC-C と変形可能な畳み込みの関連性を見出した上で, Pytorch を用いた RIC-C の実装方法を提案する。
CNNの標準畳み込み層を対応するRCC-Cに置き換えることで、RCC-CNNを導出することができる。
MNISTデータセットを用いて、まずRIC-CNNの回転不変性を評価し、既存の回転不変CNNモデルと比較する。
RIC-CNNはMNISTの回転試験データセット上で最先端の分類を実現することが観察できる。
次に、VGG、ResNet、DenseNetにRCC-Cをデプロイし、2つの実画像データセットの分類実験を行う。
また、画像パッチ記述子を抽出するために、浅いCNNと対応するRIC-CNNを訓練し、パッチ検証の性能を比較する。
これらの実験結果から、RCC-Cは標準畳み込みの代替として簡単に使用でき、異なるアプリケーション用に設計されたCNNモデルの回転不変性を大幅に向上することが示された。
関連論文リスト
- Achieving Rotation Invariance in Convolution Operations: Shifting from Data-Driven to Mechanism-Assured [18.910817148765176]
本稿では、任意の回転に自然に不変な新しい畳み込み演算を設計する。
従来の回転不変畳み込みニューラルネットワーク(RI-CNN)と比較した。
RIConvsはトレーニングデータに制限がある場合,これらのCNNバックボーンの精度を著しく向上することを示した。
論文 参考訳(メタデータ) (2024-04-17T12:21:57Z) - Revisiting Data Augmentation for Rotational Invariance in Convolutional
Neural Networks [0.29127054707887967]
画像分類のためのCNNにおける回転不変性について検討する。
実験により、データ拡張だけで訓練されたネットワークは、通常の非回転の場合と同様に、回転した画像の分類がほぼ可能であることが示された。
論文 参考訳(メタデータ) (2023-10-12T15:53:24Z) - Sorted Convolutional Network for Achieving Continuous Rotational
Invariance [56.42518353373004]
テクスチャ画像のハンドメイドな特徴に着想を得たSorting Convolution (SC)を提案する。
SCは、追加の学習可能なパラメータやデータ拡張を必要とせずに連続的な回転不変性を達成する。
以上の結果から, SCは, 上記の課題において, 最高の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-05-23T18:37:07Z) - What Does CNN Shift Invariance Look Like? A Visualization Study [87.79405274610681]
畳み込みニューラルネットワーク(CNN)による特徴抽出は、機械学習タスクの画像を表現する一般的な方法である。
我々は,一般的な市販CNNモデルから抽出した特徴量の変動を計測し,可視化することに注力する。
人気ネットワークから抽出された特徴はグローバルに不変ではなく,この分散の中にバイアスやアーティファクトが存在すると結論付けている。
論文 参考訳(メタデータ) (2020-11-09T01:16:30Z) - CyCNN: A Rotation Invariant CNN using Polar Mapping and Cylindrical
Convolution Layers [2.4316550366482357]
本稿では、入力画像の極性マッピングを利用して回転を変換する深部CNNモデルCyCNNを提案する。
CyConv層は円筒状のスライドウインドウ(CSW)機構を利用して、畳み込み層における境界単位の入力イメージ受容場を垂直に拡張する。
トレーニング中にデータ拡張がなければ,CyCNNは従来のCNNモデルと比較して,分類精度を大幅に向上することを示す。
論文 参考訳(メタデータ) (2020-07-21T04:05:35Z) - Dense Steerable Filter CNNs for Exploiting Rotational Symmetry in
Histology Images [3.053417311299492]
組織像は本質的に回転下で対称であり、それぞれの方向が等しく現れる。
Dense Steerable Filter CNN (DSF-CNNs) は、密結合されたフレームワークにおいて、各フィルタの複数の回転コピーを持つグループ畳み込みを使用する。
そこで本研究では,DSF-CNNが3つの異なる課題に適用した場合に,パラメータを著しく少なく,最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2020-04-06T23:12:31Z) - Visual Commonsense R-CNN [102.5061122013483]
本稿では,新しい教師なし特徴表現学習手法であるVisual Commonsense Region-based Convolutional Neural Network (VC R-CNN)を提案する。
VC R-CNNは、キャプションやVQAのような高レベルのタスクのための改善された視覚領域エンコーダとして機能する。
我々は、画像キャプション、VQA、VCRの3つの一般的なタスクのモデルにおいて、VC R-CNNの機能を広く適用し、それら全体で一貫したパフォーマンス向上を観察する。
論文 参考訳(メタデータ) (2020-02-27T15:51:19Z) - Computational optimization of convolutional neural networks using
separated filters architecture [69.73393478582027]
我々は、計算複雑性を低減し、ニューラルネットワーク処理を高速化する畳み込みニューラルネットワーク変換を考える。
畳み込みニューラルネットワーク(CNN)の使用は、計算的に要求が多すぎるにもかかわらず、画像認識の標準的なアプローチである。
論文 参考訳(メタデータ) (2020-02-18T17:42:13Z) - Approximation and Non-parametric Estimation of ResNet-type Convolutional
Neural Networks [52.972605601174955]
本稿では,ResNet型CNNが重要な関数クラスにおいて最小誤差率を達成可能であることを示す。
Barron と H'older のクラスに対する前述のタイプの CNN の近似と推定誤差率を導出する。
論文 参考訳(メタデータ) (2019-03-24T19:42:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。