論文の概要: Stride and Translation Invariance in CNNs
- arxiv url: http://arxiv.org/abs/2103.10097v1
- Date: Thu, 18 Mar 2021 09:17:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 01:48:43.591881
- Title: Stride and Translation Invariance in CNNs
- Title(参考訳): CNNにおけるストライドと翻訳不変性
- Authors: Coenraad Mouton, Johannes C. Myburgh, Marelie H. Davel
- Abstract要約: 隣接する画素間の十分な類似性が組み合わさることで,ストライドは翻訳不変性に大きな恩恵をもたらすことを示す。
また,グローバル平均プーリング,アンチエイリアス,データ拡張など,他のソリューションの有効性についても検討した。
- 参考スコア(独自算出の注目度): 2.4213989921339847
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolutional Neural Networks have become the standard for image
classification tasks, however, these architectures are not invariant to
translations of the input image. This lack of invariance is attributed to the
use of stride which ignores the sampling theorem, and fully connected layers
which lack spatial reasoning. We show that stride can greatly benefit
translation invariance given that it is combined with sufficient similarity
between neighbouring pixels, a characteristic which we refer to as local
homogeneity. We also observe that this characteristic is dataset-specific and
dictates the relationship between pooling kernel size and stride required for
translation invariance. Furthermore we find that a trade-off exists between
generalization and translation invariance in the case of pooling kernel size,
as larger kernel sizes lead to better invariance but poorer generalization.
Finally we explore the efficacy of other solutions proposed, namely global
average pooling, anti-aliasing, and data augmentation, both empirically and
through the lens of local homogeneity.
- Abstract(参考訳): 畳み込みニューラルネットワークは画像分類タスクの標準となっているが、これらのアーキテクチャは入力画像の翻訳に不変ではない。
この不変性の欠如は、サンプリング定理を無視したストライドと、空間的推論を欠いた完全連結層の使用によるものである。
ストライドは、局所的同質性と呼ばれる特性である隣接画素間の十分な類似性と組み合わさることから、翻訳不変性に大きく寄与することを示した。
また,この特性はデータセット特異的であり,変換不変性に必要なカーネルサイズとストライドのプーリングの関係を規定している。
さらに、カーネルサイズをプールする場合の一般化と変換不変性の間にはトレードオフが存在し、カーネルサイズが大きくなると分散性は向上するが一般化性は低下する。
最後に,グローバル平均プール,アンチエイリアス,データ拡張など,局所的均一性のレンズを通じて提案する他のソリューションの有効性について検討する。
関連論文リスト
- Masked Discriminators for Content-Consistent Unpaired Image-to-Image
Translation [1.3654846342364308]
画像から画像への変換の欠如の共通のゴールは、ソース画像と翻訳画像の間のコンテンツ一貫性を維持することである。
コンテンツベースのマスクを用いて、両領域のグローバル識別器の入力をマスキングすることは、コンテンツの不整合を著しく低減するのに十分であることを示す。
実験により,本手法は,光現実的シミュレーショナル翻訳と気象翻訳において,最先端の性能を達成できることが判明した。
論文 参考訳(メタデータ) (2023-09-22T21:32:07Z) - Smooth image-to-image translations with latent space interpolations [64.8170758294427]
マルチドメインイメージ・トゥ・イメージ(I2I)変換は、ターゲットドメインのスタイルに応じてソースイメージを変換することができる。
我々の正規化技術は、最先端のI2I翻訳を大きなマージンで改善できることを示す。
論文 参考訳(メタデータ) (2022-10-03T11:57:30Z) - On the Inconsistency of Kernel Ridgeless Regression in Fixed Dimensions [16.704246627541103]
翻訳不変なカーネルを持つカーネルマシンである予測器の重要なクラスが、固定次元における良さの過度なオーバーフィッティングを示さないことを示す。
この結果は、ガウス、ラプラス、コーシーなどの一般的な翻訳不変カーネルに適用できる。
論文 参考訳(メタデータ) (2022-05-26T17:43:20Z) - SePiCo: Semantic-Guided Pixel Contrast for Domain Adaptive Semantic
Segmentation [52.62441404064957]
ドメイン適応セマンティックセグメンテーションは、ラベル付きソースドメインでトレーニングされたモデルを利用することで、ラベル付きターゲットドメイン上で満足のいく密度の予測を試みる。
多くの手法は、ノイズの多い擬似ラベルを緩和する傾向があるが、類似のセマンティックな概念を持つクロスドメインピクセル間の固有の接続を無視する。
本稿では,個々の画素のセマンティックな概念を強調する一段階適応フレームワークSePiCoを提案する。
論文 参考訳(メタデータ) (2022-04-19T11:16:29Z) - Group Equivariant Subsampling [60.53371517247382]
サブサンプリングは、プールやストライド畳み込みの形で畳み込みニューラルネットワーク(CNN)で使用される。
まず、正確な翻訳同変CNNを構築するために使用できる翻訳同変サブサンプリング/アップサンプリング層を導入する。
次に、これらの層を一般群への変換を超えて一般化し、したがって群同変部分サンプリング/アップサンプリングを提案する。
論文 参考訳(メタデータ) (2021-06-10T16:14:00Z) - Tracking translation invariance in CNNs [2.4213989921339847]
標準CNNの異なるアーキテクチャコンポーネントが、そのネットワークが翻訳に対する感受性に及ぼす影響を調査します。
畳み込み型カーネルサイズとゼロパディングの量を変化させることで、生成する特徴マップのサイズを制御する。
また、CNN内の異なる場所における翻訳の不変性を測定し、それぞれの畳み込み層と完全連結層がCNN全体の翻訳の不変性に寄与する程度を決定します。
論文 参考訳(メタデータ) (2021-04-13T08:05:56Z) - Learning Invariances in Neural Networks [51.20867785006147]
ネットワークパラメータや拡張パラメータに関して,拡張性よりも分布をパラメータ化し,トレーニング損失を同時に最適化する方法を示す。
画像分類,回帰,セグメンテーション,分子特性予測における不均一性の正確なセットと範囲を,拡張の広い空間から復元することができる。
論文 参考訳(メタデータ) (2020-10-22T17:18:48Z) - Attentive Normalization for Conditional Image Generation [126.08247355367043]
我々は、従来のインスタンス正規化の拡張である注意的正規化(AN)により、長距離依存を特徴づける。
自己注意型GANと比較して、注意的正規化はすべての位置の相関を測る必要がない。
クラス条件の画像生成とセマンティックインパインティングの実験により,提案モジュールの有効性が検証された。
論文 参考訳(メタデータ) (2020-04-08T06:12:25Z) - Generalizing Convolutional Neural Networks for Equivariance to Lie
Groups on Arbitrary Continuous Data [52.78581260260455]
任意の特定のリー群からの変換に同値な畳み込み層を構築するための一般的な方法を提案する。
同じモデルアーキテクチャを画像、ボール・アンド・スティック分子データ、ハミルトン力学系に適用する。
論文 参考訳(メタデータ) (2020-02-25T17:40:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。