論文の概要: $\P$ILCRO: Making Importance Landscapes Flat Again
- arxiv url: http://arxiv.org/abs/2001.09696v2
- Date: Thu, 6 Feb 2020 11:41:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 07:41:14.873169
- Title: $\P$ILCRO: Making Importance Landscapes Flat Again
- Title(参考訳): P$ILCRO: 重要景観を再び平らにする
- Authors: Vincent Moens, Simiao Yu, Gholamreza Salimi-Khorshidi
- Abstract要約: 本稿は、既存の畳み込みアーキテクチャの大部分が、初期化において、特定の特徴のランドスケープを定義していることを示す。
画素単位のランドスケープ曲線正規化対象物に対する P-objective または PILCRO を導出する。
一般的なコンピュータビジョンネットワークのP正規化バージョンは、平坦なランドスケープを持ち、より高速なトレーニングを行い、その結果、精度が向上し、テスト時のノイズに対してより堅牢であることを示す。
- 参考スコア(独自算出の注目度): 7.047473967702792
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolutional neural networks have had a great success in numerous tasks,
including image classification, object detection, sequence modelling, and many
more. It is generally assumed that such neural networks are translation
invariant, meaning that they can detect a given feature independent of its
location in the input image. While this is true for simple cases, where
networks are composed of a restricted number of layer classes and where images
are fairly simple, complex images with common state-of-the-art networks do not
usually enjoy this property as one might hope. This paper shows that most of
the existing convolutional architectures define, at initialisation, a specific
feature importance landscape that conditions their capacity to attend to
different locations of the images later during training or even at test time.
We demonstrate how this phenomenon occurs under specific conditions and how it
can be adjusted under some assumptions. We derive the P-objective, or PILCRO
for Pixel-wise Importance Landscape Curvature Regularised Objective, a simple
regularisation technique that favours weight configurations that produce
smooth, low-curvature importance landscapes that are conditioned on the data
and not on the chosen architecture. Through extensive experiments, we further
show that P-regularised versions of popular computer vision networks have a
flat importance landscape, train faster, result in a better accuracy and are
more robust to noise at test time, when compared to their original counterparts
in common computer-vision classification settings.
- Abstract(参考訳): 畳み込みニューラルネットワークは、画像分類、オブジェクト検出、シーケンスモデリングなど、多くのタスクで大きな成功を収めています。
一般に、これらのニューラルネットワークは翻訳不変であり、入力画像内のその位置に依存しない特定の特徴を検出できると仮定される。
これは単純な場合に当てはまるが、ネットワークが制限されたレイヤークラスで構成されており、画像が比較的単純である場合、一般的な最先端ネットワークを持つ複雑な画像は、望まれるほどこの特性を享受しない。
本稿では,既存の畳み込みアーキテクチャの大部分が初期化時に,訓練後,あるいはテスト時にも,画像の異なる場所への出席を条件に,特定の特徴のランドスケープを定義していることを示す。
この現象が特定の条件下でどのように発生し、ある仮定の下でどのように調整できるかを示す。
Pオブジェクト(PILCRO for Pixel-wise Importance Landscape Curvature Regularized Objective)を導出する。これは、スムーズで低曲率なランドスケープを生成するための単純な正規化手法であり、選択したアーキテクチャに依存しない。
広範にわたる実験により,P-regularizedバージョンのコンピュータビジョンネットワークは,よりフラットなランドスケープを持ち,訓練速度が向上し,精度が向上し,また,従来のコンピュータビジョン分類設定と比較すると,テスト時のノイズに対して堅牢であることを示す。
関連論文リスト
- The Overfocusing Bias of Convolutional Neural Networks: A Saliency-Guided Regularization Approach [11.524573224123905]
CNNは入力画像の狭い特定の領域に基づいて決定を行う。
この振る舞いはモデルの一般化能力を著しく損なう可能性がある。
この問題に対処するために、SGDrop(Saliency Guided Dropout)を紹介します。
論文 参考訳(メタデータ) (2024-09-25T21:30:16Z) - Rotation Equivariant Proximal Operator for Deep Unfolding Methods in Image Restoration [62.41329042683779]
本稿では, 回転対称性を組み込んだ高精度な回転同変近位ネットワークを提案する。
本研究は, 回転対称性の先行を深く展開する枠組みに効果的に組み込む, 高精度な回転同変近位ネットワークを提案する。
論文 参考訳(メタデータ) (2023-12-25T11:53:06Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Multilayer deep feature extraction for visual texture recognition [0.0]
本稿では,テクスチャ分類における畳み込みニューラルネットワークの精度向上に着目した。
事前訓練されたニューラルネットワークの複数の畳み込み層から特徴を抽出し、フィッシャーベクトルを用いてそのような特徴を集約する。
本手法は,ブラジルの植物種識別の実践的課題と同様に,ベンチマークデータセットのテクスチャ分類における有効性を検証する。
論文 参考訳(メタデータ) (2022-08-22T03:53:43Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Cross-Descriptor Visual Localization and Mapping [81.16435356103133]
視覚のローカライゼーションとマッピングは、Mixed Realityとロボティクスシステムの大部分を支える重要な技術である。
特徴表現の連続的な更新を必要とする局所化とマッピングのための3つの新しいシナリオを提案する。
我々のデータ駆動型アプローチは特徴記述子型に非依存であり、計算要求が低く、記述アルゴリズムの数と線形にスケールする。
論文 参考訳(メタデータ) (2020-12-02T18:19:51Z) - An Effective Anti-Aliasing Approach for Residual Networks [27.962502376542588]
周波数エイリアス(英: Frequency aliasing)とは、画像や特徴マップなどの信号のサブサンプリング時に発生する現象であり、サブサンプリング出力の歪みを引き起こす。
トレーニング不能なぼかしフィルタを配置し,キー位置でスムーズなアクティベーション関数を用いることで,この効果を緩和できることを示す。
これらの単純なアーキテクチャ変更は、ImageNet-C上の自然な汚職による画像分類とMeta-Datasetでの少数ショット学習の両方において、アウト・オブ・ディストリビューションの一般化を大幅に改善する。
論文 参考訳(メタデータ) (2020-11-20T22:55:57Z) - Lightweight Modules for Efficient Deep Learning based Image Restoration [20.701733377216932]
そこで我々は,与えられたベースラインモデルの計算的低コストな変種を生成するために,いくつかの軽量な低レベルモジュールを提案する。
その結果,提案するネットワークは,全容量ベースラインと比較して,視覚的に類似した再構成を一貫して出力することがわかった。
論文 参考訳(メタデータ) (2020-07-11T19:35:00Z) - Steering Self-Supervised Feature Learning Beyond Local Pixel Statistics [60.92229707497999]
画像の特定の変換の識別に基づく自己教師型特徴学習の新しい原理を提案する。
実験により,LCI,画像ワープ,回転などの変換を識別する学習が,技術一般化能力の状態を特徴付けることを示した。
論文 参考訳(メタデータ) (2020-04-05T22:09:08Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z) - Contextual Encoder-Decoder Network for Visual Saliency Prediction [42.047816176307066]
本稿では,大規模な画像分類タスクに基づいて事前学習した畳み込みニューラルネットワークに基づくアプローチを提案する。
得られた表現をグローバルなシーン情報と組み合わせて視覚的サリエンシを正確に予測する。
最先端技術と比較して、このネットワークは軽量な画像分類バックボーンに基づいている。
論文 参考訳(メタデータ) (2019-02-18T16:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。