論文の概要: On Feature Normalization and Data Augmentation
- arxiv url: http://arxiv.org/abs/2002.11102v3
- Date: Tue, 30 Mar 2021 18:00:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 20:18:27.700031
- Title: On Feature Normalization and Data Augmentation
- Title(参考訳): 特徴正規化とデータ拡張について
- Authors: Boyi Li and Felix Wu and Ser-Nam Lim and Serge Belongie and Kilian Q.
Weinberger
- Abstract要約: モーメント交換は、認識モデルにもモーメント情報を利用するようモデルに促す。
我々は、あるトレーニングイメージの学習した特徴のモーメントを、別のトレーニングイメージのモーメントに置き換え、ターゲットラベルを補間する。
我々のアプローチは高速で、機能空間で完全に動作し、以前の方法と異なる信号が混在しているため、既存の拡張アプローチと効果的に組み合わせることができる。
- 参考スコア(独自算出の注目度): 55.115583969831
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The moments (a.k.a., mean and standard deviation) of latent features are
often removed as noise when training image recognition models, to increase
stability and reduce training time. However, in the field of image generation,
the moments play a much more central role. Studies have shown that the moments
extracted from instance normalization and positional normalization can roughly
capture style and shape information of an image. Instead of being discarded,
these moments are instrumental to the generation process. In this paper we
propose Moment Exchange, an implicit data augmentation method that encourages
the model to utilize the moment information also for recognition models.
Specifically, we replace the moments of the learned features of one training
image by those of another, and also interpolate the target labels -- forcing
the model to extract training signal from the moments in addition to the
normalized features. As our approach is fast, operates entirely in feature
space, and mixes different signals than prior methods, one can effectively
combine it with existing augmentation approaches. We demonstrate its efficacy
across several recognition benchmark data sets where it improves the
generalization capability of highly competitive baseline networks with
remarkable consistency.
- Abstract(参考訳): 遅延特徴のモーメント(平均偏差と標準偏差)は、画像認識モデルのトレーニング時にノイズとして除去され、安定性を高め、トレーニング時間を短縮する。
しかし、画像生成の分野では、モーメントがより中心的な役割を果たす。
サンプルの正規化と位置の正規化から抽出したモーメントは、画像のスタイルや形状情報を大まかに捉えることができる。
廃棄される代わりに、これらの瞬間は生成プロセスに役立ちます。
本稿では、モデルが認識モデルにもモーメント情報を利用するように促す暗黙のデータ拡張手法であるモーメント交換を提案する。
具体的には、あるトレーニングイメージの学習した特徴のモーメントを、別のトレーニングイメージのモーメントに置き換え、ターゲットラベルを補間し、モデルに正規化された特徴に加えて、モーメントからトレーニング信号の抽出を強制する。
我々のアプローチは高速で、機能空間で完全に動作し、以前の方法と異なる信号が混在しているため、既存の拡張アプローチと効果的に組み合わせることができる。
高い競争力を持つベースラインネットワークの一般化能力を向上させるために,いくつかの評価ベンチマークデータセットで有効性を示す。
関連論文リスト
- Enhancing Fine-Grained Visual Recognition in the Low-Data Regime Through Feature Magnitude Regularization [23.78498670529746]
抽出した特徴量の均等分布を保証するために正規化手法を導入する。
その明らかな単純さにもかかわらず、我々の手法は様々な細粒度視覚認識データセットに対して顕著な性能向上を示した。
論文 参考訳(メタデータ) (2024-09-03T07:32:46Z) - Boosting Unconstrained Face Recognition with Targeted Style Adversary [10.428185253933004]
ラベル付き集合とラベルなし集合のインスタンスレベルの特徴統計を補間することにより、トレーニングデータをシンプルかつ効果的に拡張する手法を提案する。
TSA(Targeted Style Adversary)と呼ばれるこの手法は,入力領域が特徴統計に反映され,(ii)顔認識モデルの性能がスタイル情報に影響されるという2つの観測結果によって動機付けられている。
論文 参考訳(メタデータ) (2024-08-14T16:13:03Z) - Enhancing Consistency-Based Image Generation via Adversarialy-Trained Classification and Energy-Based Discrimination [13.238373528922194]
本稿では,一貫性に基づく画像の生成を後処理する新しい手法を提案し,その知覚的品質を向上させる。
本手法では,両部位を逆向きに訓練する共同分類器-識別器モデルを用いる。
このジョイントマシンの指導の下で、サンプル特異的な投影勾配を用いることで、合成画像を洗練し、ImageNet 64x64データセット上でFIDスコアを改良した。
論文 参考訳(メタデータ) (2024-05-25T14:53:52Z) - EfficientTrain++: Generalized Curriculum Learning for Efficient Visual Backbone Training [79.96741042766524]
訓練カリキュラムをソフトセレクション機能として再構築する。
自然画像の内容の露光は,データ拡張の強度によって容易に達成できることを示す。
結果のメソッドであるEfficientTrain++は単純で汎用的だが驚くほど効果的である。
論文 参考訳(メタデータ) (2024-05-14T17:00:43Z) - Combating Missing Modalities in Egocentric Videos at Test Time [92.38662956154256]
現実のアプリケーションは、プライバシの懸念、効率性の必要性、ハードウェアの問題により、不完全なモダリティを伴う問題に直面することが多い。
再トレーニングを必要とせずに,テスト時にこの問題に対処する新しい手法を提案する。
MiDlは、欠落したモダリティをテスト時にのみ扱う、自己管理型のオンラインソリューションとしては初めてのものだ。
論文 参考訳(メタデータ) (2024-04-23T16:01:33Z) - Training on Thin Air: Improve Image Classification with Generated Data [28.96941414724037]
Diffusion Inversionは、画像分類のための多種多様な高品質なトレーニングデータを生成するための、シンプルで効果的な方法である。
提案手法は,元のデータ分布を捕捉し,画像を安定拡散の潜在空間に反転させることにより,データカバレッジを確保する。
生成した画像が元のデータセットに取って代わることに成功した3つの重要なコンポーネントを特定します。
論文 参考訳(メタデータ) (2023-05-24T16:33:02Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z) - Two-Level Adversarial Visual-Semantic Coupling for Generalized Zero-shot
Learning [21.89909688056478]
トレーニング中に推論ネットワークを用いて生成ネットワークを増強する2段階のジョイントアイデアを提案する。
これにより、ビジュアルドメインとセマンティックドメイン間の効果的な知識伝達のための強力な相互モーダル相互作用が提供される。
提案手法は,4つのベンチマークデータセットに対して,いくつかの最先端手法に対して評価し,その性能を示す。
論文 参考訳(メタデータ) (2020-07-15T15:34:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。