論文の概要: On Feature Normalization and Data Augmentation
- arxiv url: http://arxiv.org/abs/2002.11102v3
- Date: Tue, 30 Mar 2021 18:00:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 20:18:27.700031
- Title: On Feature Normalization and Data Augmentation
- Title(参考訳): 特徴正規化とデータ拡張について
- Authors: Boyi Li and Felix Wu and Ser-Nam Lim and Serge Belongie and Kilian Q.
Weinberger
- Abstract要約: モーメント交換は、認識モデルにもモーメント情報を利用するようモデルに促す。
我々は、あるトレーニングイメージの学習した特徴のモーメントを、別のトレーニングイメージのモーメントに置き換え、ターゲットラベルを補間する。
我々のアプローチは高速で、機能空間で完全に動作し、以前の方法と異なる信号が混在しているため、既存の拡張アプローチと効果的に組み合わせることができる。
- 参考スコア(独自算出の注目度): 55.115583969831
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The moments (a.k.a., mean and standard deviation) of latent features are
often removed as noise when training image recognition models, to increase
stability and reduce training time. However, in the field of image generation,
the moments play a much more central role. Studies have shown that the moments
extracted from instance normalization and positional normalization can roughly
capture style and shape information of an image. Instead of being discarded,
these moments are instrumental to the generation process. In this paper we
propose Moment Exchange, an implicit data augmentation method that encourages
the model to utilize the moment information also for recognition models.
Specifically, we replace the moments of the learned features of one training
image by those of another, and also interpolate the target labels -- forcing
the model to extract training signal from the moments in addition to the
normalized features. As our approach is fast, operates entirely in feature
space, and mixes different signals than prior methods, one can effectively
combine it with existing augmentation approaches. We demonstrate its efficacy
across several recognition benchmark data sets where it improves the
generalization capability of highly competitive baseline networks with
remarkable consistency.
- Abstract(参考訳): 遅延特徴のモーメント(平均偏差と標準偏差)は、画像認識モデルのトレーニング時にノイズとして除去され、安定性を高め、トレーニング時間を短縮する。
しかし、画像生成の分野では、モーメントがより中心的な役割を果たす。
サンプルの正規化と位置の正規化から抽出したモーメントは、画像のスタイルや形状情報を大まかに捉えることができる。
廃棄される代わりに、これらの瞬間は生成プロセスに役立ちます。
本稿では、モデルが認識モデルにもモーメント情報を利用するように促す暗黙のデータ拡張手法であるモーメント交換を提案する。
具体的には、あるトレーニングイメージの学習した特徴のモーメントを、別のトレーニングイメージのモーメントに置き換え、ターゲットラベルを補間し、モデルに正規化された特徴に加えて、モーメントからトレーニング信号の抽出を強制する。
我々のアプローチは高速で、機能空間で完全に動作し、以前の方法と異なる信号が混在しているため、既存の拡張アプローチと効果的に組み合わせることができる。
高い競争力を持つベースラインネットワークの一般化能力を向上させるために,いくつかの評価ベンチマークデータセットで有効性を示す。
関連論文リスト
- Active Generation for Image Classification [50.18107721267218]
本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文 参考訳(メタデータ) (2024-03-11T08:45:31Z) - Data-efficient Event Camera Pre-training via Disentangled Masked
Modeling [20.987277885575963]
イベントカメラのための新しいデータ教師付きボクセルベースの自己教師付き学習手法を提案する。
提案手法は,時間的情報を犠牲にしたり,ペア画像データを直接利用したりする従来の手法の限界を克服する。
優れた一般化性能を示し、パラメータが少なく、計算コストも低い様々なタスクで大幅に改善されている。
論文 参考訳(メタデータ) (2024-03-01T10:02:25Z) - Training on Thin Air: Improve Image Classification with Generated Data [28.96941414724037]
Diffusion Inversionは、画像分類のための多種多様な高品質なトレーニングデータを生成するための、シンプルで効果的な方法である。
提案手法は,元のデータ分布を捕捉し,画像を安定拡散の潜在空間に反転させることにより,データカバレッジを確保する。
生成した画像が元のデータセットに取って代わることに成功した3つの重要なコンポーネントを特定します。
論文 参考訳(メタデータ) (2023-05-24T16:33:02Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Temporal Knowledge Graph Reasoning with Low-rank and Model-agnostic
Representations [1.8262547855491458]
低ランクテンソル分解モデル LowFER のパラメータ効率および時間認識拡張系である Time-LowFER を導入する。
時間を表現するための現在のアプローチのいくつかの制限に留意し、時間特徴に対するサイクル対応の時間符号化方式を提案する。
我々は,時間に敏感なデータ処理に着目した統合時間知識グラフ埋め込みフレームワークに本手法を実装した。
論文 参考訳(メタデータ) (2022-04-10T22:24:11Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Effective Distant Supervision for Temporal Relation Extraction [49.20329405920023]
新しい領域における時間的関係抽出モデルを訓練するための主要な障壁は、多様で高品質な例がないことである。
本稿では,時間関係の遠隔管理例を自動的に収集する手法を提案する。
論文 参考訳(メタデータ) (2020-10-24T03:17:31Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z) - Two-Level Adversarial Visual-Semantic Coupling for Generalized Zero-shot
Learning [21.89909688056478]
トレーニング中に推論ネットワークを用いて生成ネットワークを増強する2段階のジョイントアイデアを提案する。
これにより、ビジュアルドメインとセマンティックドメイン間の効果的な知識伝達のための強力な相互モーダル相互作用が提供される。
提案手法は,4つのベンチマークデータセットに対して,いくつかの最先端手法に対して評価し,その性能を示す。
論文 参考訳(メタデータ) (2020-07-15T15:34:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。