論文の概要: Deep Feature Augmentation for Occluded Image Classification
- arxiv url: http://arxiv.org/abs/2011.00768v1
- Date: Mon, 2 Nov 2020 06:25:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 11:20:35.932124
- Title: Deep Feature Augmentation for Occluded Image Classification
- Title(参考訳): occluded画像分類のための深部特徴強調
- Authors: Feng Cen (1), Xiaoyu Zhao (1), Wuzhuang Li (1) and Guanghui Wang (2)
((1) The Department of Control Science & Engineering, College of Electronics
and Information Engineering, Tongji University, Shanghai 201804, China, (2)
Department of Computer Science, Ryerson University, Toronto, ON, Canada M5B
2K3)
- Abstract要約: 強化深度特徴ベクトル(DFV)を用いた事前学習モデルの微調整により、隠蔽画像の分類精度を向上させる新しい手法を提案する。
各種データセットおよびネットワーク構造に関する実験により、深い特徴増強により、クリーンな画像の性能に顕著な影響を及ぼすことなく、隠蔽画像の分類精度が大幅に向上することが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the difficulty in acquiring massive task-specific occluded images, the
classification of occluded images with deep convolutional neural networks
(CNNs) remains highly challenging. To alleviate the dependency on large-scale
occluded image datasets, we propose a novel approach to improve the
classification accuracy of occluded images by fine-tuning the pre-trained
models with a set of augmented deep feature vectors (DFVs). The set of
augmented DFVs is composed of original DFVs and pseudo-DFVs. The pseudo-DFVs
are generated by randomly adding difference vectors (DVs), extracted from a
small set of clean and occluded image pairs, to the real DFVs. In the
fine-tuning, the back-propagation is conducted on the DFV data flow to update
the network parameters. The experiments on various datasets and network
structures show that the deep feature augmentation significantly improves the
classification accuracy of occluded images without a noticeable influence on
the performance of clean images. Specifically, on the ILSVRC2012 dataset with
synthetic occluded images, the proposed approach achieves 11.21% and 9.14%
average increases in classification accuracy for the ResNet50 networks
fine-tuned on the occlusion-exclusive and occlusion-inclusive training sets,
respectively.
- Abstract(参考訳): タスク固有の隠蔽画像の取得が困難であるため、深い畳み込みニューラルネットワーク(CNN)による隠蔽画像の分類は非常に困難である。
大規模画像データセットへの依存を軽減するため,拡張深度特徴ベクトル(DFV)を用いた事前学習モデルの微調整により,隠蔽画像の分類精度を向上させる新しい手法を提案する。
強化DFVのセットは、オリジナルのDFVと擬似DFVで構成されている。
擬似DFVは、少数の清浄画像対から抽出された差分ベクトル(DV)を実DFVにランダムに付加して生成される。
微調整では、DFVデータフロー上でバックプロパゲーションを行い、ネットワークパラメータを更新する。
各種データセットおよびネットワーク構造を用いた実験により, 深層特徴の強化により, クリーン画像の性能に顕著な影響を及ぼさずに, オクルード画像の分類精度が著しく向上することが示された。
具体的には、合成オクルード画像を用いたilsvrc2012データセットにおいて、オクルージョン排他的およびオクルージョン排他的トレーニングセットに微調整されたresnet50ネットワークの分類精度が、それぞれ11.21%および9.14%向上する。
関連論文リスト
- Transformer-based Clipped Contrastive Quantization Learning for
Unsupervised Image Retrieval [15.982022297570108]
教師なし画像検索は、与えられたクエリ画像の類似画像を取得するために、任意のレベルなしに重要な視覚的特徴を学習することを目的としている。
本稿では,パッチベースの処理により局所的なコンテキストを持つTransformerを用いて,画像のグローバルコンテキストを符号化するTransClippedCLRモデルを提案する。
提案したクリップ付きコントラスト学習の結果は、バニラコントラスト学習と同一のバックボーンネットワークと比較して、すべてのデータセットで大幅に改善されている。
論文 参考訳(メタデータ) (2024-01-27T09:39:11Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Multiscale Structure Guided Diffusion for Image Deblurring [24.09642909404091]
拡散確率モデル (DPM) は画像の劣化に用いられている。
暗黙のバイアスとして、単純だが効果的なマルチスケール構造ガイダンスを導入する。
目に見えないデータのアーティファクトが少ないほど、より堅牢なデブロアリング結果を示します。
論文 参考訳(メタデータ) (2022-12-04T10:40:35Z) - Robustifying Deep Vision Models Through Shape Sensitization [19.118696557797957]
そこで本研究では,ネットワークの全体像を学習するためのインセンティブを明示的に付与する,シンプルで軽量な対向拡張手法を提案する。
我々の拡張は、ランダムに決定された混合比を用いて、シャッフルパッチで、ある画像から別の画像へのエッジマップを重畳する。
この拡張により,データセットやニューラルアーキテクチャの分類精度とロバストネスが大幅に向上することを示す。
論文 参考訳(メタデータ) (2022-11-14T11:17:46Z) - Hierarchical Convolutional Neural Network with Feature Preservation and
Autotuned Thresholding for Crack Detection [5.735035463793008]
ドローンの画像はインフラ表面の欠陥の自動検査にますます使われている。
本稿では,階層型畳み込みニューラルネットワークを用いた深層学習手法を提案する。
提案手法は, 道路, 橋, 舗装の表面ひび割れの同定に応用されている。
論文 参考訳(メタデータ) (2021-04-21T13:07:58Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z) - Boosting Occluded Image Classification via Subspace Decomposition Based
Estimation of Deep Features [23.207937555607952]
本稿では,部分空間分解に基づく推定手法(SDBE)を提案する。
SDBEをベースとした分類方式は,隠蔽画像の分類精度を劇的に向上させる。
論文 参考訳(メタデータ) (2020-01-13T05:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。