論文の概要: Boosting Occluded Image Classification via Subspace Decomposition Based
Estimation of Deep Features
- arxiv url: http://arxiv.org/abs/2001.04066v1
- Date: Mon, 13 Jan 2020 05:36:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 22:49:54.331311
- Title: Boosting Occluded Image Classification via Subspace Decomposition Based
Estimation of Deep Features
- Title(参考訳): 部分空間分解に基づく深部特徴量推定による付加画像分類の高速化
- Authors: Feng Cen and Guanghui Wang
- Abstract要約: 本稿では,部分空間分解に基づく推定手法(SDBE)を提案する。
SDBEをベースとした分類方式は,隠蔽画像の分類精度を劇的に向上させる。
- 参考スコア(独自算出の注目度): 23.207937555607952
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classification of partially occluded images is a highly challenging computer
vision problem even for the cutting edge deep learning technologies. To achieve
a robust image classification for occluded images, this paper proposes a novel
scheme using subspace decomposition based estimation (SDBE). The proposed
SDBE-based classification scheme first employs a base convolutional neural
network to extract the deep feature vector (DFV) and then utilizes the SDBE to
compute the DFV of the original occlusion-free image for classification. The
SDBE is performed by projecting the DFV of the occluded image onto the linear
span of a class dictionary (CD) along the linear span of an occlusion error
dictionary (OED). The CD and OED are constructed respectively by concatenating
the DFVs of a training set and the occlusion error vectors of an extra set of
image pairs. Two implementations of the SDBE are studied in this paper: the
$l_1$-norm and the squared $l_2$-norm regularized least-squares estimates. By
employing the ResNet-152, pre-trained on the ILSVRC2012 training set, as the
base network, the proposed SBDE-based classification scheme is extensively
evaluated on the Caltech-101 and ILSVRC2012 datasets. Extensive experimental
results demonstrate that the proposed SDBE-based scheme dramatically boosts the
classification accuracy for occluded images, and achieves around $22.25\%$
increase in classification accuracy under $20\%$ occlusion on the ILSVRC2012
dataset.
- Abstract(参考訳): 部分隠蔽画像の分類は、最先端のディープラーニング技術においても非常に難しいコンピュータビジョン問題である。
occludedイメージのロバストな画像分類を実現するために,サブスペース分解に基づく推定(sdbe)を用いた新しい手法を提案する。
提案手法では,まず基本畳み込みニューラルネットワークを用いて深部特徴ベクトル(DFV)を抽出し,次にSDBEを用いて元の閉塞のない画像のDFVを分類する。
SDBEは、閉塞された画像のDFVを、閉塞誤り辞書(OED)の線形スパンに沿って、クラス辞書(CD)の線形スパンに投影する。
CDとOEDは、トレーニングセットのDFVと余剰画像対の閉塞誤差ベクトルとを連結して構成される。
SDBEの2つの実装は、$l_1$-normと$l_2$-norm正規化最小二乗推定である。
ILSVRC2012トレーニングセットで事前訓練されたResNet-152をベースネットワークとして、提案したSBDEベースの分類スキームをCaltech-101およびILSVRC2012データセットで広範囲に評価する。
ILSVRC2012データセットにおいて、SDBEに基づく提案手法により、隠蔽画像の分類精度が劇的に向上し、分類精度が約2.25 %の20 %以下に向上することを示した。
関連論文リスト
- Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - APRF: Anti-Aliasing Projection Representation Field for Inverse Problem
in Imaging [74.9262846410559]
Sparse-view Computed Tomography (SVCT) は画像の逆問題である。
近年の研究では、インプリシット・ニューラル・リ表現(INR)を用いて、シングラムとCT画像の座標に基づくマッピングを構築している。
自己教師型SVCT再構成法の提案 -抗エイリアス射影表現場(APRF)-
APRFは空間的制約によって隣接する投影ビュー間の連続的な表現を構築することができる。
論文 参考訳(メタデータ) (2023-07-11T14:04:12Z) - Pushing the Efficiency Limit Using Structured Sparse Convolutions [82.31130122200578]
本稿では,画像の固有構造を利用して畳み込みフィルタのパラメータを削減する構造的スパース畳み込み(SSC)を提案する。
我々は、SSCが効率的なアーキテクチャにおける一般的なレイヤ(奥行き、グループ回り、ポイント回りの畳み込み)の一般化であることを示す。
SSCに基づくアーキテクチャは、CIFAR-10、CIFAR-100、Tiny-ImageNet、ImageNet分類ベンチマークのベースラインと比較して、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-23T18:37:22Z) - Refign: Align and Refine for Adaptation of Semantic Segmentation to
Adverse Conditions [78.71745819446176]
Refignは、ドメイン間の通信を利用する自己学習ベースのUDAメソッドへの汎用的な拡張である。
Refign は,(1) 不確実性を認識した高密度マッチングネットワークを用いて,正常条件画像と対応する悪条件画像とを整列させ,(2) 適応ラベル補正機構を用いて正常予測で悪条件予測を精査する。
このアプローチでは、追加のトレーニングパラメータや、トレーニングのみの計算オーバーヘッドの最小化は導入されず、任意の自己学習ベースのUDAメソッドを改善するためにドロップイン拡張として使用することができる。
論文 参考訳(メタデータ) (2022-07-14T11:30:38Z) - Accurate Cup-to-Disc Ratio Measurement with Tight Bounding Box
Supervision in Fundus Photography [5.517632401040172]
CDRは緑内障の診断において最も重要な指標の1つである。
本研究は, 厳密な拘束箱監視のみを用いて, 底面画像における正確なCDR測定の実現可能性について検討した。
論文 参考訳(メタデータ) (2021-10-03T07:23:40Z) - Hierarchical Convolutional Neural Network with Feature Preservation and
Autotuned Thresholding for Crack Detection [5.735035463793008]
ドローンの画像はインフラ表面の欠陥の自動検査にますます使われている。
本稿では,階層型畳み込みニューラルネットワークを用いた深層学習手法を提案する。
提案手法は, 道路, 橋, 舗装の表面ひび割れの同定に応用されている。
論文 参考訳(メタデータ) (2021-04-21T13:07:58Z) - Deep Feature Augmentation for Occluded Image Classification [0.0]
強化深度特徴ベクトル(DFV)を用いた事前学習モデルの微調整により、隠蔽画像の分類精度を向上させる新しい手法を提案する。
各種データセットおよびネットワーク構造に関する実験により、深い特徴増強により、クリーンな画像の性能に顕著な影響を及ぼすことなく、隠蔽画像の分類精度が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-11-02T06:25:05Z) - A Generalized Kernel Risk Sensitive Loss for Robust Two-Dimensional
Singular Value Decomposition [11.234115388848283]
2次元特異分解(2DSVD)は、画像再構成、分類、クラスタリングなどの画像処理タスクに広く用いられている。
従来の2DSVDは平均二乗誤差(MSE)損失に基づいており、これは外れ値に敏感である。
本稿では,雑音と外乱の一般化されたカーネルリスクに基づくロバストDSVDを提案する。
論文 参考訳(メタデータ) (2020-05-10T14:02:40Z) - Adaptive Fractional Dilated Convolution Network for Image Aesthetics
Assessment [33.945579916184364]
適応型分数拡張畳み込み(AFDC)は、畳み込みカーネルレベルでこの問題に取り組むために開発された。
ミニバッチ学習のための簡潔な定式化を行い,グループ化戦略を用いて計算オーバーヘッドを削減する。
提案手法は,AVAデータセットを用いた画像美学評価において,最先端の性能を実現することを実証した。
論文 参考訳(メタデータ) (2020-04-06T21:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。