論文の概要: Latent Enhancing AutoEncoder for Occluded Image Classification
- arxiv url: http://arxiv.org/abs/2402.06936v1
- Date: Sat, 10 Feb 2024 12:22:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 18:30:48.613337
- Title: Latent Enhancing AutoEncoder for Occluded Image Classification
- Title(参考訳): occluded画像分類のための潜在強調オートエンコーダ
- Authors: Ketan Kotwal, Tanay Deshmukh, and Preeti Gopal
- Abstract要約: LEARN: Latent Enhancing feature Reconstruction Networkを紹介する。
オートエンコーダベースのネットワークで、頭の前に分類モデルに組み込むことができる。
OccludedPASCAL3D+データセットでは、提案されたLEARNが標準分類モデルより優れている。
- 参考スコア(独自算出の注目度): 2.6217304977339473
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large occlusions result in a significant decline in image classification
accuracy. During inference, diverse types of unseen occlusions introduce
out-of-distribution data to the classification model, leading to accuracy
dropping as low as 50%. As occlusions encompass spatially connected regions,
conventional methods involving feature reconstruction are inadequate for
enhancing classification performance. We introduce LEARN: Latent Enhancing
feAture Reconstruction Network -- An auto-encoder based network that can be
incorporated into the classification model before its classifier head without
modifying the weights of classification model. In addition to reconstruction
and classification losses, training of LEARN effectively combines intra- and
inter-class losses calculated over its latent space -- which lead to
improvement in recovering latent space of occluded data, while preserving its
class-specific discriminative information. On the OccludedPASCAL3D+ dataset,
the proposed LEARN outperforms standard classification models (VGG16 and
ResNet-50) by a large margin and up to 2% over state-of-the-art methods. In
cross-dataset testing, our method improves the average classification accuracy
by more than 5% over the state-of-the-art methods. In every experiment, our
model consistently maintains excellent accuracy on in-distribution data.
- Abstract(参考訳): 大きなオクルージョンにより、画像の分類精度が著しく低下する。
推論中、様々な種類の未発見のオクルージョンが分類モデルに分散データを導入し、精度が50%まで低下する。
閉塞は空間的に連結した領域を包含するので、特徴再構成を含む従来の手法は分類性能を高めるには不十分である。
LEARN: Latent Enhancing feature Reconstruction Network - 分類モデルの重みを変更することなく、分類モデルに組み込むことができる自動エンコーダベースのネットワーク。
再構築と分類の損失に加えて、LEARNのトレーニングは、潜伏空間上で計算されたクラス内およびクラス間損失を効果的に組み合わせている。
OccludedPASCAL3D+データセットでは、提案されたLEARNは標準的な分類モデル(VGG16とResNet-50)を、最先端の手法よりも最大2%高いマージンで上回っている。
クロスデータセットテストでは,最先端手法に比べて平均分類精度が5%以上向上した。
全ての実験において、我々のモデルは、分配データに対する優れた精度を一貫して維持する。
関連論文リスト
- Anti-Collapse Loss for Deep Metric Learning Based on Coding Rate Metric [99.19559537966538]
DMLは、分類、クラスタリング、検索といった下流タスクのための識別可能な高次元埋め込み空間を学習することを目的としている。
埋め込み空間の構造を維持し,特徴の崩壊を避けるために,反崩壊損失と呼ばれる新しい損失関数を提案する。
ベンチマークデータセットの総合実験により,提案手法が既存の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-07-03T13:44:20Z) - DiGeo: Discriminative Geometry-Aware Learning for Generalized Few-Shot
Object Detection [39.937724871284665]
汎用的な少ショットオブジェクト検出は、豊富なアノテーションと限られたトレーニングデータを持つ新しいクラスで、両方のベースクラス上で正確な検出を実現することを目的としている。
既存のアプローチは、ベースクラスのパフォーマンスを犠牲にして、数ショットの一般化を促進する。
クラス間分離とクラス内コンパクト性の幾何学的特徴を学習するための新しいトレーニングフレームワークDiGeoを提案する。
論文 参考訳(メタデータ) (2023-03-16T22:37:09Z) - Classification of datasets with imputed missing values: does imputation
quality matter? [2.7646249774183]
不完全なデータセットでサンプルを分類するのは簡単ではない。
品質を評価するのによく使われる尺度がいかに欠陥があるかを実証する。
本稿では,データ全体の分布をいかに再現するかに焦点をあてた,新たな相違点のクラスを提案する。
論文 参考訳(メタデータ) (2022-06-16T22:58:03Z) - Exploring Category-correlated Feature for Few-shot Image Classification [27.13708881431794]
本稿では,従来の知識として,新しいクラスとベースクラスのカテゴリ相関を探索し,シンプルで効果的な特徴補正手法を提案する。
提案手法は, 広く使用されている3つのベンチマークにおいて, 一定の性能向上が得られる。
論文 参考訳(メタデータ) (2021-12-14T08:25:24Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - Semantic Perturbations with Normalizing Flows for Improved
Generalization [62.998818375912506]
我々は、非教師付きデータ拡張を定義するために、潜在空間における摂動が利用できることを示す。
トレーニングを通して分類器に適応する潜伏性対向性摂動が最も効果的であることが判明した。
論文 参考訳(メタデータ) (2021-08-18T03:20:00Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z) - Discriminative Multi-level Reconstruction under Compact Latent Space for
One-Class Novelty Detection [19.675670045855874]
一クラスのノベルティ検出では、モデルがクラス内のデータのみを学習して、クラス外のインスタンスを抽出する。
クラス内のデータのコンパクト表現と非崩壊表現の両方を学習する識別コンパクトAEを提案する。
論文 参考訳(メタデータ) (2020-03-03T17:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。