論文の概要: Comparative Study of CNN Architectures for Binary Classification of Horses and Motorcycles in the VOC 2008 Dataset
- arxiv url: http://arxiv.org/abs/2511.04344v1
- Date: Thu, 06 Nov 2025 13:24:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.428481
- Title: Comparative Study of CNN Architectures for Binary Classification of Horses and Motorcycles in the VOC 2008 Dataset
- Title(参考訳): 2008年VOCデータセットにおける馬とオートバイのバイナリ分類のためのCNNアーキテクチャの比較検討
- Authors: Muhammad Annas Shaikh, Hamza Zaman, Arbaz Asif,
- Abstract要約: 本稿では,VOC 2008データセットにおける馬とオートバイのバイナリ分類のための,9つの畳み込みニューラルネットワークアーキテクチャの包括的評価を行う。
マイノリティクラス強化手法を実装することで,クラス不均衡の問題に対処する。
結果、ConvNeXt-Tinyは、馬検出で95.53%、オートバイ検出で89.12%の最高平均精度(AP)を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a comprehensive evaluation of nine convolutional neural network architectures for binary classification of horses and motorcycles in the VOC 2008 dataset. We address the significant class imbalance problem by implementing minority-class augmentation techniques. Our experiments compare modern architectures including ResNet-50, ConvNeXt-Tiny, DenseNet-121, and Vision Transformer across multiple performance metrics. Results demonstrate substantial performance variations, with ConvNeXt-Tiny achieving the highest Average Precision (AP) of 95.53% for horse detection and 89.12% for motorcycle detection. We observe that data augmentation significantly improves minority class detection, particularly benefiting deeper architectures. This study provides insights into architecture selection for imbalanced binary classification tasks and quantifies the impact of data augmentation strategies in mitigating class imbalance issues in object detection.
- Abstract(参考訳): 本稿では,VOC 2008データセットにおける馬とオートバイのバイナリ分類のための,9つの畳み込みニューラルネットワークアーキテクチャの包括的評価を行う。
マイノリティクラス強化手法を実装することで,クラス不均衡の問題に対処する。
実験では、ResNet-50、ConvNeXt-Tiny、DenseNet-121、Vision Transformerといったモダンなアーキテクチャを、複数のパフォーマンス指標で比較した。
結果、ConvNeXt-Tinyは、馬検出で95.53%、オートバイ検出で89.12%の最高平均精度(AP)を達成した。
我々は、データ拡張がマイノリティクラスの検出を大幅に改善し、特により深いアーキテクチャの恩恵を受けることを観察する。
本研究では,不均衡なバイナリ分類タスクに対するアーキテクチャ選択の洞察を提供し,オブジェクト検出におけるクラス不均衡問題の緩和におけるデータ拡張戦略の影響を定量化する。
関連論文リスト
- Enhanced Convolutional Neural Networks for Improved Image Classification [0.40964539027092917]
CIFAR-10は、小規模のマルチクラスデータセットの分類モデルの性能を評価するために広く使用されているベンチマークである。
本稿では,より深い畳み込みブロック,バッチ正規化,ドロップアウト正規化を統合したCNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-02T04:32:25Z) - Analyzing and Mitigating Bias for Vulnerable Classes: Towards Balanced Representation in Dataset [2.143460356353513]
本研究は、脆弱な道路利用者間のクラス不均衡を調査することに焦点を当てる。
一般的なCNNモデルとビジョントランスフォーマー(ViT)をnuScenesデータセットで利用しています。
提案手法を用いて、CNNモデルのIoU(%)とNDS(%)のメトリクスを71.3から75.6、80.6から83.7に改善する。
論文 参考訳(メタデータ) (2024-01-18T22:10:46Z) - Understanding the Detrimental Class-level Effects of Data Augmentation [63.1733767714073]
最適な平均精度を達成するには、ImageNetで最大20%の個々のクラスの精度を著しく損なうコストがかかる。
本稿では,DAがクラスレベルの学習力学とどのように相互作用するかを理解するためのフレームワークを提案する。
そこで本研究では, クラス条件拡張戦略により, 負の影響を受けるクラスの性能が向上することを示す。
論文 参考訳(メタデータ) (2023-12-07T18:37:43Z) - RobustART: Benchmarking Robustness on Architecture Design and Training
Techniques [170.3297213957074]
ディープニューラルネットワーク(DNN)は敵の雑音に弱い。
アーキテクチャ設計とトレーニングのテクニックが堅牢性にどのように影響するかに関する包括的な研究はない。
本稿では,ImageNet上での包括性調査ベンチマークを提案する。
論文 参考訳(メタデータ) (2021-09-11T08:01:14Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Fusion of CNNs and statistical indicators to improve image
classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。
この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。
我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文 参考訳(メタデータ) (2020-12-20T23:24:31Z) - Balanced Symmetric Cross Entropy for Large Scale Imbalanced and Noisy
Data [8.883228967540402]
ディープ畳み込みニューラルネットワークは、大規模視覚分類タスクにおいて多くの注目を集めている。
本稿では,大規模製品認識タスクのための多種多様な深層畳み込みニューラルネットワークアーキテクチャについて検討する。
論文 参考訳(メタデータ) (2020-07-03T11:24:43Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。