論文の概要: Evolving CNN Architectures: From Custom Designs to Deep Residual Models for Diverse Image Classification and Detection Tasks
- arxiv url: http://arxiv.org/abs/2601.01099v1
- Date: Sat, 03 Jan 2026 07:45:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.029775
- Title: Evolving CNN Architectures: From Custom Designs to Deep Residual Models for Diverse Image Classification and Detection Tasks
- Title(参考訳): CNNアーキテクチャの進化: 多様な画像分類・検出タスクのためのカスタムデザインから深部残留モデルへ
- Authors: Mahmudul Hasan, Mabsur Fatin Bin Hossain,
- Abstract要約: 本稿では,CNNモデルに対するカスタム畳み込みニューラルネットワーク(CNN)アーキテクチャの比較検討を行った。
データセットはバイナリ分類、きめ細かいマルチクラス認識、オブジェクト検出シナリオにまたがる。
本稿では,ネットワーク深度,残差接続,特徴抽出戦略,影響分類,ローカライゼーション性能などのアーキテクチャ要因について分析する。
- 参考スコア(独自算出の注目度): 0.9023847175654603
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents a comparative study of a custom convolutional neural network (CNN) architecture against widely used pretrained and transfer learning CNN models across five real-world image datasets. The datasets span binary classification, fine-grained multiclass recognition, and object detection scenarios. We analyze how architectural factors, such as network depth, residual connections, and feature extraction strategies, influence classification and localization performance. The results show that deeper CNN architectures provide substantial performance gains on fine-grained multiclass datasets, while lightweight pretrained and transfer learning models remain highly effective for simpler binary classification tasks. Additionally, we extend the proposed architecture to an object detection setting, demonstrating its adaptability in identifying unauthorized auto-rickshaws in real-world traffic scenes. Building upon a systematic analysis of custom CNN architectures alongside pretrained and transfer learning models, this study provides practical guidance for selecting suitable network designs based on task complexity and resource constraints.
- Abstract(参考訳): 本稿では,5つの実世界の画像データセットにまたがる学習CNNモデルに対して,カスタム畳み込みニューラルネットワーク(CNN)アーキテクチャの比較検討を行った。
データセットはバイナリ分類、きめ細かいマルチクラス認識、オブジェクト検出シナリオにまたがる。
本稿では,ネットワーク深度,残差接続,特徴抽出戦略,影響分類,ローカライゼーション性能などのアーキテクチャ要因について分析する。
その結果、より深いCNNアーキテクチャは、より詳細なマルチクラスデータセットに対して大幅な性能向上をもたらす一方で、軽量な事前学習および転送学習モデルは、より単純なバイナリ分類タスクに対して非常に効果的であることがわかった。
さらに、提案したアーキテクチャをオブジェクト検出設定に拡張し、現実世界の交通シーンにおける不正なオートリショーを特定する適応性を示す。
本研究は,CNNアーキテクチャを事前訓練および移行学習モデルとともに体系的に解析し,課題複雑性と資源制約に基づいて適切なネットワーク設計を選択するための実践的ガイダンスを提供する。
関連論文リスト
- Tricks and Plug-ins for Gradient Boosting in Image Classification [17.43386196818751]
本稿では,動的特徴選択とBoostCNNの原理を統合したCNN性能向上のための新しいフレームワークを提案する。
以上の結果から,従来のCNNよりも予測性能とトレーニング速度が優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-07-30T17:00:05Z) - Enhanced Convolutional Neural Networks for Improved Image Classification [0.40964539027092917]
CIFAR-10は、小規模のマルチクラスデータセットの分類モデルの性能を評価するために広く使用されているベンチマークである。
本稿では,より深い畳み込みブロック,バッチ正規化,ドロップアウト正規化を統合したCNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-02T04:32:25Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - Neural networks adapting to datasets: learning network size and topology [77.34726150561087]
ニューラルネットワークは、勾配に基づくトレーニングの過程で、そのサイズとトポロジの両方を学習できるフレキシブルなセットアップを導入します。
結果として得られるネットワークは、特定の学習タスクとデータセットに合わせたグラフの構造を持つ。
論文 参考訳(メタデータ) (2020-06-22T12:46:44Z) - A Semi-Supervised Assessor of Neural Architectures [157.76189339451565]
我々は、ニューラルネットワークの有意義な表現を見つけるためにオートエンコーダを用いる。
アーキテクチャの性能を予測するために、グラフ畳み込みニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-05-14T09:02:33Z) - Convolution Neural Network Architecture Learning for Remote Sensing
Scene Classification [22.29957803992306]
本稿では,リモートセンシングシーン分類のためのアーキテクチャ学習手法を提案する。
本稿では,勾配降下法を用いてアーキテクチャ空間の効率的な探索を可能にする学習戦略を提案する。
アーキテクチャジェネレータは、最終的にパラメータのセットを実験で使用されるCNNにマッピングします。
論文 参考訳(メタデータ) (2020-01-27T07:42:46Z) - Inferring Convolutional Neural Networks' accuracies from their
architectural characterizations [0.0]
CNNのアーキテクチャと性能の関係について検討する。
本稿では,2つのコンピュータビジョンに基づく物理問題において,その特性がネットワークの性能を予測できることを示す。
我々は機械学習モデルを用いて、トレーニング前にネットワークが一定のしきい値精度よりも優れた性能を発揮できるかどうかを予測する。
論文 参考訳(メタデータ) (2020-01-07T16:41:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。