論文の概要: Evolving CNN Architectures: From Custom Designs to Deep Residual Models for Diverse Image Classification and Detection Tasks
- arxiv url: http://arxiv.org/abs/2601.01099v1
- Date: Sat, 03 Jan 2026 07:45:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.029775
- Title: Evolving CNN Architectures: From Custom Designs to Deep Residual Models for Diverse Image Classification and Detection Tasks
- Title(参考訳): CNNアーキテクチャの進化: 多様な画像分類・検出タスクのためのカスタムデザインから深部残留モデルへ
- Authors: Mahmudul Hasan, Mabsur Fatin Bin Hossain,
- Abstract要約: 本稿では,CNNモデルに対するカスタム畳み込みニューラルネットワーク(CNN)アーキテクチャの比較検討を行った。
データセットはバイナリ分類、きめ細かいマルチクラス認識、オブジェクト検出シナリオにまたがる。
本稿では,ネットワーク深度,残差接続,特徴抽出戦略,影響分類,ローカライゼーション性能などのアーキテクチャ要因について分析する。
- 参考スコア(独自算出の注目度): 0.9023847175654603
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents a comparative study of a custom convolutional neural network (CNN) architecture against widely used pretrained and transfer learning CNN models across five real-world image datasets. The datasets span binary classification, fine-grained multiclass recognition, and object detection scenarios. We analyze how architectural factors, such as network depth, residual connections, and feature extraction strategies, influence classification and localization performance. The results show that deeper CNN architectures provide substantial performance gains on fine-grained multiclass datasets, while lightweight pretrained and transfer learning models remain highly effective for simpler binary classification tasks. Additionally, we extend the proposed architecture to an object detection setting, demonstrating its adaptability in identifying unauthorized auto-rickshaws in real-world traffic scenes. Building upon a systematic analysis of custom CNN architectures alongside pretrained and transfer learning models, this study provides practical guidance for selecting suitable network designs based on task complexity and resource constraints.
- Abstract(参考訳): 本稿では,5つの実世界の画像データセットにまたがる学習CNNモデルに対して,カスタム畳み込みニューラルネットワーク(CNN)アーキテクチャの比較検討を行った。
データセットはバイナリ分類、きめ細かいマルチクラス認識、オブジェクト検出シナリオにまたがる。
本稿では,ネットワーク深度,残差接続,特徴抽出戦略,影響分類,ローカライゼーション性能などのアーキテクチャ要因について分析する。
その結果、より深いCNNアーキテクチャは、より詳細なマルチクラスデータセットに対して大幅な性能向上をもたらす一方で、軽量な事前学習および転送学習モデルは、より単純なバイナリ分類タスクに対して非常に効果的であることがわかった。
さらに、提案したアーキテクチャをオブジェクト検出設定に拡張し、現実世界の交通シーンにおける不正なオートリショーを特定する適応性を示す。
本研究は,CNNアーキテクチャを事前訓練および移行学習モデルとともに体系的に解析し,課題複雑性と資源制約に基づいて適切なネットワーク設計を選択するための実践的ガイダンスを提供する。
関連論文リスト
- Training a Custom CNN on Five Heterogeneous Image Datasets [1.4583375893645076]
本研究では,農業・都市領域にまたがる5つのデータセットを対象としたCNNアーキテクチャの有効性について検討した。
これらのデータセットには、照明の差、解像度、環境の複雑さ、クラス不均衡など、さまざまな課題が導入されている。
我々は、ResNet-18やVGG-16など、確立したディープアーキテクチャとともに、軽量でタスク固有のカスタムCNNを評価し、スクラッチとトランスファーラーニングの両方を用いて訓練した。
論文 参考訳(メタデータ) (2026-01-08T08:44:17Z) - Performance Analysis of Image Classification on Bangladeshi Datasets [0.0]
畳み込みニューラルネットワーク(CNN)は画像分類タスクにおいて顕著な成功を収めている。
本稿では、カスタム設計のCNNと、画像分類タスクに広く使われているディープラーニングアーキテクチャの比較分析を行う。
論文 参考訳(メタデータ) (2026-01-07T21:15:16Z) - Tricks and Plug-ins for Gradient Boosting in Image Classification [17.43386196818751]
本稿では,動的特徴選択とBoostCNNの原理を統合したCNN性能向上のための新しいフレームワークを提案する。
以上の結果から,従来のCNNよりも予測性能とトレーニング速度が優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-07-30T17:00:05Z) - Enhanced Convolutional Neural Networks for Improved Image Classification [0.40964539027092917]
CIFAR-10は、小規模のマルチクラスデータセットの分類モデルの性能を評価するために広く使用されているベンチマークである。
本稿では,より深い畳み込みブロック,バッチ正規化,ドロップアウト正規化を統合したCNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-02T04:32:25Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - Anomaly Detection on Attributed Networks via Contrastive Self-Supervised
Learning [50.24174211654775]
本論文では,アトリビュートネットワーク上の異常検出のためのコントラスト型自己監視学習フレームワークを提案する。
このフレームワークは、新しいタイプのコントラストインスタンスペアをサンプリングすることで、ネットワークデータからのローカル情報を完全に活用します。
高次元特性と局所構造から情報埋め込みを学習するグラフニューラルネットワークに基づくコントラスト学習モデルを提案する。
論文 参考訳(メタデータ) (2021-02-27T03:17:20Z) - Fusion of CNNs and statistical indicators to improve image
classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。
この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。
我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文 参考訳(メタデータ) (2020-12-20T23:24:31Z) - Neural networks adapting to datasets: learning network size and topology [77.34726150561087]
ニューラルネットワークは、勾配に基づくトレーニングの過程で、そのサイズとトポロジの両方を学習できるフレキシブルなセットアップを導入します。
結果として得られるネットワークは、特定の学習タスクとデータセットに合わせたグラフの構造を持つ。
論文 参考訳(メタデータ) (2020-06-22T12:46:44Z) - A Semi-Supervised Assessor of Neural Architectures [157.76189339451565]
我々は、ニューラルネットワークの有意義な表現を見つけるためにオートエンコーダを用いる。
アーキテクチャの性能を予測するために、グラフ畳み込みニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-05-14T09:02:33Z) - Convolution Neural Network Architecture Learning for Remote Sensing
Scene Classification [22.29957803992306]
本稿では,リモートセンシングシーン分類のためのアーキテクチャ学習手法を提案する。
本稿では,勾配降下法を用いてアーキテクチャ空間の効率的な探索を可能にする学習戦略を提案する。
アーキテクチャジェネレータは、最終的にパラメータのセットを実験で使用されるCNNにマッピングします。
論文 参考訳(メタデータ) (2020-01-27T07:42:46Z) - Inferring Convolutional Neural Networks' accuracies from their
architectural characterizations [0.0]
CNNのアーキテクチャと性能の関係について検討する。
本稿では,2つのコンピュータビジョンに基づく物理問題において,その特性がネットワークの性能を予測できることを示す。
我々は機械学習モデルを用いて、トレーニング前にネットワークが一定のしきい値精度よりも優れた性能を発揮できるかどうかを予測する。
論文 参考訳(メタデータ) (2020-01-07T16:41:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。