論文の概要: AdaptoVision: A Multi-Resolution Image Recognition Model for Robust and Scalable Classification
- arxiv url: http://arxiv.org/abs/2504.12652v1
- Date: Thu, 17 Apr 2025 05:23:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-18 14:36:59.541674
- Title: AdaptoVision: A Multi-Resolution Image Recognition Model for Robust and Scalable Classification
- Title(参考訳): AdaptoVision:ロバスト・スケーラブル分類のためのマルチ解像度画像認識モデル
- Authors: Md. Sanaullah Chowdhury Lameya Sabrin,
- Abstract要約: AdaptoVisionは、計算複雑性と分類精度を効率的にバランスさせるように設計された、新しい畳み込みニューラルネットワーク(CNN)アーキテクチャである。
強化された残余単位、深さ的に分離可能な畳み込み、階層的なスキップ接続を利用することで、AdaptoVisionはパラメータ数と計算要求を大幅に削減する。
CIFAR-10では95.3%、CIFAR-100では85.77%であり、事前訓練された重量に依存しない。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper introduces AdaptoVision, a novel convolutional neural network (CNN) architecture designed to efficiently balance computational complexity and classification accuracy. By leveraging enhanced residual units, depth-wise separable convolutions, and hierarchical skip connections, AdaptoVision significantly reduces parameter count and computational requirements while preserving competitive performance across various benchmark and medical image datasets. Extensive experimentation demonstrates that AdaptoVision achieves state-of-the-art on BreakHis dataset and comparable accuracy levels, notably 95.3\% on CIFAR-10 and 85.77\% on CIFAR-100, without relying on any pretrained weights. The model's streamlined architecture and strategic simplifications promote effective feature extraction and robust generalization, making it particularly suitable for deployment in real-time and resource-constrained environments.
- Abstract(参考訳): 本稿では,計算複雑性と分類精度を効率的にバランスさせるために設計された,新しい畳み込みニューラルネットワーク(CNN)アーキテクチャであるAdaptoVisionを紹介する。
アダプトビジョンは、強化された残留ユニット、深度的に分離可能な畳み込み、階層的なスキップ接続を活用することで、パラメータ数と計算要求を大幅に削減し、様々なベンチマークや医用画像データセット間の競合性能を保っている。
大規模な実験は、AdaptoVisionがBreakHisデータセットと同等の精度レベル、特にCIFAR-10では95.3\%、CIFAR-100では85.77\%を、事前訓練された重量に頼らずに達成していることを示している。
モデルの合理化されたアーキテクチャと戦略的単純化により、効果的な特徴抽出と堅牢な一般化が促進され、特にリアルタイムおよびリソース制約のある環境での展開に適している。
関連論文リスト
- Subject Representation Learning from EEG using Graph Convolutional Variational Autoencoders [20.364067310176054]
GC-VASEはグラフ畳み込みに基づく変分オートエンコーダであり、脳波データからの主観的表現学習にコントラスト学習を利用する。
本手法は,主観的識別に適した分割ラテント空間アーキテクチャを用いて,頑健な主観的潜在表現をうまく学習する。
論文 参考訳(メタデータ) (2025-01-13T17:29:31Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - IncSAR: A Dual Fusion Incremental Learning Framework for SAR Target Recognition [13.783950035836593]
IncSARは、ターゲット認識における破滅的な忘れに対処するために設計された漸進的な学習フレームワークである。
SAR画像に固有のスペックルノイズを軽減するため、ニューラルネットワーク近似に基づくデノナイジングモジュールを用いる。
MSTAR、SAR-AIRcraft-1.0、OpenSARShipベンチマークデータセットの実験は、IncSARが最先端のアプローチを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2024-10-08T08:49:47Z) - SHA-CNN: Scalable Hierarchical Aware Convolutional Neural Network for Edge AI [6.168286187549952]
本稿では,エッジAIアプリケーションのための階層型認識畳み込みニューラルネットワーク(SHA-CNN)モデルアーキテクチャを提案する。
提案した階層型CNNモデルは、計算効率と精度のバランスをとるために精巧に設計されている。
重要なイノベーションは、モデルの階層的な認識にあり、複数の抽象化レベルで関連する機能を識別し、優先順位付けすることができる。
論文 参考訳(メタデータ) (2024-07-31T06:44:52Z) - Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。
CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。
CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - Unifying Synergies between Self-supervised Learning and Dynamic
Computation [53.66628188936682]
SSLとDCのパラダイム間の相互作用に関する新しい視点を提示する。
SSL設定において、スクラッチから高密度かつゲートされたサブネットワークを同時に学習することは可能であることを示す。
密集エンコーダとゲートエンコーダの事前学習における共進化は、良好な精度と効率のトレードオフをもたらす。
論文 参考訳(メタデータ) (2023-01-22T17:12:58Z) - Effective Invertible Arbitrary Image Rescaling [77.46732646918936]
Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。
本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。
LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-09-26T22:22:30Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。