論文の概要: Cross-Task Benchmarking of CNN Architectures
- arxiv url: http://arxiv.org/abs/2602.22945v1
- Date: Wed, 25 Feb 2026 15:20:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.683634
- Title: Cross-Task Benchmarking of CNN Architectures
- Title(参考訳): CNNアーキテクチャのクロスタスクベンチマーク
- Authors: Kamal Sherawat, Vikrant Bhati,
- Abstract要約: このプロジェクトは、様々なタスクに対する動的畳み込みニューラルネットワーク(CNN)の比較研究を提供する。
我々は、バニラCNN、ハードアテンションベースCNN、ソフトアテンションベースCNN、ローカル(ピクセルワイド)、グローバル(画像ワイド)機能アテンション、全方向CNN(ODConv)の5種類のCNNを比較した。
Tiny ImageNet、Pascal VOC、UCR Time Series Classification Archiveの実験では、注意機構と動的畳み込み手法が精度、効率、計算性能において従来のCNNを一貫して上回っていることが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This project provides a comparative study of dynamic convolutional neural networks (CNNs) for various tasks, including image classification, segmentation, and time series analysis. Based on the ResNet-18 architecture, we compare five variants of CNNs: the vanilla CNN, the hard attention-based CNN, the soft attention-based CNN with local (pixel-wise) and global (image-wise) feature attention, and the omni-directional CNN (ODConv). Experiments on Tiny ImageNet, Pascal VOC, and the UCR Time Series Classification Archive illustrate that attention mechanisms and dynamic convolution methods consistently exceed conventional CNNs in accuracy, efficiency, and computational performance. ODConv was especially effective on morphologically complex images by being able to dynamically adjust to varying spatial patterns. Dynamic CNNs enhanced feature representation and cross-task generalization through adaptive kernel modulation. This project provides perspectives on advanced CNN design architecture for multiplexed data modalities and indicates promising directions in neural network engineering.
- Abstract(参考訳): このプロジェクトは、画像分類、セグメンテーション、時系列解析など、様々なタスクに対する動的畳み込みニューラルネットワーク(CNN)の比較研究を提供する。
ResNet-18アーキテクチャに基づいて、バニラCNN、ハードアテンションベースCNN、ローカル(ピクセルワイド)とグローバル(イメージワイド)の機能アテンションを備えたソフトアテンションベースCNN、全方位CNN(ODConv)の5種類のCNNを比較した。
Tiny ImageNet、Pascal VOC、UCR Time Series Classification Archiveの実験では、注意機構と動的畳み込み手法が精度、効率、計算性能において従来のCNNを一貫して上回っていることが示されている。
ODConvは、様々な空間パターンに動的に適応できるので、形態学的に複雑な画像に特に有効であった。
動的CNNは適応カーネル変調による特徴表現とクロスタスクの一般化を強化した。
このプロジェクトは、多重データモダリティのための高度なCNN設計アーキテクチャの視点を提供し、ニューラルネットワークエンジニアリングにおける有望な方向性を示す。
関連論文リスト
- Performance Analysis of Image Classification on Bangladeshi Datasets [0.0]
畳み込みニューラルネットワーク(CNN)は画像分類タスクにおいて顕著な成功を収めている。
本稿では、カスタム設計のCNNと、画像分類タスクに広く使われているディープラーニングアーキテクチャの比較分析を行う。
論文 参考訳(メタデータ) (2026-01-07T21:15:16Z) - Deformable Convolution Based Road Scene Semantic Segmentation of Fisheye Images in Autonomous Driving [4.720434481945155]
本研究では,近代的変形可能な畳み込みニューラルネットワーク(DCNN)のセマンティックセグメンテーションタスクへの応用について検討する。
実験では,WoodScapeの魚眼画像データセットを10種類の異なるクラスに分割し,複雑な空間関係を捉えるデフォルマブルネットワークの能力を評価する。
変形可能なCNNの統合によるmIoUスコアの大幅な改善は、魚眼画像に存在する幾何歪みを扱う上での有効性を示す。
論文 参考訳(メタデータ) (2024-07-23T17:02:24Z) - Dynamic Semantic Compression for CNN Inference in Multi-access Edge
Computing: A Graph Reinforcement Learning-based Autoencoder [82.8833476520429]
部分オフロードにおける効果的な意味抽出と圧縮のための新しい意味圧縮手法であるオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
セマンティックエンコーダでは、CNNのチャネルアテンション機構に基づく特徴圧縮モジュールを導入し、最も情報性の高い特徴を選択して中間データを圧縮する。
セマンティックデコーダでは、受信した圧縮データから学習して中間データを再構築し、精度を向上させる軽量デコーダを設計する。
論文 参考訳(メタデータ) (2024-01-19T15:19:47Z) - Towards a General Purpose CNN for Long Range Dependencies in
$\mathrm{N}$D [49.57261544331683]
構造変化のない任意の解像度,次元,長さのタスクに対して,連続的な畳み込みカーネルを備えた単一CNNアーキテクチャを提案する。
1$mathrmD$)とビジュアルデータ(2$mathrmD$)の幅広いタスクに同じCCNNを適用することで、我々のアプローチの汎用性を示す。
私たちのCCNNは競争力があり、検討されたすべてのタスクで現在の最先端を上回ります。
論文 参考訳(メタデータ) (2022-06-07T15:48:02Z) - Continual 3D Convolutional Neural Networks for Real-time Processing of
Videos [93.73198973454944]
連続3次元コンテンポラルニューラルネットワーク(Co3D CNN)について紹介する。
Co3D CNNはクリップ・バイ・クリップではなく、フレーム・バイ・フレームで動画を処理する。
本研究では,既存の映像認識モデルの重みを初期化したCo3D CNNを用いて,フレームワイズ計算における浮動小数点演算を10.0-12.4倍削減し,Kinetics-400の精度を2.3-3.8倍に向上したことを示す。
論文 参考訳(メタデータ) (2021-05-31T18:30:52Z) - Receptive Field Regularization Techniques for Audio Classification and
Tagging with Deep Convolutional Neural Networks [7.9495796547433395]
CNNの受容場(RF)のチューニングは,その一般化に不可欠であることを示す。
我々は,CNNのRFを制御し,結果のアーキテクチャを体系的にテストする,いくつかの系統的なアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-26T08:36:29Z) - CG-CNN: Self-Supervised Feature Extraction Through Contextual Guidance and Transfer Learning [0.0]
文脈ガイド型畳み込みニューラルネットワーク(CG-CNN)は、さまざまな領域にまたがる伝達可能な機能を開発するために、自己スーパービジョンとコンテキスト情報を使用する。
この研究は、CaltechやBrodatzのテクスチャ、VibTac-12の触覚データセット、ハイパースペクトル画像、XOR問題やテキスト分析といった課題など、さまざまなデータセットへの応用を通じて、CG-CNNの適応性を示す。
論文 参考訳(メタデータ) (2021-03-02T08:41:12Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Exploring Deep Hybrid Tensor-to-Vector Network Architectures for
Regression Based Speech Enhancement [53.47564132861866]
我々は、CNN-TTというハイブリッドアーキテクチャが、モデルパラメータを小さくして高品質な性能を維持することができることを見出した。
CNN-TTは、音声品質を改善するために、特徴抽出のために下部に複数の畳み込み層で構成されている。
論文 参考訳(メタデータ) (2020-07-25T22:21:05Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。