論文の概要: Towards Efficient and Data Agnostic Image Classification Training
Pipeline for Embedded Systems
- arxiv url: http://arxiv.org/abs/2108.07049v1
- Date: Mon, 16 Aug 2021 12:38:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 14:59:31.780476
- Title: Towards Efficient and Data Agnostic Image Classification Training
Pipeline for Embedded Systems
- Title(参考訳): 組込みシステムのための効率的な画像分類学習パイプラインの実現に向けて
- Authors: Kirill Prokofiev and Vladislav Sovrasov
- Abstract要約: 本研究は,画像分類における最新の拡張および正規化手法の見直しに重点を置いている。
各タスクにパラメータを手動で調整することなく、様々なダウンストリーム画像分類タスクにおいて合理的なパフォーマンスを実現することができる。
結果モデルは計算効率が良く、OpenVINOツールキットを使ってCPUにデプロイできる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nowadays deep learning-based methods have achieved a remarkable progress at
the image classification task among a wide range of commonly used datasets
(ImageNet, CIFAR, SVHN, Caltech 101, SUN397, etc.). SOTA performance on each of
the mentioned datasets is obtained by careful tuning of the model architecture
and training tricks according to the properties of the target data. Although
this approach allows setting academic records, it is unrealistic that an
average data scientist would have enough resources to build a sophisticated
training pipeline for every image classification task he meets in practice.
This work is focusing on reviewing the latest augmentation and regularization
methods for the image classification and exploring ways to automatically choose
some of the most important hyperparameters: total number of epochs, initial
learning rate value and it's schedule. Having a training procedure equipped
with a lightweight modern CNN architecture (like bileNetV3 or EfficientNet),
sufficient level of regularization and adaptive to data learning rate schedule,
we can achieve a reasonable performance on a variety of downstream image
classification tasks without manual tuning of parameters to each particular
task. Resulting models are computationally efficient and can be deployed to CPU
using the OpenVINO toolkit. Source code is available as a part of the OpenVINO
Training Extensions (https://github.com/openvinotoolkit/training_extensions).
- Abstract(参考訳): 現在、ディープラーニングに基づく手法は、画像Net、CIFAR、SVHN、Caltech 101、SUN397など、広く使われているデータセットのうち、画像分類タスクにおいて顕著な進歩を遂げている。
上記各データセットのsota性能は、モデルアーキテクチャの注意深くチューニングし、対象データの特性に応じたトレーニングトリックによって得られる。
このアプローチは学術的な記録の設定を可能にするが、平均的なデータ科学者が実際に遭遇するすべての画像分類タスクに対して、洗練されたトレーニングパイプラインを構築するのに十分なリソースを持つのは現実的ではない。
本研究は,画像分類における最新の拡張および正規化手法の見直しと,エポックの総数,初期学習率,スケジュールなどの重要なハイパーパラメータを自動的に選択する方法の探索に重点を置いている。
軽量なCNNアーキテクチャ(BileNetV3やEfficientNetなど)と十分な正規化レベルとデータ学習率スケジュールを備えたトレーニング手順により、各タスクにパラメータを手動でチューニングすることなく、さまざまな下流画像分類タスクに対して合理的なパフォーマンスを実現することができる。
結果モデルは計算効率が良く、OpenVINOツールキットを使ってCPUにデプロイできる。
OpenVINO Training Extensions(https://github.com/openvinotoolkit/training_extensions)の一部としてソースコードが公開されている。
関連論文リスト
- Effective pruning of web-scale datasets based on complexity of concept
clusters [48.125618324485195]
本稿では,大規模なマルチモーダルデータセットを抽出し,イメージネット上でCLIPスタイルのモデルを訓練する手法を提案する。
高品質なデータのより小さなセットでのトレーニングは、トレーニングコストを大幅に削減して、より高いパフォーマンスをもたらす可能性があることに気付きました。
我々は38の評価タスクにおいて、新しい最先端のImagehttps://info.arxiv.org/help/prep#commentsネットゼロショット精度と競合平均ゼロショット精度を実現する。
論文 参考訳(メタデータ) (2024-01-09T14:32:24Z) - A Simple and Efficient Baseline for Data Attribution on Images [107.12337511216228]
現在の最先端のアプローチでは、モデル予測を正確に評価するために、最大30万のモデルの大規模なアンサンブルが必要となる。
本研究では、自己教師付き学習によって事前訓練されたバックボーンの特徴空間を利用して、データ帰属を行うミニマリストベースラインに焦点を当てる。
提案手法はモデルに依存しず,大規模データセットに容易にスケールできる。
論文 参考訳(メタデータ) (2023-11-03T17:29:46Z) - Dataset Quantization [72.61936019738076]
大規模データセットを小さなサブセットに圧縮する新しいフレームワークであるデータセット量子化(DQ)を提案する。
DQは、ImageNet-1kのような大規模データセットを最先端圧縮比で蒸留する最初の方法である。
論文 参考訳(メタデータ) (2023-08-21T07:24:29Z) - DINOv2: Learning Robust Visual Features without Supervision [75.42921276202522]
この研究は、既存の事前学習手法、特に自己教師付き手法が、多様なソースから十分なキュレートされたデータで訓練すれば、そのような特徴を生み出すことができることを示している。
技術的な貢献の多くは、大規模なトレーニングを加速し、安定化することを目的としています。
データの観点からは、自己組織化されていないデータではなく、専用で多様でキュレートされた画像データセットを構築するための自動パイプラインを提案する。
論文 参考訳(メタデータ) (2023-04-14T15:12:19Z) - How to Train an Accurate and Efficient Object Detection Model on Any
Dataset [0.0]
オブジェクト検出訓練のためのデータセットに依存しないテンプレートを提案する。
慎重に選択され、事前訓練されたモデルと、さらなるトレーニングのための堅牢なトレーニングパイプラインで構成される。
私たちのソリューションは最初から動作し、幅広いデータセットに対して強力なベースラインを提供します。
論文 参考訳(メタデータ) (2022-11-30T17:09:01Z) - EfficientTrain: Exploring Generalized Curriculum Learning for Training
Visual Backbones [80.662250618795]
本稿では視覚バックボーン(例えば視覚変換器)の効率的なトレーニングのための新しいカリキュラム学習手法を提案する。
オフザシェルフ方式として、様々な人気モデルのウォールタイムトレーニングコストを、精度を犠牲にすることなく、ImageNet-1K/22Kで1.5倍に削減する。
論文 参考訳(メタデータ) (2022-11-17T17:38:55Z) - Pushing the Limits of Simple Pipelines for Few-Shot Learning: External
Data and Fine-Tuning Make a Difference [74.80730361332711]
コンピュータビジョンにおいて、ほとんどショット学習は重要かつトピック的な問題である。
単純なトランスフォーマーベースのパイプラインは、標準ベンチマークで驚くほど優れたパフォーマンスが得られることを示す。
論文 参考訳(メタデータ) (2022-04-15T02:55:58Z) - Efficient deep learning models for land cover image classification [0.29748898344267777]
土地利用土地被覆(LULC)画像分類のためのBigEarthNetデータセットを用いて実験を行った。
コンボリューションニューラルネットワーク、マルチ層パーセプトロン、ビジュアルトランスフォーマー、効率的なネットワーク、ワイド残留ネットワーク(WRN)など、さまざまな最先端モデルをベンチマークする。
提案する軽量モデルは、訓練可能なパラメータが桁違いに小さく、平均的なFスコア分類精度が19のLULCクラスすべてに対して4.5%向上し、ベースラインとして使用するResNet50の2倍高速に訓練される。
論文 参考訳(メタデータ) (2021-11-18T00:03:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。