論文の概要: Deep CNNs for large scale species classification
- arxiv url: http://arxiv.org/abs/2102.01863v1
- Date: Wed, 3 Feb 2021 03:53:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-04 23:47:52.313149
- Title: Deep CNNs for large scale species classification
- Title(参考訳): 大規模種分類のための深部CNN
- Authors: Raj Prateek Kosaraju
- Abstract要約: データセットのプルーニングと転送学習を利用する手法は、どちらの手法も使わずに訓練されたモデルよりも優れていることを示す。
ResNextをベースとした分類では、1,010種に分類すると0.68の1つの検証誤差を達成している。
- 参考スコア(独自算出の注目度): 1.52292571922932
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Scale image classification is a challenging problem within the field of
computer vision. As the real world contains billions of different objects,
understanding the performance of popular techniques and models is vital in
order to apply them to real world tasks. In this paper, we evaluate techniques
and popular CNN based deep learning architectures to perform large scale
species classification on the dataset from iNaturalist 2019 Challenge. Methods
utilizing dataset pruning and transfer learning are shown to outperform models
trained without either of the two techniques. The ResNext based classifier
outperforms other model architectures over 10 epochs and achieves a top-one
validation error of 0.68 when classifying amongst the 1,010 species.
- Abstract(参考訳): 大規模画像分類はコンピュータビジョンの分野において難しい問題である。
現実世界には何十億もの異なるオブジェクトが含まれているため、現実世界のタスクに適用するには、一般的な技術やモデルのパフォーマンスを理解することが不可欠です。
本稿では,inaturalist 2019 challengeのデータセット上で大規模種分類を行うための,cnnベースのディープラーニングアーキテクチャと手法を評価する。
データセットの刈り取りと転送学習を利用する手法は、2つの手法のいずれかを使わずにトレーニングされたモデルを上回る。
ResNextベースの分類器は10エポック以上の他のモデルアーキテクチャより優れており、1,010種に分類すると0.68の検証誤差が最上位となる。
関連論文リスト
- LiT Tuned Models for Efficient Species Detection [22.3395465641384]
本稿では,任意の微細な画像分類データセットを分散視覚言語事前学習に適用するための簡単な手法を提案する。
iNaturalist-2021データセットは、約270万のマクロ微生物の画像で構成されており、1万のクラスにまたがっている。
我々のモデルは(ロック画像テキストチューニングと呼ばれる新しい手法を用いて訓練)、事前訓練された凍結された視覚表現を用いて、言語アライメントだけで強力な移動学習性能が得られることを証明している。
論文 参考訳(メタデータ) (2023-02-12T20:36:55Z) - Genetic Programming-Based Evolutionary Deep Learning for Data-Efficient
Image Classification [3.9310727060473476]
本稿では,データ効率のよい画像分類のための遺伝的プログラミングに基づく進化的深層学習手法を提案する。
この新しいアプローチは、画像領域と分類領域の両方から多くの重要な演算子を使用して、変数長モデルを自動的に進化させることができる。
フレキシブルな多層表現により、新しいアプローチは、タスクごとに浅いモデルや深いモデルやツリーを自動的に構築できる。
論文 参考訳(メタデータ) (2022-09-27T08:10:16Z) - Revisiting Classifier: Transferring Vision-Language Models for Video
Recognition [102.93524173258487]
ダウンストリームタスクのためのタスク非依存の深層モデルから知識を伝達することは、コンピュータビジョン研究において重要なトピックである。
本研究では,映像分類作業における知識の伝達に着目した。
予測された言語モデルを用いて、効率的な翻訳学習のための適切なセマンティックターゲットを生成する。
論文 参考訳(メタデータ) (2022-07-04T10:00:47Z) - Do We Really Need a Learnable Classifier at the End of Deep Neural
Network? [118.18554882199676]
本研究では、ニューラルネットワークを学習して分類器をランダムにETFとして分類し、訓練中に固定する可能性について検討する。
実験結果から,バランスの取れたデータセットの画像分類において,同様の性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-03-17T04:34:28Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Benchmarking Representation Learning for Natural World Image Collections [13.918304838054846]
iNat2021とNeWTの2つの新しい自然界視覚分類データセットを紹介します。
前者は市民科学アプリケーションinaturalistのユーザによってアップロードされた10k種の2.7m画像である。
標準種別を超越した難解な自然世界バイナリ分類タスク群において,表現学習アルゴリズムの性能ベンチマークを行った。
我々は,imagenet と inat2021 を監督することなく訓練された特徴抽出器の総合的な解析を行い,様々なタスクを通して異なる学習特徴の長所と短所について考察した。
論文 参考訳(メタデータ) (2021-03-30T16:41:49Z) - Fusion of CNNs and statistical indicators to improve image
classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。
この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。
我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文 参考訳(メタデータ) (2020-12-20T23:24:31Z) - PK-GCN: Prior Knowledge Assisted Image Classification using Graph
Convolution Networks [3.4129083593356433]
クラス間の類似性は、分類のパフォーマンスに影響を与える可能性がある。
本稿では,クラス類似性の知識を畳み込みニューラルネットワークモデルに組み込む手法を提案する。
実験結果から, 利用可能なデータの量が少ない場合には, 分類精度が向上することが示唆された。
論文 参考訳(メタデータ) (2020-09-24T18:31:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。