論文の概要: Mastering Large Scale Multi-label Image Recognition with high efficiency
overCamera trap images
- arxiv url: http://arxiv.org/abs/2008.07828v1
- Date: Tue, 18 Aug 2020 09:51:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 21:40:28.368243
- Title: Mastering Large Scale Multi-label Image Recognition with high efficiency
overCamera trap images
- Title(参考訳): 高効率オーバーカメラトラップ画像を用いた大規模マルチラベル画像認識
- Authors: Miroslav Valan and Luk\'a\v{s} Picek
- Abstract要約: 我々は,「ハクナマデータ-セレンゲティ野生生物識別チャレンジ」の受賞に基いて,容易でアクセスしやすい,高速かつ効率的なアプローチを提案している。
我々のシステムは97%の精度を達成し、人間レベルの性能を上回った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Camera traps are crucial in biodiversity motivated studies, however dealing
with large number of images while annotating these data sets is a tedious and
time consuming task. To speed up this process, Machine Learning approaches are
a reasonable asset. In this article we are proposing an easy, accessible,
light-weight, fast and efficient approach based on our winning submission to
the "Hakuna Ma-data - Serengeti Wildlife Identification challenge". Our system
achieved an Accuracy of 97% and outperformed the human level performance. We
show that, given relatively large data sets, it is effective to look at each
image only once with little or no augmentation. By utilizing such a simple, yet
effective baseline we were able to avoid over-fitting without extensive
regularization techniques and to train a top scoring system on a very limited
hardware featuring single GPU (1080Ti) despite the large training set (6.7M
images and 6TB).
- Abstract(参考訳): カメラトラップは生物多様性を動機づける研究において重要であるが、これらのデータセットに注釈を付けながら大量の画像を扱うことは退屈で時間のかかる作業である。
このプロセスをスピードアップするために、機械学習アプローチは妥当な資産です。
本稿では,「白菜マデータ-セレンゲティ野生生物識別課題」の勝利に基づく,容易でアクセス性が高く,軽量,高速で効率的なアプローチを提案する。
本システムは97%の精度を達成し,人間レベルの性能を上回った。
比較的大きなデータセットを考慮に入れれば,各イメージを1度だけ,あるいはほとんど拡張することなく見ることが効果的であることを示す。
このようなシンプルで効果的なベースラインを利用することで、大規模なトレーニングセット(6.7Mイメージと6TB)にもかかわらず、1つのGPU(1080Ti)を特徴とする非常に限られたハードウェア上で、オーバーフィットを回避することができました。
関連論文リスト
- SeiT: Storage-Efficient Vision Training with Tokens Using 1% of Pixel
Storage [52.317406324182215]
大規模データセットに対する視覚分類器の記憶効率向上のための学習手法を提案する。
私たちのトークンストレージは、JPEG圧縮されたオリジナルの生ピクセルの1%しか必要としない。
ImageNet-1kによる実験結果から,本手法は,他のストレージ効率のトレーニング手法よりも大幅に優れており,大きなギャップがあることがわかった。
論文 参考訳(メタデータ) (2023-03-20T13:55:35Z) - Bag of Tricks for Long-Tail Visual Recognition of Animal Species in
Camera Trap Images [2.294014185517203]
近年,カメラトラップ画像における動物種の長期的視覚認識に対処する手法が提案されている。
一般に、平方根サンプリングは、マイノリティクラスの性能を約10%向上させる方法であった。
提案手法は, テール級の性能と, ヘッド級の精度との最良のトレードオフを達成した。
論文 参考訳(メタデータ) (2022-06-24T18:30:26Z) - Pure Noise to the Rescue of Insufficient Data: Improving Imbalanced
Classification by Training on Random Noise Images [12.91269560135337]
我々は、この制限を緩和する驚くほど単純で効果的な方法を提案する。
データ拡張のための付加雑音や逆雑音の一般的な使用とは異なり、純粋ランダムノイズ画像の直接トレーニングを提案する。
本稿では,同一ネットワーク内の自然画像に加えて,純雑音画像のトレーニングを可能にするDAR-BNを新たに提案する。
論文 参考訳(メタデータ) (2021-12-16T11:51:35Z) - Bridging the Gap between Events and Frames through Unsupervised Domain
Adaptation [57.22705137545853]
本稿では,ラベル付き画像とラベル付きイベントデータを用いてモデルを直接訓練するタスク転送手法を提案する。
生成イベントモデルを利用して、イベント機能をコンテンツとモーションに分割します。
われわれのアプローチは、イベントベースのニューラルネットワークのトレーニングのために、膨大な量の既存の画像データセットをアンロックする。
論文 参考訳(メタデータ) (2021-09-06T17:31:37Z) - Memory Efficient Meta-Learning with Large Images [62.70515410249566]
数ショットの分類に対するメタ学習アプローチは、新しいタスクを学ぶために、ほんの数ステップの最適化やシングルフォワードパスを必要とするテスト時に計算的に効率的である。
この制限は、最大1000のイメージを含むタスクの全体サポートセットが、最適化ステップを取る前に処理されなければならないために生じる。
本稿では,1つのGPU上の大容量画像からなる大規模タスクのメタトレーニングを可能にする,汎用的でメモリ効率の良いエピソード・トレーニング手法であるLITEを提案する。
論文 参考訳(メタデータ) (2021-07-02T14:37:13Z) - Few-Shot Learning with Part Discovery and Augmentation from Unlabeled
Images [79.34600869202373]
帰納的バイアスは、ラベルなし画像の平坦な集合から学習でき、目に見えるクラスと目に見えないクラスの間で伝達可能な表現としてインスタンス化されることを示す。
具体的には、トランスファー可能な表現を学習するための、新しいパートベース自己教師型表現学習手法を提案する。
我々の手法は印象的な結果をもたらし、それまでの最高の教師なし手法を7.74%、9.24%上回った。
論文 参考訳(メタデータ) (2021-05-25T12:22:11Z) - Space-Time Crop & Attend: Improving Cross-modal Video Representation
Learning [88.71867887257274]
トリミングのような空間拡張はビデオでもうまく機能するが、以前の実装ではうまく機能するのに十分な規模でこれを行うことができなかった。
そこで本研究ではまず,このような拡張をより効率的にシミュレートする手法であるFeature Cropについて紹介する。
第2に,ナイーブ平均プーリングとは対照的に,変圧器に基づく注意性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2021-03-18T12:32:24Z) - Machine learning with limited data [1.2183405753834562]
我々は少数のショット画像分類を研究するが、我々はごく少数のラベル付きデータしか持っていない。
一つの方法は、これらの画像のスタイルを混ぜて画像の特徴を強化することです。
第2の方法は、画像のパッチ間の関係を探索するために空間的注意を適用することである。
論文 参考訳(メタデータ) (2021-01-18T17:10:39Z) - One of these (Few) Things is Not Like the Others [0.0]
本稿では,少数の例に基づいて新しい画像の分類と,それ以前のどのグループにも属さない画像の認識を両立できるモデルを提案する。
我々は,低消費電力デバイス上で動作可能な小型のセットアップを含む,モデルアーキテクチャのスペクトル上での性能を評価する。
論文 参考訳(メタデータ) (2020-05-22T21:49:35Z) - Naive-Student: Leveraging Semi-Supervised Learning in Video Sequences
for Urban Scene Segmentation [57.68890534164427]
本研究では,未ラベル映像シーケンスと追加画像の半教師付き学習を利用して,都市景観セグメンテーションの性能を向上させることができるかどうかを問う。
我々は単にラベルのないデータに対して擬似ラベルを予測し、人間の注釈付きデータと擬似ラベル付きデータの両方でその後のモデルを訓練する。
我々のNaive-Studentモデルは、このような単純で効果的な反復的半教師付き学習で訓練され、3つのCityscapesベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2020-05-20T18:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。