論文の概要: Filtering Empty Camera Trap Images in Embedded Systems
- arxiv url: http://arxiv.org/abs/2104.08859v1
- Date: Sun, 18 Apr 2021 13:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 13:52:23.119645
- Title: Filtering Empty Camera Trap Images in Embedded Systems
- Title(参考訳): 埋め込みシステムにおけるエンプティカメラトラップ画像のフィルタリング
- Authors: Fagner Cunha, Eulanda M. dos Santos, Raimundo Barreto, Juan G. Colonna
- Abstract要約: 本稿では,動物認識モデルの比較研究を行い,エッジデバイス上での精度と推論遅延のトレードオフを解析する。
実験の結果、同じ画像をトレーニングに使用すると、検出器の性能が向上することがわかった。
検出問題のラベルを生成するコストが高いことを考えると、分類にラベル付けされた大量の画像が存在する場合、分類器は検出器に匹敵する結果が得られるが、半分のレイテンシを持つ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monitoring wildlife through camera traps produces a massive amount of images,
whose a significant portion does not contain animals, being later discarded.
Embedding deep learning models to identify animals and filter these images
directly in those devices brings advantages such as savings in the storage and
transmission of data, usually resource-constrained in this type of equipment.
In this work, we present a comparative study on animal recognition models to
analyze the trade-off between precision and inference latency on edge devices.
To accomplish this objective, we investigate classifiers and object detectors
of various input resolutions and optimize them using quantization and reducing
the number of model filters. The confidence threshold of each model was
adjusted to obtain 96% recall for the nonempty class, since instances from the
empty class are expected to be discarded. The experiments show that, when using
the same set of images for training, detectors achieve superior performance,
eliminating at least 10% more empty images than classifiers with comparable
latencies. Considering the high cost of generating labels for the detection
problem, when there is a massive number of images labeled for classification
(about one million instances, ten times more than those available for
detection), classifiers are able to reach results comparable to detectors but
with half latency.
- Abstract(参考訳): カメラトラップによる野生生物の監視は、大量の画像を生成し、そのかなりの部分が動物を含まず、後に廃棄される。
動物を識別し、それらの画像を直接デバイスにフィルターするためにディープラーニングモデルを埋め込むことは、データの保存と送信の節約のような利点をもたらす。
本稿では,エッジデバイスにおける精度と推論遅延のトレードオフを分析するために,動物認識モデルの比較研究を行う。
この目的を達成するために、様々な入力解像度の分類器やオブジェクト検出器を調査し、量子化とモデルフィルタ数の削減により最適化する。
各モデルの信頼しきい値は、空のクラスからのインスタンスが破棄されることが期待されるため、空でないクラスの96%のリコールを得るために調整された。
実験の結果、同じ画像群をトレーニングに使用すると、検出器の性能が向上し、同等のレイテンシを持つ分類器よりも少なくとも10%多くの空画像が除去されることがわかった。
検出問題のラベルを生成するコストが高いことを考えると、分類用にラベル付けされた大量の画像(約100万のインスタンス、検出可能な画像の10倍)がある場合、分類器は検出器に匹敵する結果に到達できるが、半分のレイテンシを持つ。
関連論文リスト
- Improved detection of discarded fish species through BoxAL active learning [0.2544632696242629]
本研究では,より高速なR-CNNオブジェクト検出モデルの認識精度を推定する,BoxALという能動的学習手法を提案する。
この方法では、未ラベルのプールから最も不確実なトレーニングイメージを選択し、オブジェクト検出モデルのトレーニングに使用することができる。
また,本研究では,サンプル化した新データが,未ラベルデータよりもトレーニングに有用であることが確認された。
論文 参考訳(メタデータ) (2024-10-07T10:01:30Z) - Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - Extended target tracking utilizing machine-learning software -- with
applications to animal classification [1.5516470851450592]
本稿では,画像列中の物体を検出し,追跡する問題について考察する。
この問題は、オブジェクト検出アルゴリズムの出力を測定として、フィルタリングフレームワークで定式化されている。
以前のフレームからのクラス情報を組み込んだフィルタリングフレームワークの拡張を提案し,分類の堅牢化を図る。
論文 参考訳(メタデータ) (2023-10-12T13:27:21Z) - DISCount: Counting in Large Image Collections with Detector-Based
Importance Sampling [32.522579550452484]
DISCountは、大規模な画像収集をカウントするための検出器ベースの重要なサンプリングフレームワークである。
これは、不完全な検知器とループ内のヒトスクリーニングを統合して、不偏のカウント推定を生成する。
論文 参考訳(メタデータ) (2023-06-05T18:04:57Z) - Learning to Annotate Part Segmentation with Gradient Matching [58.100715754135685]
本稿では,事前学習したGANを用いて,高品質な画像を生成することで,半教師付き部分分割タスクに対処することに焦点を当てる。
特に、アノテータ学習を学習から学習までの問題として定式化する。
提案手法は,実画像,生成された画像,さらには解析的に描画された画像を含む,幅広いラベル付き画像からアノテータを学習可能であることを示す。
論文 参考訳(メタデータ) (2022-11-06T01:29:22Z) - Semi-supervised Object Detection via Virtual Category Learning [68.26956850996976]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
具体的には、各混乱したサンプルに仮想圏(VC)が割り当てられる。
トレーニングサンプルと仮想カテゴリの間の埋め込み距離を指定することに起因する。
論文 参考訳(メタデータ) (2022-07-07T16:59:53Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Attention-Aware Noisy Label Learning for Image Classification [97.26664962498887]
大規模ラベル付きサンプルで学習した深層畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおいて顕著な進歩を遂げている。
大量のラベル付きビジュアルデータを取得する最も安価な方法は、Flickrのようなユーザーが提供するラベルでウェブサイトからクロールすることである。
本稿では,潜在的なラベルノイズのあるデータセットに基づいて学習したネットワークの識別能力を向上させるために,注目に敏感なラベル学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-30T15:45:36Z) - Multi-species Seagrass Detection and Classification from Underwater
Images [1.2233362977312945]
本稿では,深層畳み込みニューラルネットワークに基づく海草の多種検出と分類器を提案する。
また,画像パッチを半自動でラベル付けする簡単な手法を導入し,手動ラベリングの要件を最小化する。
この研究で収集したデータセットと、実験を再現するためのコードと事前訓練されたモデルについて、公開してリリースします。
論文 参考訳(メタデータ) (2020-09-18T07:20:44Z) - Automatic Detection and Recognition of Individuals in Patterned Species [4.163860911052052]
我々は,異なるパターンの個体の自動検出と認識のための枠組みを開発する。
我々は最近提案したFaster-RCNNオブジェクト検出フレームワークを用いて画像中の動物を効率的に検出する。
我々は,シマウマおよびジャガー画像の認識システムを評価し,他のパターンの種への一般化を示す。
論文 参考訳(メタデータ) (2020-05-06T15:29:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。