論文の概要: Deep learning with self-supervision and uncertainty regularization to
count fish in underwater images
- arxiv url: http://arxiv.org/abs/2104.14964v1
- Date: Fri, 30 Apr 2021 13:02:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 13:53:52.158454
- Title: Deep learning with self-supervision and uncertainty regularization to
count fish in underwater images
- Title(参考訳): 水中画像における魚数計測のための自己監督と不確実性正則化による深層学習
- Authors: Penny Tarling, Mauricio Cantor, Albert Clap\'es and Sergio Escalera
- Abstract要約: 効果的な保全活動には、効果的な人口監視が必要です。
画像サンプリングによる人口のモニタリングにより、データ収集は安価で広く、侵入性が低くなっている。
このようなデータから動物を数えることは、特に騒々しい画像に密に詰め込まれた場合、困難です。
深層学習は多くのコンピュータビジョンタスクの最先端の手法であるが、動物を数えるためにはまだ十分に研究されていない。
- 参考スコア(独自算出の注目度): 28.261323753321328
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Effective conservation actions require effective population monitoring.
However, accurately counting animals in the wild to inform conservation
decision-making is difficult. Monitoring populations through image sampling has
made data collection cheaper, wide-reaching and less intrusive but created a
need to process and analyse this data efficiently. Counting animals from such
data is challenging, particularly when densely packed in noisy images.
Attempting this manually is slow and expensive, while traditional computer
vision methods are limited in their generalisability. Deep learning is the
state-of-the-art method for many computer vision tasks, but it has yet to be
properly explored to count animals. To this end, we employ deep learning, with
a density-based regression approach, to count fish in low-resolution sonar
images. We introduce a large dataset of sonar videos, deployed to record wild
mullet schools (Mugil liza), with a subset of 500 labelled images. We utilise
abundant unlabelled data in a self-supervised task to improve the supervised
counting task. For the first time in this context, by introducing uncertainty
quantification, we improve model training and provide an accompanying measure
of prediction uncertainty for more informed biological decision-making.
Finally, we demonstrate the generalisability of our proposed counting framework
through testing it on a recent benchmark dataset of high-resolution annotated
underwater images from varying habitats (DeepFish). From experiments on both
contrasting datasets, we demonstrate our network outperforms the few other deep
learning models implemented for solving this task. By providing an open-source
framework along with training data, our study puts forth an efficient deep
learning template for crowd counting aquatic animals thereby contributing
effective methods to assess natural populations from the ever-increasing visual
data.
- Abstract(参考訳): 効果的な保全活動には効果的な個体群モニタリングが必要である。
しかし、野生動物を正確に数えて保護の意思決定を伝えることは困難である。
画像サンプリングによる人口のモニタリングは、データの収集を安く、広くなり、侵入も少ないが、このデータを効率的に処理し分析する必要がある。
このようなデータから動物を数えることは、特にノイズの多い画像が密集している場合には困難である。
手動で試すのは遅くて高価だが、従来のコンピュータビジョンの手法は汎用性に制限がある。
深層学習は多くのコンピュータビジョンタスクの最先端の手法であるが、動物を数えるためにはまだ十分に研究されていない。
この目的のために,魚を低解像度ソナー画像にカウントするために,密度に基づく回帰手法を用いた深層学習を用いる。
我々は,500点のラベル付き画像を含む野生のmullet school (mugil liza) を録画するためにデプロイされたsonarビデオの大規模なデータセットを紹介する。
我々は、教師付きカウントタスクを改善するために、自己教師付きタスクで大量の未ラベルデータを活用する。
この文脈で初めて不確実性定量化を導入することで、モデルトレーニングを改善し、よりインフォームドな生物学的意思決定のための予測不確実性尺度を提供する。
最後に,様々な生息地(deepfish)から得られた高分解能アノテート水中画像のベンチマークデータセットを用いて,提案手法の汎用性を示す。
両方の対照的なデータセットの実験から、この課題を解決するために実装されたいくつかのディープラーニングモデルよりも、ネットワークが優れていることを示す。
トレーニングデータとともにオープンソースのフレームワークを提供することにより,水生動物を群集にカウントするための効率的なディープラーニングテンプレートが提供され,より多くなる視覚データから自然個体群を評価する効果的な方法が提案された。
関連論文リスト
- Multimodal Foundation Models for Zero-shot Animal Species Recognition in
Camera Trap Images [57.96659470133514]
モーションアクティベートカメラトラップは、世界中の野生生物を追跡・監視するための効率的なツールである。
教師付き学習技術は、そのような画像を分析するためにうまく展開されているが、そのような訓練には専門家のアノテーションが必要である。
コストのかかるラベル付きデータへの依存を減らすことは、人間の労働力を大幅に減らした大規模野生生物追跡ソリューションを開発する上で、大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-11-02T08:32:00Z) - Automated wildlife image classification: An active learning tool for
ecological applications [0.44970015278813025]
野生生物カメラトラップ画像は、動物の豊富さ、生息環境の関連、行動を調べるために広く利用されている。
人工知能システムは、このタスクを引き継ぐことができるが、通常は十分なパフォーマンスを達成するために、既にラベル付けされた多数のトレーニングイメージを必要とする。
我々は,中小の画像データベースを持つ研究者が,現代の機械学習の可能性を活用できるラベル効率のよい学習戦略を提案する。
論文 参考訳(メタデータ) (2023-03-28T08:51:15Z) - Rare Wildlife Recognition with Self-Supervised Representation Learning [0.0]
本稿では,自己指導型プレトレーニングに頼って,必要なトレーニングデータの量を削減する手法を提案する。
MoCo, CLD, および幾何拡張の組み合わせは, ImageNetで事前訓練された従来のモデルよりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2022-10-29T17:57:38Z) - Curious Representation Learning for Embodied Intelligence [81.21764276106924]
近年,自己指導型表現学習は顕著な成功を収めている。
しかし、真にインテリジェントなエージェントを構築するためには、環境から学習できる表現学習アルゴリズムを構築する必要がある。
本稿では,強化学習方針と視覚的表現モデルを同時に学習する,好奇心をそそる表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-03T17:59:20Z) - Few-Cost Salient Object Detection with Adversarial-Paced Learning [95.0220555274653]
本稿では,少数のトレーニング画像にのみ手動アノテーションを応用して,効果的なサルエント物体検出モデルを学習することを提案する。
我々は,このタスクを,少額の有能な物体検出とみなし,少数のコストの学習シナリオを促進するために,APL(Adversarialpaced Learning)ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-05T14:15:49Z) - Unifying data for fine-grained visual species classification [15.14767769034929]
465種にまたがる2.9M画像に基づいて訓練した,初期の深部畳み込みニューラルネットワークモデルを提案する。
長期的な目標は、科学者が種数と人口の健康状態のほぼリアルタイムでの分析から、保護的なレコメンデーションを行うことである。
論文 参考訳(メタデータ) (2020-09-24T01:04:18Z) - A Realistic Fish-Habitat Dataset to Evaluate Algorithms for Underwater
Visual Analysis [2.6476746128312194]
我々は、DeepFishを大規模データセットでベンチマークスイートとして提示し、いくつかのコンピュータビジョンタスクのためのメソッドをトレーニングし、テストする。
このデータセットは、熱帯オーストラリアの海洋環境にある20の温帯生物から採取された約4万枚の画像で構成されている。
実験では,データセットの特徴を詳細に分析し,いくつかの最先端手法の性能評価を行った。
論文 参考訳(メタデータ) (2020-08-28T12:20:59Z) - Naive-Student: Leveraging Semi-Supervised Learning in Video Sequences
for Urban Scene Segmentation [57.68890534164427]
本研究では,未ラベル映像シーケンスと追加画像の半教師付き学習を利用して,都市景観セグメンテーションの性能を向上させることができるかどうかを問う。
我々は単にラベルのないデータに対して擬似ラベルを予測し、人間の注釈付きデータと擬似ラベル付きデータの両方でその後のモデルを訓練する。
我々のNaive-Studentモデルは、このような単純で効果的な反復的半教師付き学習で訓練され、3つのCityscapesベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2020-05-20T18:00:05Z) - Temperate Fish Detection and Classification: a Deep Learning based
Approach [6.282069822653608]
本研究では,2段階の深層学習手法を提案する。
最初のステップは、種や性別によらず、画像中の各魚を検出することです。
第2のステップでは、画像中の各魚を事前フィルタリングせずに分類するために、Squeeze-and-Excitation (SE)アーキテクチャを備えた畳み込みニューラルネットワーク(CNN)を採用する。
論文 参考訳(メタデータ) (2020-05-14T12:40:57Z) - Neural Networks Are More Productive Teachers Than Human Raters: Active
Mixup for Data-Efficient Knowledge Distillation from a Blackbox Model [57.41841346459995]
我々は,ブラックボックス教師モデルから知識を抽出し,学生の深層ニューラルネットワークを視覚認識のために訓練する方法を,データ効率のよい方法で研究する。
混合学習とアクティブラーニングを融合した手法を提案する。
論文 参考訳(メタデータ) (2020-03-31T05:44:55Z) - Laplacian Denoising Autoencoder [114.21219514831343]
本稿では,新しいタイプの自動符号化器を用いてデータ表現を学習することを提案する。
勾配領域における潜伏クリーンデータを破損させて雑音入力データを生成する。
いくつかのビジュアルベンチマークの実験では、提案されたアプローチでより良い表現が学べることが示されている。
論文 参考訳(メタデータ) (2020-03-30T16:52:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。