論文の概要: Counting Fish and Dolphins in Sonar Images Using Deep Learning
- arxiv url: http://arxiv.org/abs/2007.12808v1
- Date: Fri, 24 Jul 2020 23:52:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 06:57:05.576550
- Title: Counting Fish and Dolphins in Sonar Images Using Deep Learning
- Title(参考訳): 深層学習を用いたソナー画像における魚とイルカの数え方
- Authors: Stefan Schneider and Alex Zhuang
- Abstract要約: 魚とイルカの量推定の現在の方法は、視覚的および捕獲・放出戦略を用いた現場サンプリングによって行われる。
本研究では,漁船の背部から採取したソナー画像から,魚とイルカの深層学習を用いた魚量推定手法を提案する。
- 参考スコア(独自算出の注目度): 0.40611352512781856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning provides the opportunity to improve upon conflicting reports
considering the relationship between the Amazon river's fish and dolphin
abundance and reduced canopy cover as a result of deforestation. Current
methods of fish and dolphin abundance estimates are performed by on-site
sampling using visual and capture/release strategies. We propose a novel
approach to calculating fish abundance using deep learning for fish and dolphin
estimates from sonar images taken from the back of a trolling boat. We consider
a data set of 143 images ranging from 0-34 fish, and 0-3 dolphins provided by
the Fund Amazonia research group. To overcome the data limitation, we test the
capabilities of data augmentation on an unconventional 15/85 training/testing
split. Using 20 training images, we simulate a gradient of data up to 25,000
images using augmented backgrounds and randomly placed/rotation cropped fish
and dolphin taken from the training set. We then train four multitask network
architectures: DenseNet201, InceptionNetV2, Xception, and MobileNetV2 to
predict fish and dolphin numbers using two function approximation methods:
regression and classification. For regression, Densenet201 performed best for
fish and Xception best for dolphin with mean squared errors of 2.11 and 0.133
respectively. For classification, InceptionResNetV2 performed best for fish and
MobileNetV2 best for dolphins with a mean error of 2.07 and 0.245 respectively.
Considering the 123 testing images, our results show the success of data
simulation for limited sonar data sets. We find DenseNet201 is able to identify
dolphins after approximately 5000 training images, while fish required the full
25,000. Our method can be used to lower costs and expedite the data analysis of
fish and dolphin abundance to real-time along the Amazon river and river
systems worldwide.
- Abstract(参考訳): 深層学習は、森林伐採の結果、アマゾン川の魚とイルカの生息量との関係を考慮し、矛盾する報告を改善する機会を提供する。
魚とイルカの量推定の現在の方法は、視覚的および捕獲・放出戦略を用いた現場サンプリングによって行われる。
本研究では,漁船の背部から採取したソナー画像から,魚とイルカの深層学習を用いた魚量推定手法を提案する。
本研究は,Amazonia Fundの調査グループが提供する0-34魚と0-3イルカの143枚の画像のデータセットについて考察する。
データ制限を克服するため、従来の15/85トレーニング/テストスプリットでデータ拡張機能をテストする。
20の訓練画像を用いて,訓練セットから採取した無作為な漁獲魚とイルカを用いて,最大25,000枚の画像の勾配をシミュレートした。
次に、DenseNet201、InceptionNetV2、Xception、MobileNetV2の4つのマルチタスクネットワークアーキテクチャをトレーニングし、魚とイルカの数を回帰と分類という2つの関数近似手法を用いて予測する。
回帰では、Densenet201は魚に、Xceptionはイルカに、平均二乗誤差は2.11と0.133である。
InceptionResNetV2は魚に、MobileNetV2はイルカに、平均誤差は2.07と0.245である。
123枚の実験画像から, 限られたソナーデータセットに対するデータシミュレーションが成功したことを示す。
densenet201は、約5000の訓練画像の後にイルカを識別できるのに対し、魚は全25,000人が必要でした。
本手法は, 魚やイルカの量のデータ分析を, 世界中のアマゾン川・河川システム上でリアルタイムに行うことを目的として, コスト削減に有効である。
関連論文リスト
- FishNet: Deep Neural Networks for Low-Cost Fish Stock Estimation [0.0]
FishNetは、分類分類と魚の大きさ推定の両方を自動化したコンピュータビジョンシステムである。
我々は163種の1.2万魚を含む30万枚の手ラベル画像のデータセットを使用する。
魚の区分け作業では92%、単一魚種分類では89%、魚長推定では2.3cmの平均絶対誤差が達成されている。
論文 参考訳(メタデータ) (2024-03-16T12:44:08Z) - Improving Underwater Visual Tracking With a Large Scale Dataset and
Image Enhancement [70.2429155741593]
本稿では,水中ビジュアルオブジェクト追跡(UVOT)のための新しいデータセットと汎用トラッカ拡張手法を提案する。
水中環境は、一様でない照明条件、視界の低さ、鋭さの欠如、コントラストの低さ、カモフラージュ、懸濁粒子からの反射を示す。
本研究では,追尾品質の向上に特化して設計された水中画像強調アルゴリズムを提案する。
この手法により、最先端(SOTA)ビジュアルトラッカーの最大5.0%のAUCの性能が向上した。
論文 参考訳(メタデータ) (2023-08-30T07:41:26Z) - Whale Detection Enhancement through Synthetic Satellite Images [13.842008598751445]
実際のデータのみをトレーニングに使用した場合と比較して,捕鯨の検出において15%の性能向上が達成できることが示されている。
シミュレーションプラットフォームSeaDroneSim2のコードをオープンソースとして公開しています。
論文 参考訳(メタデータ) (2023-08-15T13:35:29Z) - Delving Deeper into Data Scaling in Masked Image Modeling [145.36501330782357]
視覚認識のためのマスク付き画像モデリング(MIM)手法のスケーリング能力に関する実証的研究を行った。
具体的には、Webで収集したCoyo-700Mデータセットを利用する。
我々のゴールは、データとモデルのサイズの異なるスケールでダウンストリームタスクのパフォーマンスがどのように変化するかを調べることです。
論文 参考訳(メタデータ) (2023-05-24T15:33:46Z) - Leveraging the Third Dimension in Contrastive Learning [88.17394309208925]
SSL(Self-Supervised Learning)メソッドは、ラベルのないデータでダウンストリームタスクに有用な堅牢な表現を学習する。
これらの拡張は、生物学的ビジョンが没入的な3次元、時間的に連続した環境で起こるという事実を無視している。
SSLフレームワークにディープシグナルを組み込むための2つの異なるアプローチについて検討する。
論文 参考訳(メタデータ) (2023-01-27T15:45:03Z) - TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z) - Portuguese Man-of-War Image Classification with Convolutional Neural
Networks [58.720142291102135]
ポルトガルマン・オブ・ウォー(ポルトガル語: Man-of-war、PMW)は、長い触手を持つゼラチン質の生物である。
本稿では,InstagramのソーシャルメディアからPMW画像を認識するための畳み込みニューラルネットワークの利用について報告する。
論文 参考訳(メタデータ) (2022-07-04T03:06:45Z) - FishNet: A Unified Embedding for Salmon Recognition [0.37798600249187286]
そこで我々は,人間の識別に成功している深層学習技術に基づく魚網を提案する。
実験の結果,このアーキテクチャはサルモン頭部の画像に基づいて有用な表現を学習していることがわかった。
FishNetは偽陽性率1%、真陽性率96%を達成している。
論文 参考訳(メタデータ) (2020-10-20T17:35:01Z) - A Realistic Fish-Habitat Dataset to Evaluate Algorithms for Underwater
Visual Analysis [2.6476746128312194]
我々は、DeepFishを大規模データセットでベンチマークスイートとして提示し、いくつかのコンピュータビジョンタスクのためのメソッドをトレーニングし、テストする。
このデータセットは、熱帯オーストラリアの海洋環境にある20の温帯生物から採取された約4万枚の画像で構成されている。
実験では,データセットの特徴を詳細に分析し,いくつかの最先端手法の性能評価を行った。
論文 参考訳(メタデータ) (2020-08-28T12:20:59Z) - Temperate Fish Detection and Classification: a Deep Learning based
Approach [6.282069822653608]
本研究では,2段階の深層学習手法を提案する。
最初のステップは、種や性別によらず、画像中の各魚を検出することです。
第2のステップでは、画像中の各魚を事前フィルタリングせずに分類するために、Squeeze-and-Excitation (SE)アーキテクチャを備えた畳み込みニューラルネットワーク(CNN)を採用する。
論文 参考訳(メタデータ) (2020-05-14T12:40:57Z) - Improved Residual Networks for Image and Video Recognition [98.10703825716142]
ResNets(Residual Networks)は、CNN(Convolutional Neural Network)アーキテクチャの強力なタイプである。
ベースライン上での精度と学習収束性を一貫した改善を示す。
提案手法では,高度に深いネットワークをトレーニングできるが,ベースラインは厳密な最適化問題を示す。
論文 参考訳(メタデータ) (2020-04-10T11:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。