論文の概要: Temperate Fish Detection and Classification: a Deep Learning based
Approach
- arxiv url: http://arxiv.org/abs/2005.07518v1
- Date: Thu, 14 May 2020 12:40:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 04:56:36.564545
- Title: Temperate Fish Detection and Classification: a Deep Learning based
Approach
- Title(参考訳): 温帯魚の検出と分類:深層学習に基づくアプローチ
- Authors: Kristian Muri Knausg{\aa}rd, Arne Wiklund, Tonje Knutsen S{\o}rdalen,
Kim Halvorsen, Alf Ring Kleiven, Lei Jiao, Morten Goodwin
- Abstract要約: 本研究では,2段階の深層学習手法を提案する。
最初のステップは、種や性別によらず、画像中の各魚を検出することです。
第2のステップでは、画像中の各魚を事前フィルタリングせずに分類するために、Squeeze-and-Excitation (SE)アーキテクチャを備えた畳み込みニューラルネットワーク(CNN)を採用する。
- 参考スコア(独自算出の注目度): 6.282069822653608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A wide range of applications in marine ecology extensively uses underwater
cameras. Still, to efficiently process the vast amount of data generated, we
need to develop tools that can automatically detect and recognize species
captured on film. Classifying fish species from videos and images in natural
environments can be challenging because of noise and variation in illumination
and the surrounding habitat. In this paper, we propose a two-step deep learning
approach for the detection and classification of temperate fishes without
pre-filtering. The first step is to detect each single fish in an image,
independent of species and sex. For this purpose, we employ the You Only Look
Once (YOLO) object detection technique. In the second step, we adopt a
Convolutional Neural Network (CNN) with the Squeeze-and-Excitation (SE)
architecture for classifying each fish in the image without pre-filtering. We
apply transfer learning to overcome the limited training samples of temperate
fishes and to improve the accuracy of the classification. This is done by
training the object detection model with ImageNet and the fish classifier via a
public dataset (Fish4Knowledge), whereupon both the object detection and
classifier are updated with temperate fishes of interest. The weights obtained
from pre-training are applied to post-training as a priori. Our solution
achieves the state-of-the-art accuracy of 99.27\% on the pre-training. The
percentage values for accuracy on the post-training are good; 83.68\% and
87.74\% with and without image augmentation, respectively, indicating that the
solution is viable with a more extensive dataset.
- Abstract(参考訳): 海洋生態学における幅広い応用は水中カメラを広範囲に利用している。
それでも、大量のデータを効率的に処理するためには、フィルムで捕獲された種を自動的に検出し認識するツールを開発する必要がある。
自然環境における映像や画像から魚種を分類することは、照明の騒音や環境の変化のために困難である。
本稿では,温帯魚類の検出と分類のための2段階の深層学習手法を提案する。
最初のステップは、種や性別によらず、画像中の各魚を検出することです。
この目的のために、You Only Look Once (YOLO) オブジェクト検出技術を用いる。
第2のステップでは、画像中の各魚を事前フィルタリングせずに分類するために、Squeeze-and-Excitation (SE)アーキテクチャを備えた畳み込みニューラルネットワーク(CNN)を採用する。
本研究では, 温帯魚類の限られた訓練サンプルを克服し, 分類精度を向上させるために移動学習を適用した。
これはimagenetでオブジェクト検出モデルをトレーニングし、パブリックデータセット(fish4knowledge)を介して魚分類器をトレーニングし、オブジェクト検出と分類器の両方が興味のある温帯魚によって更新される。
プレトレーニングから得られる重量をプレトレーニングとして後トレーニングに適用する。
本ソリューションは,事前学習時の精度99.27\%を達成する。
トレーニング後の精度は, 83.68\%, 87.74\%, 画像拡張なしでは87.74\%と良好であり, より広範なデータセットで解が実現可能であることを示す。
関連論文リスト
- Improved detection of discarded fish species through BoxAL active learning [0.2544632696242629]
本研究では,より高速なR-CNNオブジェクト検出モデルの認識精度を推定する,BoxALという能動的学習手法を提案する。
この方法では、未ラベルのプールから最も不確実なトレーニングイメージを選択し、オブジェクト検出モデルのトレーニングに使用することができる。
また,本研究では,サンプル化した新データが,未ラベルデータよりもトレーニングに有用であることが確認された。
論文 参考訳(メタデータ) (2024-10-07T10:01:30Z) - Automatic Coral Detection with YOLO: A Deep Learning Approach for Efficient and Accurate Coral Reef Monitoring [0.0]
サンゴ礁は、人為的な影響や気候変動によって脅威にさらされている重要な生態系である。
本稿では,深層学習モデルを用いたサンゴ自動検出システムを提案する。
論文 参考訳(メタデータ) (2024-04-03T08:00:46Z) - Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Leveraging the Third Dimension in Contrastive Learning [88.17394309208925]
SSL(Self-Supervised Learning)メソッドは、ラベルのないデータでダウンストリームタスクに有用な堅牢な表現を学習する。
これらの拡張は、生物学的ビジョンが没入的な3次元、時間的に連続した環境で起こるという事実を無視している。
SSLフレームワークにディープシグナルを組み込むための2つの異なるアプローチについて検討する。
論文 参考訳(メタデータ) (2023-01-27T15:45:03Z) - TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z) - Intelligent Masking: Deep Q-Learning for Context Encoding in Medical
Image Analysis [48.02011627390706]
我々は,対象地域を排除し,事前訓練の手順を改善する,新たな自己指導型アプローチを開発した。
予測モデルに対してエージェントを訓練することで、下流の分類タスクで抽出した意味的特徴を大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-03-25T19:05:06Z) - A deep neural network for multi-species fish detection using multiple
acoustic cameras [0.0]
本稿では,CNN (Convolutional Neural Network) と従来のCV (Computer Vision) 技術の両方を活用する新しい手法を提案する。
パイプラインは、音像を前処理して2つの特徴を抽出し、信号をローカライズし、検出性能を向上させる。
YOLOv3ベースのモデルは、2つの一般的な音響カメラで記録された複数の種の魚のデータを用いて訓練された。
論文 参考訳(メタデータ) (2021-09-22T11:47:24Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - Deep learning with self-supervision and uncertainty regularization to
count fish in underwater images [28.261323753321328]
効果的な保全活動には、効果的な人口監視が必要です。
画像サンプリングによる人口のモニタリングにより、データ収集は安価で広く、侵入性が低くなっている。
このようなデータから動物を数えることは、特に騒々しい画像に密に詰め込まれた場合、困難です。
深層学習は多くのコンピュータビジョンタスクの最先端の手法であるが、動物を数えるためにはまだ十分に研究されていない。
論文 参考訳(メタデータ) (2021-04-30T13:02:19Z) - A Realistic Fish-Habitat Dataset to Evaluate Algorithms for Underwater
Visual Analysis [2.6476746128312194]
我々は、DeepFishを大規模データセットでベンチマークスイートとして提示し、いくつかのコンピュータビジョンタスクのためのメソッドをトレーニングし、テストする。
このデータセットは、熱帯オーストラリアの海洋環境にある20の温帯生物から採取された約4万枚の画像で構成されている。
実験では,データセットの特徴を詳細に分析し,いくつかの最先端手法の性能評価を行った。
論文 参考訳(メタデータ) (2020-08-28T12:20:59Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。