論文の概要: Video-based Hierarchical Species Classification for Longline Fishing
Monitoring
- arxiv url: http://arxiv.org/abs/2102.03520v1
- Date: Sat, 6 Feb 2021 06:10:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:43:16.941279
- Title: Video-based Hierarchical Species Classification for Longline Fishing
Monitoring
- Title(参考訳): 長期漁獲監視のためのビデオベース階層種分類
- Authors: Jie Mei, Jenq-Neng Hwang, Suzanne Romain, Craig Rose, Braden Moore,
and Kelsey Magrane
- Abstract要約: ビデオに基づく階層的な分類は、安価で効率的な魚種識別を可能にしている。
漁業科学者が提供した非重なりのない階層型データ構造により,本手法は階層型データ構造を強制する。
実験の結果,提案手法は古典的フラット分類システムよりも優れていた。
- 参考スコア(独自算出の注目度): 17.031967273526803
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of electronic monitoring (EM) of longline fishing is to monitor the
fish catching activities on fishing vessels, either for the regulatory
compliance or catch counting. Hierarchical classification based on videos
allows for inexpensive and efficient fish species identification of catches
from longline fishing, where fishes are under severe deformation and
self-occlusion during the catching process. More importantly, the flexibility
of hierarchical classification mitigates the laborious efforts of human reviews
by providing confidence scores in different hierarchical levels. Some related
works either use cascaded models for hierarchical classification or make
predictions per image or predict one overlapping hierarchical data structure of
the dataset in advance. However, with a known non-overlapping hierarchical data
structure provided by fisheries scientists, our method enforces the
hierarchical data structure and introduces an efficient training and inference
strategy for video-based fisheries data. Our experiments show that the proposed
method outperforms the classic flat classification system significantly and our
ablation study justifies our contributions in CNN model design, training
strategy, and the video-based inference schemes for the hierarchical fish
species classification task.
- Abstract(参考訳): ロングライン漁業の電子監視(EM)の目的は、規制遵守または捕獲カウントのいずれかのために、漁船での漁獲活動を監視することです。
ビデオに基づく階層分類は,漁獲過程において魚が激しく変形し自閉している長期漁獲魚の,安価で効率的な魚種識別を可能にする。
より重要なことに、階層分類の柔軟性は、異なる階層レベルで信頼度スコアを提供することで、ヒューマンレビューの労力を軽減する。
いくつかの関連作品は、階層分類にカスケードモデルを使用するか、画像ごとに予測を行うか、データセットの重複する階層データ構造を事前に予測する。
しかし,水産学者が提供した非重なりのない階層型データ構造により,本手法は階層型データ構造を強制し,映像ベースの水産データに対する効率的なトレーニングと推論戦略を導入する。
実験の結果,本手法は従来のフラット分類システムを大幅に上回っており,cnnモデル設計,トレーニング戦略,階層型魚種分類タスクにおけるビデオベース推論計画への貢献を正当化する。
関連論文リスト
- WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database [49.1574468325115]
textbfWhaleNet (Wavelet Highly Adaptive Learning Ensemble Network) は海洋哺乳動物の発声を分類するための高度な深層アンサンブルアーキテクチャである。
既存のアーキテクチャよりも8-10%の精度で分類精度を向上し、分類精度は9,7.61%である。
論文 参考訳(メタデータ) (2024-02-20T11:36:23Z) - Skeleton2vec: A Self-supervised Learning Framework with Contextualized
Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。
具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。
提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-01-01T12:08:35Z) - Transformer-based Self-Supervised Fish Segmentation in Underwater Videos [1.9249287163937976]
魚の高品質なセグメンテーションのための自己スーパービジョンを用いたトランスフォーマー方式を提案する。
1つのデータセットから水中ビデオのセットをトレーニングすると、提案モデルは従来のCNNベースおよびTransformerベースの自己教師方式を上回ることが示される。
論文 参考訳(メタデータ) (2022-06-11T01:20:48Z) - HCIL: Hierarchical Class Incremental Learning for Longline Fishing
Visual Monitoring [30.084499552709183]
我々は,CILシナリオ下での最先端の階層的分類法を大幅に改善する階層的クラスインクリメンタルラーニング(HCIL)モデルを導入する。
CILシステムは、データストリームからより多くのクラスを学習できなければならない。つまり、少数のクラスに対するトレーニングデータのみを最初から用意し、新しいクラスを徐々に追加する必要がある。
論文 参考訳(メタデータ) (2022-02-25T23:53:11Z) - Self-Supervised Class Incremental Learning [51.62542103481908]
既存のクラスインクリメンタルラーニング(CIL)手法は、データラベルに敏感な教師付き分類フレームワークに基づいている。
新しいクラスデータに基づいて更新する場合、それらは破滅的な忘れがちである。
本稿では,SSCILにおける自己指導型表現学習のパフォーマンスを初めて考察する。
論文 参考訳(メタデータ) (2021-11-18T06:58:19Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - The Fishnet Open Images Database: A Dataset for Fish Detection and
Fine-Grained Categorization in Fisheries [0.0]
商業漁船における魚の発見と細粒度分類の大規模データセットである魚網オープン画像データベースについて述べる。
データセットは、34のオブジェクトクラスを含む86,029の画像で構成されており、これまでで最大かつ最も多様な水産EM画像の公開データセットとなっている。
我々は,既存の検出・分類アルゴリズムの性能を評価し,そのデータセットが漁業におけるコンピュータビジョンアルゴリズム開発のための挑戦的なベンチマークとなることを示す。
論文 参考訳(メタデータ) (2021-06-16T23:53:18Z) - Movement Tracks for the Automatic Detection of Fish Behavior in Videos [63.85815474157357]
水中ビデオでサブルフィッシュ(Anoplopoma fimbria)の発芽行動のデータセットを提供し,その上での深層学習(DL)法による行動検出について検討した。
提案する検出システムは,Long Short-Term Memory(LSTM)ネットワークを用いて,サブルフィッシュの起動動作を識別する。
論文 参考訳(メタデータ) (2020-11-28T05:51:19Z) - A Realistic Fish-Habitat Dataset to Evaluate Algorithms for Underwater
Visual Analysis [2.6476746128312194]
我々は、DeepFishを大規模データセットでベンチマークスイートとして提示し、いくつかのコンピュータビジョンタスクのためのメソッドをトレーニングし、テストする。
このデータセットは、熱帯オーストラリアの海洋環境にある20の温帯生物から採取された約4万枚の画像で構成されている。
実験では,データセットの特徴を詳細に分析し,いくつかの最先端手法の性能評価を行った。
論文 参考訳(メタデータ) (2020-08-28T12:20:59Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - PLLay: Efficient Topological Layer based on Persistence Landscapes [24.222495922671442]
PLLayは、永続化ランドスケープに基づいた一般的なディープラーニングモデルのための新しいトポロジ的レイヤである。
任意の濾過を伴う一般的な永続ホモロジーに対して、層入力に関する微分可能性を示す。
論文 参考訳(メタデータ) (2020-02-07T13:34:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。