論文の概要: Counting Fish with Temporal Representations of Sonar Video
- arxiv url: http://arxiv.org/abs/2502.05129v1
- Date: Fri, 07 Feb 2025 18:02:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 14:56:24.651356
- Title: Counting Fish with Temporal Representations of Sonar Video
- Title(参考訳): ソナービデオの時間表現による魚の数え方
- Authors: Kai Van Brunt, Justin Kay, Timm Haucke, Pietro Perona, Grant Van Horn, Sara Beery,
- Abstract要約: 本稿では,エコー図解析に基づく魚数計測のための軽量なコンピュータビジョン手法を提案する。
アラスカのケナイ川から得られた代表データに対して23%のカウント誤差を達成し,本手法の有効性を実証した。
- 参考スコア(独自算出の注目度): 15.713015426791221
- License:
- Abstract: Accurate estimates of salmon escapement - the number of fish migrating upstream to spawn - are key data for conservation and fishery management. Existing methods for salmon counting using high-resolution imaging sonar hardware are non-invasive and compatible with computer vision processing. Prior work in this area has utilized object detection and tracking based methods for automated salmon counting. However, these techniques remain inaccessible to many sonar deployment sites due to limited compute and connectivity in the field. We propose an alternative lightweight computer vision method for fish counting based on analyzing echograms - temporal representations that compress several hundred frames of imaging sonar video into a single image. We predict upstream and downstream counts within 200-frame time windows directly from echograms using a ResNet-18 model, and propose a set of domain-specific image augmentations and a weakly-supervised training protocol to further improve results. We achieve a count error of 23% on representative data from the Kenai River in Alaska, demonstrating the feasibility of our approach.
- Abstract(参考訳): サケの流出の正確な推定 - 上流から産卵する魚の数 - は、保全と漁業管理の鍵となるデータである。
高分解能撮像ソナーハードウェアを用いた既存のサーモンカウント法は、コンピュータビジョン処理と非侵襲的で互換性がある。
この領域での以前の研究は、自動サーモンカウントのためのオブジェクト検出と追跡に基づく手法を利用していた。
しかし、これらの技術は、フィールドでの計算と接続性に制限があるため、多くのソナー配置サイトではアクセスできないままである。
超音波画像から数百フレームのソナー映像を1つの画像に圧縮する時間的表現を解析し,魚を数える方法を提案する。
本研究では,ResNet-18モデルを用いて,200コマのタイムウインドウ内におけるアップストリームおよびダウンストリームのカウントをエコーグラムから直接予測し,結果を改善するために,ドメイン固有の画像拡張と弱い教師付きトレーニングプロトコルを提案する。
アラスカのケナイ川から得られた代表データに対して23%のカウント誤差を達成し,本手法の有効性を実証した。
関連論文リスト
- A framework for river connectivity classification using temporal image processing and attention based neural networks [0.0]
気候変動に伴う極度の気象現象は、河川や河川の接続に変化をもたらす可能性がある。
伝統的な河川流量計は展開に費用がかかり、大きな川体に限られている。
トレイルカメラ方式は低コストで容易に展開でき、時間単位のデータを集める代替手段である。
論文 参考訳(メタデータ) (2025-02-01T16:00:28Z) - OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文 参考訳(メタデータ) (2023-12-14T18:58:52Z) - Learning Robust Multi-Scale Representation for Neural Radiance Fields
from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。
提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文 参考訳(メタデータ) (2023-11-08T08:18:23Z) - TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z) - Self-Supervised Multi-Frame Monocular Scene Flow [61.588808225321735]
自己監督学習に基づくマルチフレーム一眼的シーンフローネットワークを導入。
自己監督学習に基づく単眼的シーンフロー法における最新の精度を観察する。
論文 参考訳(メタデータ) (2021-05-05T17:49:55Z) - Deep learning with self-supervision and uncertainty regularization to
count fish in underwater images [28.261323753321328]
効果的な保全活動には、効果的な人口監視が必要です。
画像サンプリングによる人口のモニタリングにより、データ収集は安価で広く、侵入性が低くなっている。
このようなデータから動物を数えることは、特に騒々しい画像に密に詰め込まれた場合、困難です。
深層学習は多くのコンピュータビジョンタスクの最先端の手法であるが、動物を数えるためにはまだ十分に研究されていない。
論文 参考訳(メタデータ) (2021-04-30T13:02:19Z) - FisheyeSuperPoint: Keypoint Detection and Description Network for
Fisheye Images [2.187613144178315]
キーポイントの検出と記述はコンピュータビジョンシステムで一般的に使用されるビルディングブロックである。
SuperPointは、ホモグラフィー推定における最先端の結果を達成した自己監視型キーポイント検出器およびディスクリプタです。
本稿では,魚眼画像の学習を可能にする魚眼適応パイプラインを提案する。
論文 参考訳(メタデータ) (2021-02-27T11:26:34Z) - Learning Monocular Dense Depth from Events [53.078665310545745]
イベントカメラは、強度フレームではなく、非同期イベントのストリームの形式で輝度を変化させる。
最近の学習に基づくアプローチは、単眼深度予測のようなイベントベースのデータに適用されている。
本稿では,この課題を解決するための繰り返しアーキテクチャを提案し,標準フィードフォワード法よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-10-16T12:36:23Z) - Single Image Super-Resolution for Domain-Specific Ultra-Low Bandwidth
Image Transmission [1.5469452301122177]
水中音響通信のような低帯域通信は、最高速度30-50kbit/sで制限される。
本研究は,漁網にカメラを設置したトロール漁で得られた多種多様なデータセットについて検討した。
ニューラルネットワークは、元のイメージを再構築しようと、アップサンプリングを行うように訓練される。
論文 参考訳(メタデータ) (2020-09-09T06:44:30Z) - Lift, Splat, Shoot: Encoding Images From Arbitrary Camera Rigs by
Implicitly Unprojecting to 3D [100.93808824091258]
本稿では,任意の数のカメラから映像データを与えられたシーンの鳥眼ビュー表現を直接抽出するエンド・ツー・エンドアーキテクチャを提案する。
我々のアプローチは、それぞれの画像をそれぞれのカメラのフラストラムに個別に“リフト”し、すべてのフラストラムを鳥の目視格子に“プレート”することです。
提案モデルにより推定される表現は,テンプレートトラジェクトリを鳥眼ビューのコストマップに"撮影"することで,終末動作計画の解釈を可能にすることを示す。
論文 参考訳(メタデータ) (2020-08-13T06:29:01Z) - Temperate Fish Detection and Classification: a Deep Learning based
Approach [6.282069822653608]
本研究では,2段階の深層学習手法を提案する。
最初のステップは、種や性別によらず、画像中の各魚を検出することです。
第2のステップでは、画像中の各魚を事前フィルタリングせずに分類するために、Squeeze-and-Excitation (SE)アーキテクチャを備えた畳み込みニューラルネットワーク(CNN)を採用する。
論文 参考訳(メタデータ) (2020-05-14T12:40:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。