論文の概要: AquaMonitor: A multimodal multi-view image sequence dataset for real-life aquatic invertebrate biodiversity monitoring
- arxiv url: http://arxiv.org/abs/2505.22065v1
- Date: Wed, 28 May 2025 07:45:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.472337
- Title: AquaMonitor: A multimodal multi-view image sequence dataset for real-life aquatic invertebrate biodiversity monitoring
- Title(参考訳): AquaMonitor: 実生活における水生無脊椎動物の生物多様性モニタリングのためのマルチモーダルマルチビュー画像シーケンスデータセット
- Authors: Mikko Impiö, Philipp M. Rehsen, Tiina Laamanen, Arne J. Beermann, Florian Leese, Jenni Raitoharju,
- Abstract要約: AquaMonitorは、通常の環境モニタリング中に収集された水性無脊椎動物のコンピュータビジョンデータセットとしては初めてのものだ。
データセットは43,189の標本から2.7Mの画像、1358の標本のDNA配列、1494の標本の乾物量と大きさの計測を含む。
- 参考スコア(独自算出の注目度): 4.412919904332943
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents the AquaMonitor dataset, the first large computer vision dataset of aquatic invertebrates collected during routine environmental monitoring. While several large species identification datasets exist, they are rarely collected using standardized collection protocols, and none focus on aquatic invertebrates, which are particularly laborious to collect. For AquaMonitor, we imaged all specimens from two years of monitoring whenever imaging was possible given practical limitations. The dataset enables the evaluation of automated identification methods for real-life monitoring purposes using a realistically challenging and unbiased setup. The dataset has 2.7M images from 43,189 specimens, DNA sequences for 1358 specimens, and dry mass and size measurements for 1494 specimens, making it also one of the largest biological multi-view and multimodal datasets to date. We define three benchmark tasks and provide strong baselines for these: 1) Monitoring benchmark, reflecting real-life deployment challenges such as open-set recognition, distribution shift, and extreme class imbalance, 2) Classification benchmark, which follows a standard fine-grained visual categorization setup, and 3) Few-shot benchmark, which targets classes with only few training examples from very fine-grained categories. Advancements on the Monitoring benchmark can directly translate to improvement of aquatic biodiversity monitoring, which is an important component of regular legislative water quality assessment in many countries.
- Abstract(参考訳): 本稿では,環境モニタリングにおいて収集した水性無脊椎動物のコンピュータビジョンデータセットであるAquaMonitorデータセットについて述べる。
いくつかの大きな種識別データセットが存在するが、これらは標準化された採集プロトコルを使用して収集されることは稀であり、特に採集が困難である水生無脊椎動物に焦点を当てることはない。
AquaMonitorでは、2年間の観察から得られたすべての標本を撮影しました。
このデータセットは、現実的に困難で偏りのないセットアップを使用して、実生活監視目的の自動識別方法の評価を可能にする。
データセットは43,189の標本から2.7Mの画像、1358の標本のDNA配列、1494の標本の乾物質量とサイズの測定からなり、これまでで最大の生物のマルチビューとマルチモーダルデータセットの1つである。
3つのベンチマークタスクを定義し、これらに対する強力なベースラインを提供します。
1) モニタリングベンチマークは, オープンセット認識, 分散シフト, 極端なクラス不均衡など, 実生活の展開課題を反映している。
2 標準的なきめ細かい視覚分類設定に従う分類基準、及び
3) 非常にきめ細かいカテゴリからトレーニング例をほとんど持たないクラスをターゲットとするFew-shotベンチマーク。
モニタリングベンチマークの進歩は、多くの国における法定水質評価の重要な構成要素である水生生物多様性モニタリングの改善に直接翻訳することができる。
関連論文リスト
- Image-Based Relocalization and Alignment for Long-Term Monitoring of Dynamic Underwater Environments [57.59857784298534]
本稿では,視覚的位置認識(VPR),特徴マッチング,画像分割を組み合わせた統合パイプラインを提案する。
本手法は, 再検討領域のロバスト同定, 剛性変換の推定, 生態系変化の下流解析を可能にする。
論文 参考訳(メタデータ) (2025-03-06T05:13:19Z) - MPT: A Large-scale Multi-Phytoplankton Tracking Benchmark [36.37530623015916]
本稿では,様々な背景情報と観測時の動作変化を網羅するベンチマークデータセットであるMultiple Phytoplankton Tracking (MPT)を提案する。
このデータセットには27種類の植物プランクトンと動物プランクトンが含まれ、14種類の背景があり、多様な複雑な水中環境をシミュレートしている。
標準特徴抽出器の出力残量を予測するための追加特徴抽出器を導入し、抽出器の異なる層の特徴に基づいて多スケールのフレーム間類似性を計算した。
論文 参考訳(メタデータ) (2024-10-22T04:57:28Z) - Underwater Camouflaged Object Tracking Meets Vision-Language SAM2 [60.47622353256502]
本研究は,UW-COT220という大規模水中カモフラージュ型物体追跡データセットを提案する。
提案したデータセットに基づいて、本研究はまず、水中環境に挑戦するSAMとSAM2ベースのトラッカーを含む、現在の高度な視覚オブジェクト追跡手法を評価する。
本研究はSAM2よりもSAM2を改良し,水中カモフラージュ物体の複雑度を処理できることを実証した。
論文 参考訳(メタデータ) (2024-09-25T13:10:03Z) - Wild Face Anti-Spoofing Challenge 2023: Benchmark and Results [73.98594459933008]
顔認証システム(FAS)は、顔認識システムの完全性を保護するための重要なメカニズムである。
この制限は、公開可能なFASデータセットの不足と多様性の欠如に起因する可能性がある。
制約のない環境で収集された大規模で多様なFASデータセットであるWild Face Anti-Spoofingデータセットを紹介した。
論文 参考訳(メタデータ) (2023-04-12T10:29:42Z) - Vision meets algae: A novel way for microalgae recognization and health monitor [6.731844884087066]
このデータセットは、異なる状態の藻属と同じ属の異なる状態の画像を含む。
このデータセット上で、TOOD、YOLOv5、YOLOv8およびRCNNアルゴリズムの変種をトレーニング、検証、テストしました。
その結果,1段階と2段階の物体検出モデルの両方で平均精度が向上した。
論文 参考訳(メタデータ) (2022-11-14T17:11:15Z) - Ensembles of Vision Transformers as a New Paradigm for Automated
Classification in Ecology [0.0]
データ効率のよい画像変換器(DeiTs)のアンサンブルが従来のSOTA(SOTA)よりも大幅に優れていたことを示す。
テストしたすべてのデータセットに対して、新しいSOTAを実現し、以前のSOTAの18.48%から87.50%の誤差を削減した。
論文 参考訳(メタデータ) (2022-03-03T14:16:22Z) - A Realistic Fish-Habitat Dataset to Evaluate Algorithms for Underwater
Visual Analysis [2.6476746128312194]
我々は、DeepFishを大規模データセットでベンチマークスイートとして提示し、いくつかのコンピュータビジョンタスクのためのメソッドをトレーニングし、テストする。
このデータセットは、熱帯オーストラリアの海洋環境にある20の温帯生物から採取された約4万枚の画像で構成されている。
実験では,データセットの特徴を詳細に分析し,いくつかの最先端手法の性能評価を行った。
論文 参考訳(メタデータ) (2020-08-28T12:20:59Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。