論文の概要: ShellfishNet: A Domain-Specific Benchmark for Visual Recognition of Marine Molluscs
- arxiv url: http://arxiv.org/abs/2605.07338v1
- Date: Fri, 08 May 2026 06:42:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.869135
- Title: ShellfishNet: A Domain-Specific Benchmark for Visual Recognition of Marine Molluscs
- Title(参考訳): ShellfishNet: 海洋軟体動物の視覚的認識のためのドメイン特化ベンチマーク
- Authors: Ziheng Zhou, Yang Wang, Nan Wang, Chengliang Wu, Jun Yan,
- Abstract要約: 貝の生物多様性は沿岸生態系にとって深刻な脅威である。
ShellfishNetは、実世界の生態モニタリング制約に対する包括的なイメージベンチマークデータセットである。
- 参考スコア(独自算出の注目度): 5.457526757904208
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The decline of global shellfish biodiversity poses a severe threat to coastal ecosystems. Although artificial intelligence (AI) technologies show potential for automated ecological monitoring, existing marine benthic datasets often lack adaptation to the complexities of real underwater environments (e.g., variable lighting conditions and diverse species postures), posing challenges for the robust generalization of vision models in practical ecological monitoring. To address this problem, we construct ShellfishNet, a comprehensive image benchmark dataset designed specifically for real-world ecological monitoring constraints. Comprising 8,691 images across 32 taxa, this dataset includes a curated subset annotated with descriptive captions. It is constructed through field photography and web scraping, encompassing samples from complex real-world environments. Based on this benchmark, we systematically evaluate 80 representative neural network models, including Convolutional Neural Networks (CNNs), Vision Transformers (ViTs), State Space Models (SSMs), and Self-Supervised Learning (SSL) methods. Furthermore, we evaluate the performance of fine-grained visual categorization (FGVC) models and investigate the image captioning capabilities of several mainstream multimodal large language models (MLLMs). Meanwhile, we introduce image corruption benchmark tests to simulate common underwater degradation scenarios (turbidity, severe weather) and assess the robustness of vision models, enabling trustworthy decisions on ecological protection in the wild. ShellfishNet is dedicated to providing a data foundation and a model-evaluation benchmark for the intelligent monitoring of benthic organisms.
- Abstract(参考訳): 世界の貝類の生物多様性の低下は、沿岸生態系に深刻な脅威をもたらす。
人工知能(AI)技術は、自動生態モニタリングの可能性を秘めているが、既存の海洋ベントニックデータセットは、実際の水中環境(例えば、様々な照明条件や多様な種の姿勢)の複雑さに適応していないことが多く、実用的な生態モニタリングにおける視覚モデルの堅牢な一般化の課題を提起している。
この問題に対処するため、実世界の生態モニタリング制約に特化して設計された総合的な画像ベンチマークデータセットであるShellfishNetを構築した。
32の分類群に8,691のイメージを含むこのデータセットは、記述的なキャプションで注釈付けされたキュレートされたサブセットを含んでいる。
フィールド写真とWebスクレイピングによって構築され、複雑な現実世界の環境からサンプルを包含している。
このベンチマークに基づいて、畳み込みニューラルネットワーク(CNN)、ビジョントランスフォーマー(ViT)、状態空間モデル(SSM)、自己監視学習(SSL)メソッドを含む80の代表的なニューラルネットワークモデルを体系的に評価する。
さらに,FGVCモデルの性能評価を行い,主要なマルチモーダル大言語モデル(MLLM)のキャプション機能について検討した。
一方,一般的な水中劣化シナリオ(濁度,悪天候)をシミュレートし,視覚モデルの堅牢性を評価し,環境保護に関する信頼性の高い決定を可能にするため,画像汚濁ベンチマークテストを導入する。
ShellfishNetは、ベント生物のインテリジェントなモニタリングのためのデータ基盤とモデル評価ベンチマークの提供に特化している。
関連論文リスト
- Deep Learning Models for Coral Bleaching Classification in Multi-Condition Underwater Image Datasets [0.0]
サンゴ礁は多くの海洋生物を支えており、嵐や洪水からの沿岸保護の重要な源となっている。
本研究では,多様なグローバルデータセットに基づく,機械学習に基づくサンゴ白化分類システムを提案する。
我々はResidual Neural Network (ResNet), Vision Transformer (ViT), Convolutional Neural Network (CNN)の3つの最先端モデルのベンチマークと比較を行った。
論文 参考訳(メタデータ) (2025-10-24T06:13:15Z) - UWBench: A Comprehensive Vision-Language Benchmark for Underwater Understanding [54.16709436340606]
視覚言語モデル(VLM)は自然界の理解において顕著な成功を収めた。
水中画像は、厳しい光の減衰、色歪み、懸濁粒子散乱などの固有の課題を呈している。
水中視覚言語理解のためのベンチマークであるUWBenchを紹介する。
論文 参考訳(メタデータ) (2025-10-21T03:32:15Z) - FishDet-M: A Unified Large-Scale Benchmark for Robust Fish Detection and CLIP-Guided Model Selection in Diverse Aquatic Visual Domains [1.3791394805787949]
FishDet-Mは、様々な水生環境にまたがる13の公開データセットを含む、魚検出のための最大の統一されたベンチマークである。
すべてのデータは、境界ボックスとセグメンテーションマスクの両方を持つCOCOスタイルのアノテーションを使用して調和する。
FishDet-Mは、複雑な水シーンにおけるオブジェクト検出を評価するための標準化され再現可能なプラットフォームを確立する。
論文 参考訳(メタデータ) (2025-07-23T18:32:01Z) - REOBench: Benchmarking Robustness of Earth Observation Foundation Models [48.24281482353377]
REOBenchは、地球観測基盤モデルの堅牢性を評価するための最初の総合的なベンチマークである。
マスク付き画像モデリング、コントラスト学習、視覚言語事前学習パラダイムを用いて訓練された幅広いモデルの体系的評価を行う。
その結果, 既存の地球観測基盤モデルでは, 入力汚損に晒された場合, 顕著な性能劣化がみられた。
論文 参考訳(メタデータ) (2025-05-22T15:34:50Z) - Real-time Seafloor Segmentation and Mapping [0.0]
ポシドニア・オーシャンカ・メドウ(Posidonia Oceanica meadows)は、サバイバルと保全のために岩に大きく依存する海草の一種である。
ディープラーニングベースのセマンティックセグメンテーションと視覚自動監視システムは、さまざまなアプリケーションで有望であることを示している。
本稿では,自律型水中車両(AUV)がポシドニア大洋の牧草地の境界を自律的に調査できるようにするために,機械学習とコンピュータビジョン技術を組み合わせたフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-14T22:49:08Z) - Image-Based Relocalization and Alignment for Long-Term Monitoring of Dynamic Underwater Environments [57.59857784298534]
本稿では,視覚的位置認識(VPR),特徴マッチング,画像分割を組み合わせた統合パイプラインを提案する。
本手法は, 再検討領域のロバスト同定, 剛性変換の推定, 生態系変化の下流解析を可能にする。
論文 参考訳(メタデータ) (2025-03-06T05:13:19Z) - DAMamba: Vision State Space Model with Dynamic Adaptive Scan [51.81060691414399]
状態空間モデル(SSM)は近年、コンピュータビジョンにおいて大きな注目を集めている。
スキャン順序と領域を適応的に割り当てるデータ駆動型動的適応スキャン(DAS)を提案する。
DASをベースとしたビジョンバックボーンDAMambaの提案は,現在のビジョンタスクにおけるMambaモデルよりもはるかに優れている。
論文 参考訳(メタデータ) (2025-02-18T08:12:47Z) - PIGUIQA: A Physical Imaging Guided Perceptual Framework for Underwater Image Quality Assessment [59.9103803198087]
水中画像品質評価(UIQA)のための物理画像ガイド型知覚フレームワークを提案する。
水中放射移動理論を応用して、物理に基づく画像推定を統合して、これらの歪みの定量的な測定値を確立する。
提案モデルは,画像品質のスコアを正確に予測し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-12-20T03:31:45Z) - Composing Open-domain Vision with RAG for Ocean Monitoring and Conservation [41.94295877935867]
本稿では, 海洋アプリケーションにおける画像解析と映像解析のためのレジリエントでスケーラブルなソリューションを提案する。
我々は,本手法を,ビデオ漁船から魚を分類する予備的応用を通じて検証する。
論文 参考訳(メタデータ) (2024-12-03T08:34:42Z) - Towards Evaluating the Robustness of Visual State Space Models [63.14954591606638]
視覚状態空間モデル(VSSM)は視覚知覚タスクにおいて顕著な性能を示した。
しかし、自然と敵対的な摂動の下での頑丈さは依然として重要な懸念事項である。
様々な摂動シナリオ下でのVSSMの頑健さを総合的に評価する。
論文 参考訳(メタデータ) (2024-06-13T17:59:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。