論文の概要: MATANet: A Multi-context Attention and Taxonomy-Aware Network for Fine-Grained Underwater Recognition of Marine Species
- arxiv url: http://arxiv.org/abs/2601.03729v1
- Date: Wed, 07 Jan 2026 09:21:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.389858
- Title: MATANet: A Multi-context Attention and Taxonomy-Aware Network for Fine-Grained Underwater Recognition of Marine Species
- Title(参考訳): 海洋生物の微粒水中認識のためのマルチコンテキスト注意・分類認識ネットワークMATANet
- Authors: Donghwan Lee, Byeongjin Kim, Geunhee Kim, Hyukjin Kwon, Nahyeon Maeng, Wooju Kim,
- Abstract要約: MATANetは、きめ細かい海洋種分類のために設計された新しいモデルである。
分類学と環境コンテキストを用いて、水中動物の不明瞭な特徴を解釈することで、専門家の戦略を模倣する。
FathomNet2025、FAIR1M、LifeCLEF2015-Fishデータセットの実験は、最先端のパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 6.870403086472032
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fine-grained classification of marine animals supports ecology, biodiversity and habitat conservation, and evidence-based policy-making. However, existing methods often overlook contextual interactions from the surrounding environment and insufficiently incorporate the hierarchical structure of marine biological taxonomy. To address these challenges, we propose MATANet (Multi-context Attention and Taxonomy-Aware Network), a novel model designed for fine-grained marine species classification. MATANet mimics expert strategies by using taxonomy and environmental context to interpret ambiguous features of underwater animals. It consists of two key components: a Multi-Context Environmental Attention Module (MCEAM), which learns relationships between regions of interest (ROIs) and their surrounding environments, and a Hierarchical Separation-Induced Learning Module (HSLM), which encodes taxonomic hierarchy into the feature space. MATANet combines instance and environmental features with taxonomic structure to enhance fine-grained classification. Experiments on the FathomNet2025, FAIR1M, and LifeCLEF2015-Fish datasets demonstrate state-of-the-art performance. The source code is available at: https://github.com/dhlee-work/fathomnet-cvpr2025-ssl
- Abstract(参考訳): 海洋生物のきめ細かい分類は、生態学、生物多様性、生息環境保護、エビデンスに基づく政策作成をサポートする。
しかし、既存の手法はしばしば周囲の環境からの文脈的相互作用を見落とし、海洋生物分類学の階層構造を不十分に組み込む。
これらの課題に対処するため、我々は、細粒海洋種分類用に設計された新しいモデルであるMATANet(Multi-context Attention and Taxonomy-Aware Network)を提案する。
MATANetは、水中動物の不明瞭な特徴を解釈するために分類学と環境コンテキストを用いて専門家の戦略を模倣している。
MCEAM(Multi-Context Environmental Attention Module)は、関心領域(ROI)とその周辺環境の関係を学習するものであり、階層的分離誘導学習モジュール(HSLM)は特徴空間に分類学的階層をエンコードする。
MATANetは、インスタンスと環境の特徴を分類学的構造と組み合わせ、きめ細かい分類を強化する。
FathomNet2025、FAIR1M、LifeCLEF2015-Fishデータセットの実験は、最先端のパフォーマンスを示している。
ソースコードは、https://github.com/dhlee-work/fathomnet-cvpr2025-sslで入手できる。
関連論文リスト
- An Ecologically-Informed Deep Learning Framework for Interpretable and Validatable Habitat Mapping [1.4672361353012924]
ECOSAICは、ベント性生息地の自動分類のための人工知能フレームワークである。
ECOSAICは、ドメインインフォームド特徴間の特殊化と直交性を最適化することにより、n次元特徴空間を圧縮する。
このモデルをコロンビア太平洋に応用した結果,マングローブから深度1000mの深い岩場まで広がる16のベント性生息地が確認された。
論文 参考訳(メタデータ) (2025-11-18T23:38:29Z) - MARIS: Marine Open-Vocabulary Instance Segmentation with Geometric Enhancement and Semantic Alignment [56.88334234553316]
我々は,水中オープンボキャブラリ(OV)セグメンテーションのための大規模なベンチマークであるtextbfMARIS (underlineMarine Open-Vocabulary underlineInstance underlineSegmentation)を紹介した。
当社のフレームワークは、既存のOVベースラインであるIn-DomainとCross-Domainの両方を一貫して上回ります。
論文 参考訳(メタデータ) (2025-10-17T07:50:58Z) - Hyperbolic Multimodal Representation Learning for Biological Taxonomies [23.639218053531962]
生物多様性研究における分類学的分類は、証拠に基づいて生物学的標本を構造化階層に分類することを含む。
このような階層モデルに対して,双曲型ネットワークがより良い埋め込み空間を提供できるかどうかを検討する。
提案手法は, マルチモーダルな入力を, コントラッシブと新規な重み付きエンテーメントに基づく目的を用いた共有双曲空間に埋め込む。
論文 参考訳(メタデータ) (2025-08-22T18:52:50Z) - BioCLIP 2: Emergent Properties from Scaling Hierarchical Contrastive Learning [60.80381372245902]
生体視覚モデルでは,大規模コントラスト視覚言語学習により創発的行動が観察される。
我々は、異なる種を区別するために、TreeOfLife-200MでBioCLIP 2を訓練する。
得られたBioCLIP 2の埋め込み空間における創発的特性を同定する。
論文 参考訳(メタデータ) (2025-05-29T17:48:20Z) - SuoiAI: Building a Dataset for Aquatic Invertebrates in Vietnam [4.338234621260792]
本稿では,ベトナムにおける水生無脊椎動物のデータセット構築のためのエンドツーエンドパイプラインであるSuoiAIを提案する。
データ収集,アノテーション,モデルトレーニングの手法を概説し,半教師付き学習によるアノテーションの取り組みの軽減に焦点をあてる。
本研究の目的は,データ不足,きめ細かな分類,多様な環境環境への展開といった課題を克服することである。
論文 参考訳(メタデータ) (2025-04-21T17:33:02Z) - Image-Based Relocalization and Alignment for Long-Term Monitoring of Dynamic Underwater Environments [57.59857784298534]
本稿では,視覚的位置認識(VPR),特徴マッチング,画像分割を組み合わせた統合パイプラインを提案する。
本手法は, 再検討領域のロバスト同定, 剛性変換の推定, 生態系変化の下流解析を可能にする。
論文 参考訳(メタデータ) (2025-03-06T05:13:19Z) - Hierarchical Classification for Automated Image Annotation of Coral Reef Benthic Structures [5.407146435972322]
自動ベント画像アノテーションは,サンゴ礁の気候変動対策を効率的に監視し,保護するために重要である。
現在の機械学習アプローチでは、ベント生物の階層的な性質を捉えることができない。
階層分類を用いた良性画像のアノテートを提案する。
論文 参考訳(メタデータ) (2024-12-11T09:28:30Z) - WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database [49.1574468325115]
textbfWhaleNet (Wavelet Highly Adaptive Learning Ensemble Network) は海洋哺乳動物の発声を分類するための高度な深層アンサンブルアーキテクチャである。
既存のアーキテクチャよりも8-10%の精度で分類精度を向上し、分類精度は9,7.61%である。
論文 参考訳(メタデータ) (2024-02-20T11:36:23Z) - BenthIQ: a Transformer-Based Benthic Classification Model for Coral
Restoration [4.931399476945033]
サンゴ礁は海洋生物多様性、沿岸保護、世界の人間の生活を支えるために不可欠である。
ベントニック合成マップを作成するための現在の手法は、しばしば空間被覆と分解能の間に妥協する。
水中基板の高精度な分類のために設計されたマルチラベルセマンティックセマンティックセマンティクスネットワークであるBenthIQを紹介する。
論文 参考訳(メタデータ) (2023-11-22T19:25:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。