論文の概要: Multi-label classification for multi-temporal, multi-spatial coral reef condition monitoring using vision foundation model with adapter learning
- arxiv url: http://arxiv.org/abs/2503.23012v1
- Date: Sat, 29 Mar 2025 08:32:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 14:36:07.869694
- Title: Multi-label classification for multi-temporal, multi-spatial coral reef condition monitoring using vision foundation model with adapter learning
- Title(参考訳): 適応学習を用いた視覚基礎モデルを用いた多時空間サンゴ礁環境モニタリングのためのマルチラベル分類
- Authors: Xinlei Shao, Hongruixuan Chen, Fan Zhao, Kirsty Magson, Jundong Chen, Peiran Li, Jiaqi Wang, Jun Sasaki,
- Abstract要約: 本研究は,DINOv2ビジョン基礎モデルとLoRAファインチューニング手法を組み合わせたアプローチを提案する。
実験の結果, DINOv2-LoRAモデルの方が64.77%の精度で, 従来のモデルでは60.34%であったのに対し, 一致率は64.77%であった。
- 参考スコア(独自算出の注目度): 20.74182654369854
- License:
- Abstract: Coral reef ecosystems provide essential ecosystem services, but face significant threats from climate change and human activities. Although advances in deep learning have enabled automatic classification of coral reef conditions, conventional deep models struggle to achieve high performance when processing complex underwater ecological images. Vision foundation models, known for their high accuracy and cross-domain generalizability, offer promising solutions. However, fine-tuning these models requires substantial computational resources and results in high carbon emissions. To address these challenges, adapter learning methods such as Low-Rank Adaptation (LoRA) have emerged as a solution. This study introduces an approach integrating the DINOv2 vision foundation model with the LoRA fine-tuning method. The approach leverages multi-temporal field images collected through underwater surveys at 15 dive sites at Koh Tao, Thailand, with all images labeled according to universal standards used in citizen science-based conservation programs. The experimental results demonstrate that the DINOv2-LoRA model achieved superior accuracy, with a match ratio of 64.77%, compared to 60.34% achieved by the best conventional model. Furthermore, incorporating LoRA reduced the trainable parameters from 1,100M to 5.91M. Transfer learning experiments conducted under different temporal and spatial settings highlight the exceptional generalizability of DINOv2-LoRA across different seasons and sites. This study is the first to explore the efficient adaptation of foundation models for multi-label classification of coral reef conditions under multi-temporal and multi-spatial settings. The proposed method advances the classification of coral reef conditions and provides a tool for monitoring, conserving, and managing coral reef ecosystems.
- Abstract(参考訳): サンゴ礁の生態系は生態系に不可欠なサービスを提供しているが、気候変動や人的活動による重大な脅威に直面している。
深層学習の進歩によりサンゴ礁の条件の自動分類が可能になったが、従来の深層モデルは複雑な水中生態画像を処理する際に高い性能を達成するのに苦慮している。
ビジョンファウンデーションモデルは、高い精度とクロスドメインの一般化性で知られ、有望なソリューションを提供する。
しかし、これらのモデルを微調整するにはかなりの計算資源が必要であり、結果として高い炭素排出量が発生する。
これらの課題に対処するため、ローランド適応(LoRA)のようなアダプタ学習手法がソリューションとして登場した。
本研究は,DINOv2ビジョン基礎モデルとLoRAファインチューニング手法を組み合わせたアプローチを提案する。
このアプローチでは、タイのKoh Taoにある15の潜水地点での水中調査を通じて収集された複数の時間領域の画像を活用し、すべての画像は市民科学に基づく保護プログラムで使用される普遍的な基準に従ってラベル付けされている。
実験の結果, DINOv2-LoRAモデルの方が64.77%の精度で, 従来のモデルでは60.34%であったのに対し, 一致率は64.77%であった。
さらに、LoRAの導入により、トレーニング可能なパラメータは1,100Mから5.91Mに削減された。
時間的・空間的な異なる設定で行われた移動学習実験は、異なる季節や場所にわたるDINOv2-LoRAの例外的な一般化性を浮き彫りにした。
本研究は,サンゴ礁環境のマルチラベル分類のための基礎モデルの多時的および多空間的環境下での効率的な適応を初めて検討したものである。
提案手法はサンゴ礁条件の分類を進め,サンゴ礁生態系のモニタリング,保存,管理を行うためのツールを提供する。
関連論文リスト
- Back Home: A Machine Learning Approach to Seashell Classification and Ecosystem Restoration [49.1574468325115]
コスタリカでは、年間平均5トンの貝殻が生態系から抽出されている。混入した貝殻は、原産地認識の欠如により生態系に戻れない。
貝殻同定のための畳み込みニューラルネットワーク(CNN)を開発した。
私たちは太平洋とカリブ海の海岸から約19万枚の画像からなるデータセットをスクラッチから構築しました。
このモデルはユーザフレンドリーなアプリケーションに統合され、これまで36,000以上の貝殻を分類し、画像1枚につき3秒以内にリアルタイムで結果を提供する。
論文 参考訳(メタデータ) (2025-01-08T23:07:10Z) - Hierarchical Classification for Automated Image Annotation of Coral Reef Benthic Structures [5.407146435972322]
自動ベント画像アノテーションは,サンゴ礁の気候変動対策を効率的に監視し,保護するために重要である。
現在の機械学習アプローチでは、ベント生物の階層的な性質を捉えることができない。
階層分類を用いた良性画像のアノテートを提案する。
論文 参考訳(メタデータ) (2024-12-11T09:28:30Z) - Learning Feature Inversion for Multi-class Anomaly Detection under General-purpose COCO-AD Benchmark [101.23684938489413]
異常検出(AD)は、しばしば産業品質検査や医学的病変検査のための異常の検出に焦点が当てられている。
この研究はまず、COCOをADフィールドに拡張することにより、大規模で汎用的なCOCO-ADデータセットを構築する。
セグメンテーション分野のメトリクスにインスパイアされた我々は、より実用的なしきい値に依存したAD固有のメトリクスをいくつか提案する。
論文 参考訳(メタデータ) (2024-04-16T17:38:26Z) - Automatic Coral Detection with YOLO: A Deep Learning Approach for Efficient and Accurate Coral Reef Monitoring [0.0]
サンゴ礁は、人為的な影響や気候変動によって脅威にさらされている重要な生態系である。
本稿では,深層学習モデルを用いたサンゴ自動検出システムを提案する。
論文 参考訳(メタデータ) (2024-04-03T08:00:46Z) - Deep learning for multi-label classification of coral conditions in the
Indo-Pacific via underwater photogrammetry [24.00646413446011]
本研究はインド太平洋におけるサンゴの一般的な条件と関連するストレスを表わしたデータセットを作成する。
既存の分類アルゴリズムを評価し、サンゴの条件を自動的に検出し、生態情報を抽出する新しいマルチラベル手法を提案した。
提案手法はサンゴの条件を, 健康, 危害, 死, 汚物として正確に分類する。
論文 参考訳(メタデータ) (2024-03-09T14:42:16Z) - Scalable Semantic 3D Mapping of Coral Reefs with Deep Learning [4.8902950939676675]
本稿では,エゴモーション映像から水中環境をマッピングするための新しいパラダイムを提案する。
前例のない規模で高精度な3Dセマンティックマッピングを行い,作業コストを大幅に削減した。
本手法は,サンゴ礁のサンゴ礁モニタリングを飛躍的にスケールアップする。
論文 参考訳(メタデータ) (2023-09-22T11:35:10Z) - Pengembangan Model untuk Mendeteksi Kerusakan pada Terumbu Karang dengan
Klasifikasi Citra [3.254879465902239]
本研究はFlickr APIを用いてFlickrから収集した923枚の画像からなる特別なデータセットを利用する。
この研究で使用される方法は、機械学習モデル、特に畳み込みニューラルネットワーク(CNN)の使用を含む。
その結果,Stock-Scratch ResNetモデルは,精度と精度で事前学習モデルより優れていることがわかった。
論文 参考訳(メタデータ) (2023-08-08T15:30:08Z) - PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-06-15T07:41:12Z) - Towards Generating Large Synthetic Phytoplankton Datasets for Efficient
Monitoring of Harmful Algal Blooms [77.25251419910205]
有害な藻類(HAB)は養殖農場で重大な魚死を引き起こす。
現在、有害藻や他の植物プランクトンを列挙する標準的な方法は、顕微鏡でそれらを手動で観察し数えることである。
合成画像の生成にはGAN(Generative Adversarial Networks)を用いる。
論文 参考訳(メタデータ) (2022-08-03T20:15:55Z) - SALT: Sea lice Adaptive Lattice Tracking -- An Unsupervised Approach to
Generate an Improved Ocean Model [72.3183990520267]
シーライス分散と分布を効率的に推定するためのシーライス適応格子追跡手法を提案する。
具体的には、局所的な海洋特性に基づいて、オーシャンモデルの格子グラフにノードをマージすることで、適応的な空間メッシュを生成する。
提案手法は, 変動する気候下での海洋ライス寄生圧マップの予測モデルにより, 積極的養殖管理の促進を約束するものである。
論文 参考訳(メタデータ) (2021-06-24T17:29:42Z) - Deep learning for lithological classification of carbonate rock micro-CT
images [52.77024349608834]
本研究は,ブラジルのプリサルト炭酸塩岩微視的画像のパターン同定にディープラーニング技術を適用することを目的としている。
4つの畳み込みニューラルネットワークモデルが提案された。
精度によると、リサイズ画像で訓練されたモデル2は、最初の評価アプローチでは平均75.54%、2番目の評価では平均81.33%に達した。
論文 参考訳(メタデータ) (2020-07-30T19:14:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。