論文の概要: Multimodal-based Scene-Aware Framework for Aquatic Animal Segmentation
- arxiv url: http://arxiv.org/abs/2112.06193v1
- Date: Sun, 12 Dec 2021 09:57:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 11:27:40.226903
- Title: Multimodal-based Scene-Aware Framework for Aquatic Animal Segmentation
- Title(参考訳): 水生動物セグメンテーションのためのマルチモーダル型シーンアウェアフレームワーク
- Authors: Minh-Quan Le and Trung-Nghia Le and Tam V. Nguyen and Isao Echizen and
Minh-Triet Tran
- Abstract要約: 深層学習に基づく手法は水生動物のセグメンテーションに広く用いられている。
我々は「水生動物種」という新しいデータセットを作成しました
我々は新しいマルチモーダル型シーン認識セグメンテーションフレームワークを考案した。
- 参考スコア(独自算出の注目度): 21.59585916277418
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent years have witnessed great advances in object segmentation research.
In addition to generic objects, aquatic animals have attracted research
attention. Deep learning-based methods are widely used for aquatic animal
segmentation and have achieved promising performance. However, there is a lack
of challenging datasets for benchmarking. Therefore, we have created a new
dataset dubbed "Aquatic Animal Species." Furthermore, we devised a novel
multimodal-based scene-aware segmentation framework that leverages the
advantages of multiple view segmentation models to segment images of aquatic
animals effectively. To improve training performance, we developed a guided
mixup augmentation method. Extensive experiments comparing the performance of
the proposed framework with state-of-the-art instance segmentation methods
demonstrated that our method is effective and that it significantly outperforms
existing methods.
- Abstract(参考訳): 近年,物体分割研究の進歩が注目されている。
一般的な対象に加え、水生動物は研究の注目を集めている。
深層学習に基づく手法は水生動物の分節に広く用いられ,有望な性能を達成している。
しかし、ベンチマークには難しいデータセットが不足している。
そこで我々は「水生動物種」という新しいデータセットを作成した。
さらに,複数視点セグメンテーションモデルの利点を活かし,水生動物のイメージを効果的にセグメンテーションする,マルチモーダル型シーンアウェアセグメンテーションフレームワークを考案した。
トレーニング性能を向上させるため,ガイドミキサアップ拡張法を開発した。
提案フレームワークの性能と最先端インスタンスセグメンテーション法を比較した広範な実験により,提案手法が有効であること,既存手法を大幅に上回ることを示した。
関連論文リスト
- Benchmarking Large Language Models for Image Classification of Marine Mammals [4.274291455715579]
我々は65種類の海洋哺乳類の1,423種類の画像を用いたベンチマークデータセットを構築した。
各動物は、種レベルから中レベル、グループレベルまで、それぞれ異なるレベルに分類される。
我々はこれらの海洋哺乳動物を分類するためのいくつかのアプローチを評価する。
論文 参考訳(メタデータ) (2024-10-22T01:49:49Z) - OpenAnimals: Revisiting Person Re-Identification for Animals Towards Better Generalization [10.176567936487364]
本研究は,BoT,AGW,SBS,MGNなど,最先端の人物再同定手法を再検討することによって実施する。
我々は,HyenaID,LeopardID,SeaTurtleID,WhaleSharkIDなどの動物再同定ベンチマークにおいて,その有効性を評価する。
以上の結果から,いくつかの手法がうまく機能する一方で,多くの手法が一般化せず,2つの課題の間に有意な違いがあることが判明した。
textbfAnimal textbfReに適した強力な textbfBase モデルである ARBase を提案する。
論文 参考訳(メタデータ) (2024-09-30T20:07:14Z) - Diving into Underwater: Segment Anything Model Guided Underwater Salient Instance Segmentation and A Large-scale Dataset [60.14089302022989]
水中視覚タスクは複雑な水中状況のため、しばしばセグメンテーションの精度が低い。
第1次大規模水中塩分分節データセット(USIS10K)を構築した。
本研究では,水中ドメインに特化してセグメンツ・ア・シング・モデル(USIS-SAM)に基づく水中塩分・インスタンス・アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-06-10T06:17:33Z) - Generative Active Learning for Long-tailed Instance Segmentation [55.66158205855948]
キャッシュ勾配に基づいて生成したデータの寄与を推定する新しいアルゴリズムであるBSGALを提案する。
実験により,BSGALはベースラインアプローチより優れ,長い尾のセグメンテーションの性能が効果的に向上することが示された。
論文 参考訳(メタデータ) (2024-06-04T15:57:43Z) - Fantastic Animals and Where to Find Them: Segment Any Marine Animal with Dual SAM [62.85895749882285]
海洋動物(英: Marine Animal、MAS)は、海洋環境に生息する動物を分類する動物である。
高性能MASのための新しい特徴学習フレームワークDual-SAMを提案する。
提案手法は,広く使用されている5つのMASデータセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-04-07T15:34:40Z) - WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database [49.1574468325115]
textbfWhaleNet (Wavelet Highly Adaptive Learning Ensemble Network) は海洋哺乳動物の発声を分類するための高度な深層アンサンブルアーキテクチャである。
既存のアーキテクチャよりも8-10%の精度で分類精度を向上し、分類精度は9,7.61%である。
論文 参考訳(メタデータ) (2024-02-20T11:36:23Z) - Transformer-based Self-Supervised Fish Segmentation in Underwater Videos [1.9249287163937976]
魚の高品質なセグメンテーションのための自己スーパービジョンを用いたトランスフォーマー方式を提案する。
1つのデータセットから水中ビデオのセットをトレーニングすると、提案モデルは従来のCNNベースおよびTransformerベースの自己教師方式を上回ることが示される。
論文 参考訳(メタデータ) (2022-06-11T01:20:48Z) - Revisiting Contrastive Methods for Unsupervised Learning of Visual
Representations [78.12377360145078]
対照的な自己教師型学習は、セグメンテーションやオブジェクト検出といった多くの下流タスクにおいて教師付き事前訓練よりも優れています。
本稿では,データセットのバイアスが既存手法にどのように影響するかを最初に検討する。
現在のコントラストアプローチは、(i)オブジェクト中心対シーン中心、(ii)一様対ロングテール、(iii)一般対ドメイン固有データセットなど、驚くほどうまく機能することを示す。
論文 参考訳(メタデータ) (2021-06-10T17:59:13Z) - Reviving Iterative Training with Mask Guidance for Interactive
Segmentation [8.271859911016719]
クリックに基づくインタラクティブセグメンテーションに関する最近の研究は、様々な推論時間最適化スキームを用いて最先端の結果を示している。
従来のステップのセグメンテーションマスクを用いた,クリックベースのインタラクティブセグメンテーションのための簡単なフィードフォワードモデルを提案する。
COCOとLVISの組み合わせで訓練されたモデルと、多様で高品質のアノテーションは、既存のすべてのモデルよりも優れたパフォーマンスを示しています。
論文 参考訳(メタデータ) (2021-02-12T15:44:31Z) - The Devil is in Classification: A Simple Framework for Long-tail Object
Detection and Instance Segmentation [93.17367076148348]
本稿では,最新のロングテールLVISデータセットを用いて,最先端の2段階のインスタンスセグメンテーションモデルMask R-CNNの性能低下について検討する。
主な原因は、オブジェクト提案の不正確な分類である。
そこで本研究では,2段階のクラスバランスサンプリング手法により,分類ヘッドバイアスをより効果的に緩和する,簡単な校正フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T12:49:07Z) - Semantic Segmentation of Underwater Imagery: Dataset and Benchmark [13.456412091502527]
水中イメージリー(SUIM)のセマンティック分析のための最初の大規模データセットを提示する。
魚(無脊椎動物)、サンゴ礁(無脊椎動物)、水生植物、難破船、人間ダイバー、ロボット、海底植物である。
また、標準的な性能指標に基づいて、最先端のセマンティックセマンティックセマンティクス手法のベンチマーク評価を行う。
論文 参考訳(メタデータ) (2020-04-02T19:53:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。