論文の概要: PlantSAM: An Object Detection-Driven Segmentation Pipeline for Herbarium Specimens
- arxiv url: http://arxiv.org/abs/2507.16506v1
- Date: Tue, 22 Jul 2025 12:02:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:14.099244
- Title: PlantSAM: An Object Detection-Driven Segmentation Pipeline for Herbarium Specimens
- Title(参考訳): PlantSAM: ハーバリウムサンプルのためのオブジェクト検出駆動セグメンテーションパイプライン
- Authors: Youcef Sklab, Florian Castanet, Hanane Ariouat, Souhila Arib, Jean-Daniel Zucker, Eric Chenin, Edi Prifti,
- Abstract要約: 植物領域検出のための YOLOv10 とセグメンテーションのための Segment Anything Model (SAM2) を統合した自動セグメンテーションパイプラインである PlantSAM を紹介する。
YOLOv10はSAM2を誘導するバウンディングボックスプロンプトを生成し、セグメンテーション精度を高める。
PlantSAMは最先端のセグメンテーション性能を達成し、IoUは0.94、Dice係数は0.97である。
- 参考スコア(独自算出の注目度): 0.5339846068056558
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep learning-based classification of herbarium images is hampered by background heterogeneity, which introduces noise and artifacts that can potentially mislead models and reduce classification accuracy. Addressing these background-related challenges is critical to improving model performance. We introduce PlantSAM, an automated segmentation pipeline that integrates YOLOv10 for plant region detection and the Segment Anything Model (SAM2) for segmentation. YOLOv10 generates bounding box prompts to guide SAM2, enhancing segmentation accuracy. Both models were fine-tuned on herbarium images and evaluated using Intersection over Union (IoU) and Dice coefficient metrics. PlantSAM achieved state-of-the-art segmentation performance, with an IoU of 0.94 and a Dice coefficient of 0.97. Incorporating segmented images into classification models led to consistent performance improvements across five tested botanical traits, with accuracy gains of up to 4.36% and F1-score improvements of 4.15%. Our findings highlight the importance of background removal in herbarium image analysis, as it significantly enhances classification accuracy by allowing models to focus more effectively on the foreground plant structures.
- Abstract(参考訳): 深層学習に基づくハーバリウム画像の分類は、背景の不均一性によって妨げられている。
このようなバックグラウンドに関わる課題に対処することは、モデルパフォーマンスを改善する上で非常に重要です。
植物領域検出のための YOLOv10 とセグメンテーションのための Segment Anything Model (SAM2) を統合した自動セグメンテーションパイプラインである PlantSAM を紹介する。
YOLOv10はSAM2を誘導するバウンディングボックスプロンプトを生成し、セグメンテーション精度を高める。
両モデルともハーバリウム画像を微調整し,IoU(Intersection over Union)とDice係数を用いて評価した。
PlantSAMは最先端のセグメンテーション性能を達成し、IoUは0.94、Dice係数は0.97である。
分割されたイメージを分類モデルに組み込むことで、5つの試験された植物形質に対して一貫した性能向上を実現し、精度は4.36%まで向上し、F1スコアは4.15%向上した。
本研究は, 草原画像解析における背景除去の重要性を強調し, モデルが前景の植物構造により効果的に焦点を合わせることにより, 分類精度を著しく向上させるものである。
関連論文リスト
- Analysis of Plant Nutrient Deficiencies Using Multi-Spectral Imaging and Optimized Segmentation Model [1.4172975813702]
本研究では,多スペクトルイメージングと拡張YOLOv5モデルを用いた葉の異常セグメンテーションのためのディープラーニングフレームワークを提案する。
このモデルは、9チャンネルのマルチスペクトル入力を処理するために調整されており、微妙で空間的に分散した症状をより正確に捉えるために自己注意機構を使用している。
論文 参考訳(メタデータ) (2025-07-18T15:25:36Z) - ZS-VCOS: Zero-Shot Video Camouflaged Object Segmentation By Optical Flow and Open Vocabulary Object Detection [7.457821910654639]
本研究は,SAM-2やOwl-v2といった大規模事前学習モデルと時間的情報をモジュールパイプラインに統合することにより,トレーニングを回避する方法を研究する。
また,F対策を0.476から0.628に増やした。
論文 参考訳(メタデータ) (2025-04-10T06:24:54Z) - A Lightweight and Extensible Cell Segmentation and Classification Model for Whole Slide Images [0.0]
本稿では,軽量なセルセグメンテーションと分類モデルを作成することにより,データ品質,モデル性能,ユーザビリティを向上させるソリューションを提案する。
そこで,PanNukeとMoNuSACのアノテーションを改良し,異なる7つのセルタイプで統一されたデータセットを生成する。
第3に、基礎モデルの計算要求に対処するため、比較性能を維持しながら、モデルのサイズと複雑さを減らすために知識を蒸留する。
論文 参考訳(メタデータ) (2025-02-26T15:19:52Z) - Dataset Distillation for Histopathology Image Classification [46.04496989951066]
病理画像データセット(Histo-DD)に適した新しいデータセット蒸留アルゴリズムを提案する。
提案アルゴリズムの有効性を総合的に評価し, パッチレベルとスライドレベルの両方の分類タスクにおいて, 組織学的サンプルを生成する。
論文 参考訳(メタデータ) (2024-08-19T05:53:38Z) - Predictive Analytics of Varieties of Potatoes [2.336821989135698]
本研究では, 育種試験におけるサツマイモクローンの選択プロセスの向上を目的とした, 機械学習アルゴリズムの適用について検討する。
本研究は, 高収率, 耐病性, 耐気候性ポテト品種を効率的に同定することの課題に対処する。
論文 参考訳(メタデータ) (2024-04-04T00:49:05Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Sub-token ViT Embedding via Stochastic Resonance Transformers [51.12001699637727]
Vision Transformer (ViT) アーキテクチャは、画像を高次元のベクトル化トークンの集合として表現し、それぞれが長方形の非重複パッチに対応する。
我々は「確率共鳴」にインスパイアされた無訓練法を提案する。
結果として得られるSRT(Stochastic Resonance Transformer)は、元の表現のリッチな意味情報を保持するが、空間的トークン化の粗い効果を軽減し、より微細な空間領域に基盤を置いている。
論文 参考訳(メタデータ) (2023-10-06T01:53:27Z) - Aphid Cluster Recognition and Detection in the Wild Using Deep Learning
Models [17.65292847038642]
アフィドの寄生は作物生産、農村社会、世界の食料安全保障に重大な脅威をもたらす。
本稿では,アフィドクラスタの検出にディープラーニングモデルを用いることに主眼を置いている。
そこで本研究では,アフィドクラスターの検出により感染レベルを推定する手法を提案する。
論文 参考訳(メタデータ) (2023-08-10T23:53:07Z) - A quality assurance framework for real-time monitoring of deep learning
segmentation models in radiotherapy [3.5752677591512487]
この研究は、品質保証フレームワークを確立するために、心臓のサブ構造セグメンテーションを例として用いている。
心電図(CT)画像と241例の心電図を用いたベンチマークデータセットを収集した。
訓練されたDenoising Autoencoder(DAE)と2つの手動特徴を利用して画像領域シフト検出器を開発した。
Dice similarity coefficient (DSC) を用いて患者ごとのセグメンテーション精度を予測するための回帰モデルを構築した。
論文 参考訳(メタデータ) (2023-05-19T14:51:05Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - Comparative analysis of deep learning approaches for AgNOR-stained
cytology samples interpretation [52.77024349608834]
本稿では, 深層学習手法を用いて, 好気性ヌクレオラオーガナイザ領域 (AgNOR) 染色スライダを解析する方法を提案する。
以上の結果から,バックボーンとしてResNet-18やResNet-34を用いたU-Netを用いたセマンティックセマンティックセマンティックセマンティクスは類似した結果を示す。
最も優れたモデルは、それぞれ0.83、0.92、0.99の核、クラスター、衛星のIoUを示す。
論文 参考訳(メタデータ) (2022-10-19T15:15:32Z) - A Comprehensive Study of Image Classification Model Sensitivity to
Foregrounds, Backgrounds, and Visual Attributes [58.633364000258645]
このデータセットをRIVAL10と呼びます。
本研究では,前景,背景,属性の騒音劣化に対する幅広いモデルの感度を評価する。
本稿では,多種多様な最先端アーキテクチャ (ResNets, Transformers) とトレーニング手順 (CLIP, SimCLR, DeiT, Adversarial Training) について考察する。
論文 参考訳(メタデータ) (2022-01-26T06:31:28Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Dense Contrastive Learning for Self-Supervised Visual Pre-Training [102.15325936477362]
入力画像の2つのビュー間の画素レベルでの差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分)を最適化することにより自己教師学習を実現する。
ベースライン法であるMoCo-v2と比較すると,計算オーバーヘッドは1%遅かった。
論文 参考訳(メタデータ) (2020-11-18T08:42:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。