論文の概要: Zero-shot Hierarchical Plant Segmentation via Foundation Segmentation Models and Text-to-image Attention
- arxiv url: http://arxiv.org/abs/2509.09116v1
- Date: Thu, 11 Sep 2025 02:53:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-12 16:52:24.210451
- Title: Zero-shot Hierarchical Plant Segmentation via Foundation Segmentation Models and Text-to-image Attention
- Title(参考訳): ファウンデーションセグメンテーションモデルとテキスト・ツー・イメージアテンションによるゼロショット階層型植物セグメンテーション
- Authors: Junhao Xing, Ryohei Miyakawa, Yang Yang, Xinpeng Liu, Risa Shinoda, Hiroaki Santo, Yosuke Toda, Fumio Okura,
- Abstract要約: 基礎セグメンテーションモデルは、訓練なしでトップビューの作物画像から合理的なリーフインスタンス抽出を実現する。
トップビュー画像からロゼット型植物個体に対するゼロショットセグメンテーションであるZeroPlantSegを紹介する。
- 参考スコア(独自算出の注目度): 19.2882360692347
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foundation segmentation models achieve reasonable leaf instance extraction from top-view crop images without training (i.e., zero-shot). However, segmenting entire plant individuals with each consisting of multiple overlapping leaves remains challenging. This problem is referred to as a hierarchical segmentation task, typically requiring annotated training datasets, which are often species-specific and require notable human labor. To address this, we introduce ZeroPlantSeg, a zero-shot segmentation for rosette-shaped plant individuals from top-view images. We integrate a foundation segmentation model, extracting leaf instances, and a vision-language model, reasoning about plants' structures to extract plant individuals without additional training. Evaluations on datasets with multiple plant species, growth stages, and shooting environments demonstrate that our method surpasses existing zero-shot methods and achieves better cross-domain performance than supervised methods. Implementations are available at https://github.com/JunhaoXing/ZeroPlantSeg.
- Abstract(参考訳): 基礎セグメンテーションモデルは、訓練(ゼロショット)なしでトップビューの作物画像から合理的なリーフインスタンス抽出を実現する。
しかし、植物全体を複数の重なり合う葉で区分けすることは依然として困難である。
この問題は階層的セグメンテーション(hierarchical segmentation)タスクと呼ばれ、通常は注釈付きトレーニングデータセットを必要とする。
これを解決するために、トップビュー画像からロゼット型植物個体のゼロショットセグメンテーションであるZeroPlantSegを導入する。
本研究は,植物体の構造を考慮に入れた基礎区分モデルと葉の事例抽出モデル,および視覚言語モデルを統合し,追加の訓練をせずに植物個体を抽出する。
複数の植物種, 成長段階, シューティング環境のデータセットによる評価から, 本手法は既存のゼロショット法を超越し, 教師付き手法よりもドメイン間性能が向上することが示された。
実装はhttps://github.com/JunhaoXing/ZeroPlantSegで公開されている。
関連論文リスト
- UnSeg: One Universal Unlearnable Example Generator is Enough against All Image Segmentation [64.01742988773745]
未承認のプライベートデータ上での大規模なイメージセグメンテーションモデルのトレーニングに関して、プライバシーに関する懸念が高まっている。
我々は、学習不可能な例の概念を利用して、学習不可能なノイズを原画像に生成し、付加することにより、モデルトレーニングに使用不能な画像を作成する。
6つのメインストリームイメージセグメンテーションタスク、10つの広く使われているデータセット、7つの異なるネットワークアーキテクチャでUnSegの有効性を実証的に検証する。
論文 参考訳(メタデータ) (2024-10-13T16:34:46Z) - GMT: Guided Mask Transformer for Leaf Instance Segmentation [14.458970589296554]
葉のインスタンスセグメンテーション(Leaf instance segmentation)は、植物のイメージ内の各葉の分離とデライン化を目的とした、困難なタスクである。
本稿では,葉の空間分布をトランスフォーマーベースのセグメンタに利用し,統合するガイドマスクトランス (GMT) を提案する。
我々のGMTは、3つの公開植物データセットの最先端を一貫して上回ります。
論文 参考訳(メタデータ) (2024-06-24T19:52:27Z) - Diffusion-based Data Augmentation for Nuclei Image Segmentation [68.28350341833526]
核セグメンテーションのための拡散法を初めて導入する。
このアイデアは、多数のラベル付き画像を合成し、セグメンテーションモデルを訓練することを目的としている。
実験の結果,10%のラベル付き実データセットを合成サンプルで拡張することにより,同等のセグメンテーション結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-10-22T06:16:16Z) - Improving Data Efficiency for Plant Cover Prediction with Label
Interpolation and Monte-Carlo Cropping [7.993547048820065]
植物群落の組成は環境変化の重要な指標であり、通常生態学的研究で分析される。
本稿では,収集した植生計画時系列のスパースラベルを中間密度・未ラベル画像に補間する手法を提案する。
また,高解像度画像の処理を効率的に行うため,モンテカルロ・クロッピングと呼ばれる新しい手法を導入する。
論文 参考訳(メタデータ) (2023-07-17T15:17:39Z) - Self-Supervised Leaf Segmentation under Complex Lighting Conditions [14.290827361756108]
葉のセグメンテーションはイメージベース植物表現において必須の前提条件である。
本稿では,自己教師付きセマンティックセマンティックセマンティクスモデル,色に基づくリーフセマンティクスアルゴリズム,および自己教師型色補正モデルからなる自己教師型リーフセマンティクスフレームワークを提案する。
異なる植物種のデータセットに対する実験結果は、提案された自己管理フレームワークの可能性を示している。
論文 参考訳(メタデータ) (2022-03-29T22:59:02Z) - SCNet: Enhancing Few-Shot Semantic Segmentation by Self-Contrastive
Background Prototypes [56.387647750094466]
Few-shot セマンティックセマンティックセマンティクスは,クエリイメージ内の新規クラスオブジェクトを,アノテーション付きの例で分割することを目的としている。
先進的なソリューションのほとんどは、各ピクセルを学習した前景のプロトタイプに合わせることでセグメンテーションを行うメトリクス学習フレームワークを利用している。
このフレームワークは、前景プロトタイプのみとのサンプルペアの不完全な構築のために偏った分類に苦しんでいます。
論文 参考訳(メタデータ) (2021-04-19T11:21:47Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Unsupervised Domain Adaptation For Plant Organ Counting [12.424350934766704]
イメージベース植物表現型解析のための植物器官の計数はこのカテゴリに該当する。
本稿では,密度マップ推定の領域適応のための領域適応型学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-02T13:57:09Z) - Two-View Fine-grained Classification of Plant Species [66.75915278733197]
本研究では,2視点の葉のイメージ表現に基づく新しい手法と,植物種の粒度認識のための階層的分類戦略を提案する。
シームズ畳み込みニューラルネットワークに基づく深度測定は、多数のトレーニングサンプルへの依存を減らし、新しい植物種に拡張性を持たせるために用いられる。
論文 参考訳(メタデータ) (2020-05-18T21:57:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。