論文の概要: GMT: Guided Mask Transformer for Leaf Instance Segmentation
- arxiv url: http://arxiv.org/abs/2406.17109v2
- Date: Wed, 11 Sep 2024 14:32:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-12 20:48:06.456220
- Title: GMT: Guided Mask Transformer for Leaf Instance Segmentation
- Title(参考訳): GMT:リーフインスタンスセグメンテーション用ガイドマスクトランス
- Authors: Feng Chen, Sotirios A. Tsaftaris, Mario Valerio Giuffrida,
- Abstract要約: 葉のインスタンスセグメンテーション(Leaf instance segmentation)は、植物のイメージ内の各葉の分離とデライン化を目的とした、困難なタスクである。
本稿では,葉の空間分布をトランスフォーマーベースのセグメンタに利用し,統合するガイドマスクトランス (GMT) を提案する。
我々のGMTは、3つの公開植物データセットの最先端を一貫して上回ります。
- 参考スコア(独自算出の注目度): 14.458970589296554
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Leaf instance segmentation is a challenging multi-instance segmentation task, aiming to separate and delineate each leaf in an image of a plant. Accurate segmentation of each leaf is crucial for plant-related applications such as the fine-grained monitoring of plant growth and crop yield estimation. This task is challenging because of the high similarity (in shape and colour), great size variation, and heavy occlusions among leaf instances. Furthermore, the typically small size of annotated leaf datasets makes it more difficult to learn the distinctive features needed for precise segmentation. We hypothesise that the key to overcoming the these challenges lies in the specific spatial patterns of leaf distribution. In this paper, we propose the Guided Mask Transformer (GMT), which leverages and integrates leaf spatial distribution priors into a Transformer-based segmentor. These spatial priors are embedded in a set of guide functions that map leaves at different positions into a more separable embedding space. Our GMT consistently outperforms the state-of-the-art on three public plant datasets.
- Abstract(参考訳): 葉のインスタンスのセグメンテーションは、植物のイメージの中で各葉を分離・デライン化することを目的とした、難易度の高いマルチインスタンスセグメンテーションタスクである。
各葉の正確なセグメンテーションは、植物の成長のきめ細かいモニタリングや収量推定など、植物関連の応用に不可欠である。
この作業は、(形や色において)高い類似性、大きな大きさのバリエーション、葉のインスタンス間の重く閉塞性のために困難である。
さらに、通常、注釈付き葉のデータセットの小さなサイズは、正確なセグメンテーションに必要な特徴を学ぶのを難しくする。
これらの課題を克服する鍵は、葉の分布の特定の空間パターンにあると仮定する。
本稿では,葉の空間分布をトランスフォーマーベースのセグメンタに利用し,統合するガイドマスク変換器(GMT)を提案する。
これらの空間先行は、異なる位置にある葉をより分離可能な埋め込み空間にマッピングする一連のガイド関数に埋め込まれる。
我々のGMTは、3つの公開植物データセットの最先端を一貫して上回ります。
関連論文リスト
- Comprehensive Generative Replay for Task-Incremental Segmentation with Concurrent Appearance and Semantic Forgetting [49.87694319431288]
一般的なセグメンテーションモデルは、異なる画像ソースからの様々なオブジェクトを含む様々なタスクに対して、ますます好まれている。
画像とマスクのペアを合成することで外観と意味の知識を復元する包括的生成(CGR)フレームワークを提案する。
漸進的タスク(心身、基礎、前立腺のセグメンテーション)の実験は、同時出現と意味的忘れを緩和する上で、明らかな優位性を示している。
論文 参考訳(メタデータ) (2024-06-28T10:05:58Z) - Unsupervised Pre-Training for 3D Leaf Instance Segmentation [34.122575664767915]
本稿では,3次元点雲上でのリーフインスタンスセグメンテーションの実行に必要なラベル付けの労力を削減する問題に対処する。
本稿では,ネットワークのバックボーンを初期化するための,自己教師型タスク固有の事前学習手法を提案する。
また,茎近傍の点を正確に区分けすることの難しさを考慮した新しい自動後処理も導入した。
論文 参考訳(メタデータ) (2024-01-16T08:11:08Z) - ComPtr: Towards Diverse Bi-source Dense Prediction Tasks via A Simple
yet General Complementary Transformer [91.43066633305662]
本稿では,多種多様な二ソース密度予測タスクのためのアンダーラインComPlementaryアンダーライン変換器textbfComPtrを提案する。
ComPtrは異なる入力を等しく扱い、変換器上にシーケンス・ツー・シーケンスの形で効率的な密な相互作用モデルを構築する。
論文 参考訳(メタデータ) (2023-07-23T15:17:45Z) - Position-Guided Point Cloud Panoptic Segmentation Transformer [118.17651196656178]
この作業は、LiDARベースのポイントクラウドセグメンテーションにこの魅力的なパラダイムを適用し、シンプルだが効果的なベースラインを得ることから始まります。
スパース点雲のインスタンスはシーン全体に対して比較的小さく、しばしば類似した形状を持つが、画像領域では珍しいセグメンテーションの外観が欠如している。
position-guided Point cloud Panoptic segmentation transFormer (P3Former) と名付けられたこの手法は、Semantic KITTI と nuScenes のベンチマークでそれぞれ3.4%、そして 1.2%の性能をそれぞれ上回っている。
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - Hierarchical Approach for Joint Semantic, Plant Instance, and Leaf
Instance Segmentation in the Agricultural Domain [29.647846446064992]
植物表現型は、植物の成長段階、発達、その他の関連する量を記述するため、農業において中心的な課題である。
本稿では,RGBデータから作物の連接意味,植物インスタンス,葉のインスタンスセグメンテーションの問題に対処する。
本稿では,3つのタスクを同時に処理する単一畳み込みニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-14T15:01:08Z) - MulT: An End-to-End Multitask Learning Transformer [66.52419626048115]
我々はMulTと呼ばれるエンドツーエンドのマルチタスク学習トランスフォーマフレームワークを提案し、複数のハイレベル視覚タスクを同時に学習する。
本フレームワークは,入力画像を共有表現にエンコードし,タスク固有のトランスフォーマーベースのデコーダヘッドを用いて各視覚タスクの予測を行う。
論文 参考訳(メタデータ) (2022-05-17T13:03:18Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - LeafMask: Towards Greater Accuracy on Leaf Segmentation [1.0499611180329804]
LeafMaskは、各葉領域をデライン化し、葉の数をカウントする、新しいエンドツーエンドモデルである。
提案モデルでは,90.09%のBestDiceスコアが得られ,他の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-08T04:57:18Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - RDCNet: Instance segmentation with a minimalist recurrent residual
network [0.14999444543328289]
我々は、リカレント拡張畳み込みネットワーク(RDCNet)と呼ばれる最小限のリカレントネットワークを提案する。
RDCNetは、その出力を反復的に洗練し、解釈可能な中間予測を生成する共有スタック拡張畳み込み(sSDC)層で構成されている。
我々は,H&Eスライドの核セグメンテーション,光シート蛍光顕微鏡による3次元異方性スタック,およびトップビュー画像の葉セグメンテーションの3つのタスクに対して,その汎用性を実証した。
論文 参考訳(メタデータ) (2020-10-02T13:36:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。