論文の概要: GMT: Guided Mask Transformer for Leaf Instance Segmentation
- arxiv url: http://arxiv.org/abs/2406.17109v1
- Date: Mon, 24 Jun 2024 19:52:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-26 18:21:22.751518
- Title: GMT: Guided Mask Transformer for Leaf Instance Segmentation
- Title(参考訳): GMT:リーフインスタンスセグメンテーション用ガイドマスクトランス
- Authors: Feng Chen, Sotirios A. Tsaftaris, Mario Valerio Giuffrida,
- Abstract要約: 葉のインスタンスセグメンテーション(Leaf instance segmentation)は、植物のイメージ内の各葉の分離とデライン化を目的とした、困難なタスクである。
本稿では,GPE ( Guided Positional Transformer) ,GEFM ( Guided Embedding Fusion Module) ,GDPQ ( Guided Dynamic Positional Queries) の3つの主要コンポーネントを含むGMT ( Guided Mask) を提案する。
提案されたGMTは、3つのパブリックプラントデータセット上で、常にState-of-the-Artモデルを上回っている。
- 参考スコア(独自算出の注目度): 14.458970589296554
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Leaf instance segmentation is a challenging multi-instance segmentation task, aiming to separate and delineate each leaf in an image of a plant. The delineation of each leaf is a necessary prerequisite task for several biology-related applications such as the fine-grained monitoring of plant growth, and crop yield estimation. The task is challenging because self-similarity of instances is high (similar shape and colour) and instances vary greatly in size under heavy occulusion. We believe that the key to overcoming the aforementioned challenges lies in the specific spatial patterns of leaf distribution. For example, leaves typically grow around the plant's center, with smaller leaves clustering and overlapped near this central point. In this paper, we propose a novel approach named Guided Mask Transformer (GMT), which contains three key components, namely Guided Positional Encoding (GPE), Guided Embedding Fusion Module (GEFM) and Guided Dynamic Positional Queries (GDPQ), to extend the meta-architecture of Mask2Former and incorporate with a set of harmonic guide functions. These guide functions are tailored to the pixel positions of instances and trained to separate distinct instances in an embedding space. The proposed GMT consistently outperforms State-of-the-Art models on three public plant datasets.
- Abstract(参考訳): 葉のインスタンスのセグメンテーションは、植物のイメージの中で各葉を分離・デライン化することを目的とした、難易度の高いマルチインスタンスセグメンテーションタスクである。
植物生育のきめ細かいモニタリングや収量推定など、生物学関連のいくつかの応用において、葉のデライン化は必須の課題である。
この作業は、インスタンスの自己相似性が高い(類似した形状と色)ことと、重度咬合下でのインスタンスの大きさが大きく異なるため、困難である。
上記の課題を克服する鍵は、葉の分布の空間的パターンにあると我々は信じている。
例えば、葉は通常、植物の中心の周りに成長し、小さな葉が群がり、この中心付近で重なり合う。
本稿では,GPE,GEFM,GDPQの3つの主要コンポーネントを含むGMTと呼ばれる新しい手法を提案し,Mask2Formerのメタアーキテクチャを拡張し,調和ガイド関数を組み込む。
これらのガイド関数は、インスタンスのピクセル位置に合わせて調整され、埋め込み空間内の別々のインスタンスを分離するように訓練される。
提案されたGMTは、3つのパブリックプラントデータセット上で、常にState-of-the-Artモデルを上回っている。
関連論文リスト
- Comprehensive Generative Replay for Task-Incremental Segmentation with Concurrent Appearance and Semantic Forgetting [49.87694319431288]
一般的なセグメンテーションモデルは、異なる画像ソースからの様々なオブジェクトを含む様々なタスクに対して、ますます好まれている。
画像とマスクのペアを合成することで外観と意味の知識を復元する包括的生成(CGR)フレームワークを提案する。
漸進的タスク(心身、基礎、前立腺のセグメンテーション)の実験は、同時出現と意味的忘れを緩和する上で、明らかな優位性を示している。
論文 参考訳(メタデータ) (2024-06-28T10:05:58Z) - Unsupervised Pre-Training for 3D Leaf Instance Segmentation [34.122575664767915]
本稿では,3次元点雲上でのリーフインスタンスセグメンテーションの実行に必要なラベル付けの労力を削減する問題に対処する。
本稿では,ネットワークのバックボーンを初期化するための,自己教師型タスク固有の事前学習手法を提案する。
また,茎近傍の点を正確に区分けすることの難しさを考慮した新しい自動後処理も導入した。
論文 参考訳(メタデータ) (2024-01-16T08:11:08Z) - ComPtr: Towards Diverse Bi-source Dense Prediction Tasks via A Simple
yet General Complementary Transformer [91.43066633305662]
本稿では,多種多様な二ソース密度予測タスクのためのアンダーラインComPlementaryアンダーライン変換器textbfComPtrを提案する。
ComPtrは異なる入力を等しく扱い、変換器上にシーケンス・ツー・シーケンスの形で効率的な密な相互作用モデルを構築する。
論文 参考訳(メタデータ) (2023-07-23T15:17:45Z) - Position-Guided Point Cloud Panoptic Segmentation Transformer [118.17651196656178]
この作業は、LiDARベースのポイントクラウドセグメンテーションにこの魅力的なパラダイムを適用し、シンプルだが効果的なベースラインを得ることから始まります。
スパース点雲のインスタンスはシーン全体に対して比較的小さく、しばしば類似した形状を持つが、画像領域では珍しいセグメンテーションの外観が欠如している。
position-guided Point cloud Panoptic segmentation transFormer (P3Former) と名付けられたこの手法は、Semantic KITTI と nuScenes のベンチマークでそれぞれ3.4%、そして 1.2%の性能をそれぞれ上回っている。
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - Hierarchical Approach for Joint Semantic, Plant Instance, and Leaf
Instance Segmentation in the Agricultural Domain [29.647846446064992]
植物表現型は、植物の成長段階、発達、その他の関連する量を記述するため、農業において中心的な課題である。
本稿では,RGBデータから作物の連接意味,植物インスタンス,葉のインスタンスセグメンテーションの問題に対処する。
本稿では,3つのタスクを同時に処理する単一畳み込みニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-14T15:01:08Z) - MulT: An End-to-End Multitask Learning Transformer [66.52419626048115]
我々はMulTと呼ばれるエンドツーエンドのマルチタスク学習トランスフォーマフレームワークを提案し、複数のハイレベル視覚タスクを同時に学習する。
本フレームワークは,入力画像を共有表現にエンコードし,タスク固有のトランスフォーマーベースのデコーダヘッドを用いて各視覚タスクの予測を行う。
論文 参考訳(メタデータ) (2022-05-17T13:03:18Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - LeafMask: Towards Greater Accuracy on Leaf Segmentation [1.0499611180329804]
LeafMaskは、各葉領域をデライン化し、葉の数をカウントする、新しいエンドツーエンドモデルである。
提案モデルでは,90.09%のBestDiceスコアが得られ,他の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-08T04:57:18Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - RDCNet: Instance segmentation with a minimalist recurrent residual
network [0.14999444543328289]
我々は、リカレント拡張畳み込みネットワーク(RDCNet)と呼ばれる最小限のリカレントネットワークを提案する。
RDCNetは、その出力を反復的に洗練し、解釈可能な中間予測を生成する共有スタック拡張畳み込み(sSDC)層で構成されている。
我々は,H&Eスライドの核セグメンテーション,光シート蛍光顕微鏡による3次元異方性スタック,およびトップビュー画像の葉セグメンテーションの3つのタスクに対して,その汎用性を実証した。
論文 参考訳(メタデータ) (2020-10-02T13:36:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。