Fugu-MT 論文翻訳(概要): GMT: Guided Mask Transformer for Leaf Instance Segmentation

論文の概要: GMT: Guided Mask Transformer for Leaf Instance Segmentation

arxiv url: http://arxiv.org/abs/2406.17109v2
Date: Wed, 11 Sep 2024 14:32:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-12 20:48:06.456220
Title: GMT: Guided Mask Transformer for Leaf Instance Segmentation
Title（参考訳）: GMT:リーフインスタンスセグメンテーション用ガイドマスクトランス
Authors: Feng Chen, Sotirios A. Tsaftaris, Mario Valerio Giuffrida,
Abstract要約: 葉のインスタンスセグメンテーション(Leaf instance segmentation)は、植物のイメージ内の各葉の分離とデライン化を目的とした、困難なタスクである。本稿では,葉の空間分布をトランスフォーマーベースのセグメンタに利用し,統合するガイドマスクトランス (GMT) を提案する。我々のGMTは、3つの公開植物データセットの最先端を一貫して上回ります。
参考スコア（独自算出の注目度）: 14.458970589296554
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Leaf instance segmentation is a challenging multi-instance segmentation task, aiming to separate and delineate each leaf in an image of a plant. Accurate segmentation of each leaf is crucial for plant-related applications such as the fine-grained monitoring of plant growth and crop yield estimation. This task is challenging because of the high similarity (in shape and colour), great size variation, and heavy occlusions among leaf instances. Furthermore, the typically small size of annotated leaf datasets makes it more difficult to learn the distinctive features needed for precise segmentation. We hypothesise that the key to overcoming the these challenges lies in the specific spatial patterns of leaf distribution. In this paper, we propose the Guided Mask Transformer (GMT), which leverages and integrates leaf spatial distribution priors into a Transformer-based segmentor. These spatial priors are embedded in a set of guide functions that map leaves at different positions into a more separable embedding space. Our GMT consistently outperforms the state-of-the-art on three public plant datasets.
Abstract（参考訳）: 葉のインスタンスのセグメンテーションは、植物のイメージの中で各葉を分離・デライン化することを目的とした、難易度の高いマルチインスタンスセグメンテーションタスクである。各葉の正確なセグメンテーションは、植物の成長のきめ細かいモニタリングや収量推定など、植物関連の応用に不可欠である。この作業は、(形や色において)高い類似性、大きな大きさのバリエーション、葉のインスタンス間の重く閉塞性のために困難である。さらに、通常、注釈付き葉のデータセットの小さなサイズは、正確なセグメンテーションに必要な特徴を学ぶのを難しくする。これらの課題を克服する鍵は、葉の分布の特定の空間パターンにあると仮定する。本稿では,葉の空間分布をトランスフォーマーベースのセグメンタに利用し,統合するガイドマスク変換器(GMT)を提案する。これらの空間先行は、異なる位置にある葉をより分離可能な埋め込み空間にマッピングする一連のガイド関数に埋め込まれる。我々のGMTは、3つの公開植物データセットの最先端を一貫して上回ります。

関連論文リスト

LeafInst - Unified Instance Segmentation Network for Fine-Grained Forestry Leaf Phenotype Analysis: A New UAV based Benchmark [10.61947524568352]
リーフインスト(LeafInst)は、不規則で多スケールな葉の構造に適した新しいセグメンテーションフレームワークである。 68.4 mAPを達成し、YOLOv11を7.1%、MaskDinoを6.5%上回っている。
論文参考訳（メタデータ） (2026-03-04T01:01:57Z)
Zero-shot Hierarchical Plant Segmentation via Foundation Segmentation Models and Text-to-image Attention [19.2882360692347]
基礎セグメンテーションモデルは、訓練なしでトップビューの作物画像から合理的なリーフインスタンス抽出を実現する。トップビュー画像からロゼット型植物個体に対するゼロショットセグメンテーションであるZeroPlantSegを紹介する。
論文参考訳（メタデータ） (2025-09-11T02:53:58Z)
Comprehensive Generative Replay for Task-Incremental Segmentation with Concurrent Appearance and Semantic Forgetting [49.87694319431288]
一般的なセグメンテーションモデルは、異なる画像ソースからの様々なオブジェクトを含む様々なタスクに対して、ますます好まれている。画像とマスクのペアを合成することで外観と意味の知識を復元する包括的生成(CGR)フレームワークを提案する。漸進的タスク(心身、基礎、前立腺のセグメンテーション)の実験は、同時出現と意味的忘れを緩和する上で、明らかな優位性を示している。
論文参考訳（メタデータ） (2024-06-28T10:05:58Z)
Leveraging 2D Information for Long-term Time Series Forecasting with Vanilla Transformers [55.475142494272724]
時系列予測は、様々な領域における複雑な力学の理解と予測に不可欠である。 GridTSTは、革新的な多方向性の注意を用いた2つのアプローチの利点を組み合わせたモデルである。このモデルは、さまざまな現実世界のデータセットに対して、常に最先端のパフォーマンスを提供する。
論文参考訳（メタデータ） (2024-05-22T16:41:21Z)
Unsupervised Pre-Training for 3D Leaf Instance Segmentation [34.122575664767915]
本稿では,3次元点雲上でのリーフインスタンスセグメンテーションの実行に必要なラベル付けの労力を削減する問題に対処する。本稿では,ネットワークのバックボーンを初期化するための,自己教師型タスク固有の事前学習手法を提案する。また,茎近傍の点を正確に区分けすることの難しさを考慮した新しい自動後処理も導入した。
論文参考訳（メタデータ） (2024-01-16T08:11:08Z)
HGFormer: Hierarchical Grouping Transformer for Domain Generalized Semantic Segmentation [113.6560373226501]
本研究は領域一般化設定の下で意味的セグメンテーションを研究する。本稿では,階層型グループ化変換器(HGFormer)を提案する。実験により、HGFormerはピクセルごとの分類法やフラットグルーピング変換器よりも、より堅牢なセマンティックセグメンテーション結果が得られることが示された。
論文参考訳（メタデータ） (2023-05-22T13:33:41Z)
Hierarchical Approach for Joint Semantic, Plant Instance, and Leaf Instance Segmentation in the Agricultural Domain [29.647846446064992]
植物表現型は、植物の成長段階、発達、その他の関連する量を記述するため、農業において中心的な課題である。本稿では,RGBデータから作物の連接意味,植物インスタンス,葉のインスタンスセグメンテーションの問題に対処する。本稿では,3つのタスクを同時に処理する単一畳み込みニューラルネットワークを提案する。
論文参考訳（メタデータ） (2022-10-14T15:01:08Z)
Statistical shape representations for temporal registration of plant components in 3D [5.349852254138086]
形状特徴を用いることで側頭器官のマッチングが向上することを示す。これは、ライフサイクル全体のフェノタイピングを可能にするロボット作物監視に不可欠である。
論文参考訳（メタデータ） (2022-09-23T11:11:10Z)
CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文参考訳（メタデータ） (2022-07-31T21:39:15Z)
MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。 MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文参考訳（メタデータ） (2022-06-02T07:38:53Z)
GrowliFlower: An image time series dataset for GROWth analysis of cauLIFLOWER [2.8247971782279615]
この記事では、2020年と2021年に取得した0.39と0.60haの2つの監視されたカリフラワーフィールドのイメージベースUAV時系列データセットであるGrowliFlowerについて述べる。このデータセットは、約14,000個の植物座標が導出され提供されるRGBおよび多スペクトル正光を含む。このデータセットは、発生段階、植物、カリフラワーサイズを含む740種の植物の表現型形質を収集する。
論文参考訳（メタデータ） (2022-04-01T08:56:59Z)
Grasp-Oriented Fine-grained Cloth Segmentation without Real Supervision [66.56535902642085]
本稿では, 深度画像のみを用いて, 変形した衣服のきめ細かい領域検出の問題に取り組む。最大で6つの意味領域を定義し, 首の縁, スリーブカフ, ヘム, 上と下をつかむ点を含む。これらの部品のセグメント化とラベル付けを行うために,U-net ベースのネットワークを導入する。合成データのみを用いてネットワークをトレーニングし、提案したDAが実データでトレーニングしたモデルと競合する結果が得られることを示す。
論文参考訳（メタデータ） (2021-10-06T16:31:20Z)
Semantic Attention and Scale Complementary Network for Instance Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。 SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。 SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文参考訳（メタデータ） (2021-07-25T08:53:59Z)
CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文参考訳（メタデータ） (2021-03-04T13:34:22Z)
Unsupervised Domain Adaptation For Plant Organ Counting [12.424350934766704]
イメージベース植物表現型解析のための植物器官の計数はこのカテゴリに該当する。本稿では,密度マップ推定の領域適応のための領域適応型学習手法を提案する。
論文参考訳（メタデータ） (2020-09-02T13:57:09Z)
Spatial Pyramid Based Graph Reasoning for Semantic Segmentation [67.47159595239798]
セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2020-03-23T12:28:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。