Fugu-MT 論文翻訳(概要): GMT: Guided Mask Transformer for Leaf Instance Segmentation

論文の概要: GMT: Guided Mask Transformer for Leaf Instance Segmentation

arxiv url: http://arxiv.org/abs/2406.17109v1
Date: Mon, 24 Jun 2024 19:52:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-26 18:21:22.751518
Title: GMT: Guided Mask Transformer for Leaf Instance Segmentation
Title（参考訳）: GMT:リーフインスタンスセグメンテーション用ガイドマスクトランス
Authors: Feng Chen, Sotirios A. Tsaftaris, Mario Valerio Giuffrida,
Abstract要約: 葉のインスタンスセグメンテーション(Leaf instance segmentation)は、植物のイメージ内の各葉の分離とデライン化を目的とした、困難なタスクである。本稿では,GPE ( Guided Positional Transformer) ,GEFM ( Guided Embedding Fusion Module) ,GDPQ ( Guided Dynamic Positional Queries) の3つの主要コンポーネントを含むGMT ( Guided Mask) を提案する。提案されたGMTは、3つのパブリックプラントデータセット上で、常にState-of-the-Artモデルを上回っている。
参考スコア（独自算出の注目度）: 14.458970589296554
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Leaf instance segmentation is a challenging multi-instance segmentation task, aiming to separate and delineate each leaf in an image of a plant. The delineation of each leaf is a necessary prerequisite task for several biology-related applications such as the fine-grained monitoring of plant growth, and crop yield estimation. The task is challenging because self-similarity of instances is high (similar shape and colour) and instances vary greatly in size under heavy occulusion. We believe that the key to overcoming the aforementioned challenges lies in the specific spatial patterns of leaf distribution. For example, leaves typically grow around the plant's center, with smaller leaves clustering and overlapped near this central point. In this paper, we propose a novel approach named Guided Mask Transformer (GMT), which contains three key components, namely Guided Positional Encoding (GPE), Guided Embedding Fusion Module (GEFM) and Guided Dynamic Positional Queries (GDPQ), to extend the meta-architecture of Mask2Former and incorporate with a set of harmonic guide functions. These guide functions are tailored to the pixel positions of instances and trained to separate distinct instances in an embedding space. The proposed GMT consistently outperforms State-of-the-Art models on three public plant datasets.
Abstract（参考訳）: 葉のインスタンスのセグメンテーションは、植物のイメージの中で各葉を分離・デライン化することを目的とした、難易度の高いマルチインスタンスセグメンテーションタスクである。植物生育のきめ細かいモニタリングや収量推定など、生物学関連のいくつかの応用において、葉のデライン化は必須の課題である。この作業は、インスタンスの自己相似性が高い(類似した形状と色)ことと、重度咬合下でのインスタンスの大きさが大きく異なるため、困難である。上記の課題を克服する鍵は、葉の分布の空間的パターンにあると我々は信じている。例えば、葉は通常、植物の中心の周りに成長し、小さな葉が群がり、この中心付近で重なり合う。本稿では,GPE,GEFM,GDPQの3つの主要コンポーネントを含むGMTと呼ばれる新しい手法を提案し,Mask2Formerのメタアーキテクチャを拡張し,調和ガイド関数を組み込む。これらのガイド関数は、インスタンスのピクセル位置に合わせて調整され、埋め込み空間内の別々のインスタンスを分離するように訓練される。提案されたGMTは、3つのパブリックプラントデータセット上で、常にState-of-the-Artモデルを上回っている。

関連論文リスト

Comprehensive Generative Replay for Task-Incremental Segmentation with Concurrent Appearance and Semantic Forgetting [49.87694319431288]
一般的なセグメンテーションモデルは、異なる画像ソースからの様々なオブジェクトを含む様々なタスクに対して、ますます好まれている。画像とマスクのペアを合成することで外観と意味の知識を復元する包括的生成(CGR)フレームワークを提案する。漸進的タスク(心身、基礎、前立腺のセグメンテーション)の実験は、同時出現と意味的忘れを緩和する上で、明らかな優位性を示している。
論文参考訳（メタデータ） (2024-06-28T10:05:58Z)
Leveraging 2D Information for Long-term Time Series Forecasting with Vanilla Transformers [55.475142494272724]
時系列予測は、様々な領域における複雑な力学の理解と予測に不可欠である。 GridTSTは、革新的な多方向性の注意を用いた2つのアプローチの利点を組み合わせたモデルである。このモデルは、さまざまな現実世界のデータセットに対して、常に最先端のパフォーマンスを提供する。
論文参考訳（メタデータ） (2024-05-22T16:41:21Z)
Unsupervised Pre-Training for 3D Leaf Instance Segmentation [34.122575664767915]
本稿では,3次元点雲上でのリーフインスタンスセグメンテーションの実行に必要なラベル付けの労力を削減する問題に対処する。本稿では,ネットワークのバックボーンを初期化するための,自己教師型タスク固有の事前学習手法を提案する。また,茎近傍の点を正確に区分けすることの難しさを考慮した新しい自動後処理も導入した。
論文参考訳（メタデータ） (2024-01-16T08:11:08Z)
HGFormer: Hierarchical Grouping Transformer for Domain Generalized Semantic Segmentation [113.6560373226501]
本研究は領域一般化設定の下で意味的セグメンテーションを研究する。本稿では,階層型グループ化変換器(HGFormer)を提案する。実験により、HGFormerはピクセルごとの分類法やフラットグルーピング変換器よりも、より堅牢なセマンティックセグメンテーション結果が得られることが示された。
論文参考訳（メタデータ） (2023-05-22T13:33:41Z)
Hierarchical Approach for Joint Semantic, Plant Instance, and Leaf Instance Segmentation in the Agricultural Domain [29.647846446064992]
植物表現型は、植物の成長段階、発達、その他の関連する量を記述するため、農業において中心的な課題である。本稿では,RGBデータから作物の連接意味,植物インスタンス,葉のインスタンスセグメンテーションの問題に対処する。本稿では,3つのタスクを同時に処理する単一畳み込みニューラルネットワークを提案する。
論文参考訳（メタデータ） (2022-10-14T15:01:08Z)
Statistical shape representations for temporal registration of plant components in 3D [5.349852254138086]
形状特徴を用いることで側頭器官のマッチングが向上することを示す。これは、ライフサイクル全体のフェノタイピングを可能にするロボット作物監視に不可欠である。
論文参考訳（メタデータ） (2022-09-23T11:11:10Z)
CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文参考訳（メタデータ） (2022-07-31T21:39:15Z)
MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。 MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文参考訳（メタデータ） (2022-06-02T07:38:53Z)
GrowliFlower: An image time series dataset for GROWth analysis of cauLIFLOWER [2.8247971782279615]
この記事では、2020年と2021年に取得した0.39と0.60haの2つの監視されたカリフラワーフィールドのイメージベースUAV時系列データセットであるGrowliFlowerについて述べる。このデータセットは、約14,000個の植物座標が導出され提供されるRGBおよび多スペクトル正光を含む。このデータセットは、発生段階、植物、カリフラワーサイズを含む740種の植物の表現型形質を収集する。
論文参考訳（メタデータ） (2022-04-01T08:56:59Z)
Grasp-Oriented Fine-grained Cloth Segmentation without Real Supervision [66.56535902642085]
本稿では, 深度画像のみを用いて, 変形した衣服のきめ細かい領域検出の問題に取り組む。最大で6つの意味領域を定義し, 首の縁, スリーブカフ, ヘム, 上と下をつかむ点を含む。これらの部品のセグメント化とラベル付けを行うために,U-net ベースのネットワークを導入する。合成データのみを用いてネットワークをトレーニングし、提案したDAが実データでトレーニングしたモデルと競合する結果が得られることを示す。
論文参考訳（メタデータ） (2021-10-06T16:31:20Z)
Semantic Attention and Scale Complementary Network for Instance Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。 SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。 SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文参考訳（メタデータ） (2021-07-25T08:53:59Z)
CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文参考訳（メタデータ） (2021-03-04T13:34:22Z)
Unsupervised Domain Adaptation For Plant Organ Counting [12.424350934766704]
イメージベース植物表現型解析のための植物器官の計数はこのカテゴリに該当する。本稿では,密度マップ推定の領域適応のための領域適応型学習手法を提案する。
論文参考訳（メタデータ） (2020-09-02T13:57:09Z)
Spatial Pyramid Based Graph Reasoning for Semantic Segmentation [67.47159595239798]
セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2020-03-23T12:28:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。