論文の概要: SegmentAnyTreeV2: Scaling Transformer-Based Tree Instance Segmentation Across Sensors, Platforms, and Forests
- arxiv url: http://arxiv.org/abs/2606.08206v1
- Date: Sat, 06 Jun 2026 14:48:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.972186
- Title: SegmentAnyTreeV2: Scaling Transformer-Based Tree Instance Segmentation Across Sensors, Platforms, and Forests
- Title(参考訳): SegmentAnyTreeV2: センサ、プラットフォーム、フォレスト間のトランスフォーマーベースツリーインスタンスセグメンテーションのスケーリング
- Authors: Maciej Wielgosz, Stefano Puliti, Rasmus Astrup,
- Abstract要約: SegmentAnyTreeV2は、センサとプラットフォームに依存しない、フォレストポイントクラウドのセグメンテーションとインスタンスセグメンテーションのためのフレームワークである。
FOR-instanceV2テスト分割では、SegmentAnyTreeV2は90.5%の精度、80.2%のリコール、85.0%のF1、90.7%のカバレッジ、87.6%のセマンティックmIoUを達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present SegmentAnyTreeV2, a sensor- and platform-agnostic framework for semantic and instance segmentation of forest point clouds. The model combines a serialization-based Point Transformer v3 backbone with a lightweight semantic head and a tree-focused cross-attention mask decoder. Semantic predictions restrict instance decoding to tree-class voxels, while instance-aware query initialization, one-to-many seed supervision, and asymmetric mask scoring improve separation in dense and structurally complex stands. We further introduce FOR-instance v3, an expanded benchmark comprising 427 scenes and 26,496 annotated trees across diverse biomes, forest structures, and LiDAR platforms. On the FOR-instanceV2 test split, SegmentAnyTreeV2 achieves 90.5% precision, 80.2% recall, 85.0% F1, 90.7% coverage, and 87.6% semantic mIoU, outperforming previous learning-based methods in both instance detection and mask completeness. Zero-shot evaluation on independent sites further demonstrates strong cross-domain generalization.
- Abstract(参考訳): 森林点雲のセマンティックスとインスタンスセグメンテーションのためのセンサおよびプラットフォームに依存しないフレームワークであるSegmentAnyTreeV2を提案する。
このモデルはシリアライズベースのPoint Transformer v3バックボーンと軽量なセマンティックヘッドとツリー中心のクロスアテンションマスクデコーダを組み合わせたものだ。
セマンティックな予測は、インスタンスデコーディングをツリークラスのボクセルに制限する一方で、インスタンス対応クエリ初期化、一対多のシード監視、および非対称マスクスコアリングは、密で構造的に複雑なスタンドでの分離を改善する。
さらに,427のシーンと26,496のアノテート木を多種多様な生物群,森林構造,LiDARプラットフォームに拡張したFOR-instance v3を紹介する。
FOR-instanceV2テスト分割では、SegmentAnyTreeV2は90.5%の精度、80.2%のリコール、85.0%のF1、90.7%のカバレッジ、87.6%のセマンティックmIoUを達成した。
独立サイトにおけるゼロショット評価は、さらに強いクロスドメインの一般化を示す。
関連論文リスト
- INSID3: Training-Free In-Context Segmentation with DINOv3 [63.961377087673476]
INSID3は、凍結したDINOv3機能のみから、さまざまな粒度で概念を分割する、トレーニング不要のアプローチである。
1ショットのセマンティクス、部分、パーソナライズされたセグメンテーションで最先端の結果を達成し、以前の処理を +7.5 % mIoU で上回る。
論文 参考訳(メタデータ) (2026-03-30T14:16:37Z) - ZS-TreeSeg: A Zero-Shot Framework for Tree Crown Instance Segmentation [5.392796525513568]
樹冠分割はバイオマス推定と生態モニタリングのためのリモートセンシングにおいて重要な課題である。
2つの成熟したタスクから適応するフレームワークであるZSegを提案する。
われわれのフレームワークはセンサタイプとキャノピーにまたがって堅牢に一般化されている。
論文 参考訳(メタデータ) (2026-01-31T02:48:17Z) - ForestFormer3D: A Unified Framework for End-to-End Segmentation of Forest LiDAR 3D Point Clouds [0.06282171844772422]
ForestFormer3Dは、個々のツリーとセマンティックセグメンテーションを正確に記述するための、新しい統合およびエンドツーエンドのフレームワークである。
ForestFormer3Dには、ISA誘導クエリポイントの選択、推論中のスコアベースのブロックマージ戦略、効果的なトレーニングのための1対多のアソシエーションメカニズムが組み込まれている。
本モデルでは,新たに導入されたFOOR-instanceV2データセットを用いて,個々の木分割の最先端性能を実現する。
論文 参考訳(メタデータ) (2025-06-20T13:39:27Z) - Point2Tree(P2T) -- framework for parameter tuning of semantic and
instance segmentation used with mobile laser scanning data in coniferous
forest [0.22940141855172028]
セマンティックセグメンテーションにおいて0.92F1スコアを達成するPointnet++アーキテクチャに基づいたモデルをトレーニングする。
パイプラインの第2ステップとして、グラフベースのアプローチを使用して、F1スコアの約0.6に達した。
論文 参考訳(メタデータ) (2023-05-04T08:45:17Z) - Sparse Instance Activation for Real-Time Instance Segmentation [72.23597664935684]
本稿では,リアルタイムインスタンスセグメンテーションのための概念的・効率的・完全畳み込み型フレームワークを提案する。
SparseInstは非常に高速な推論速度を持ち、COCOベンチマークで40 FPSと37.9 APを達成した。
論文 参考訳(メタデータ) (2022-03-24T03:15:39Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - Multi-task fully convolutional network for tree species mapping in dense
forests using small training hyperspectral data [0.9646880519252493]
本研究は、密林における樹木種マッピングのためのマルチタスク完全畳み込みアーキテクチャを提案する。
本モデルでは, 木の意味的ラベル付け結果の高密度化を可能にする部分的損失関数を実装した。
ツリークラウン境界制約を強制する距離回帰補完タスクは、モデル性能を大幅に改善する。
論文 参考訳(メタデータ) (2021-06-01T21:10:10Z) - Unifying Instance and Panoptic Segmentation with Dynamic Rank-1
Convolutions [109.2706837177222]
DR1Maskは、インスタンスとセマンティックセグメンテーションの両方で共有機能マップを利用する最初のパノプティクスセグメンテーションフレームワークである。
副産物として、DR1Maskは従来の最先端のインスタンスセグメンテーションネットワークであるBlendMaskよりも10%高速で1ポイント精度が高い。
論文 参考訳(メタデータ) (2020-11-19T12:42:10Z) - PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation [111.7241018610573]
私たちは、インスタンスセグメンテーションのための新しいエンドツーエンドボトムアップアーキテクチャであるPointGroupを紹介します。
我々は2分岐ネットワークを設計し、ポイントの特徴を抽出し、セマンティックラベルとオフセットを予測し、各ポイントをそれぞれのインスタンスセントロイドに向けてシフトさせる。
クラスタリングコンポーネントは、元のおよびオフセットシフトされた点座標セットの両方を利用するために、その相補的な強度を利用する。
ScanNet v2 と S3DIS の2つの挑戦的データセットに対する広範な実験を行い、ScanNet v2 と S3DIS が最も高い性能を達成し、63.6% と 64.0% の2つを以前のベストが達成した54.9% と54.4% と比較した。
論文 参考訳(メタデータ) (2020-04-03T16:26:37Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。