論文の概要: Technical Report for ICRA 2026 GOOSE 2D Fine-Grained Semantic Segmentation Challenge: Exploring Query-Based Segmentation and Increased Spatial Context for Outdoor Scene Understanding
- arxiv url: http://arxiv.org/abs/2606.21456v1
- Date: Fri, 19 Jun 2026 14:13:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 13:21:37.56813
- Title: Technical Report for ICRA 2026 GOOSE 2D Fine-Grained Semantic Segmentation Challenge: Exploring Query-Based Segmentation and Increased Spatial Context for Outdoor Scene Understanding
- Title(参考訳): ICRA 2026 GOOSE 2D Fine-Grained Semantic Segmentation Challenge: Exploring Query-based Segmentation and increased spatial Context for Outdoor Scene Understanding (特集:情報ネットワーク)
- Authors: David Pascual-Hernández, Roberto Calvo-Palomino, Inmaculada Mora-Jiménez, Jose María Cañas-Plaza,
- Abstract要約: GOOSE 2D Fine-Grained Semantic ChallengeをICRA 2026のフィールドロボティクスワークショップの一環として開催する。
この課題は、56のきめ細かいクラスと11のより広いカテゴリの階層的な分類法を用いて注釈付けされた、GOOSEデータセットとGOOSE-Exデータセットのデータを組み合わせている。
最終提出は、挑戦テストセットの69.6%のmIoUを達成し、屋外環境におけるきめ細かいセマンティックセグメンテーションのための強力なベースラインを提供する。
- 参考スコア(独自算出の注目度): 2.685567215235468
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this report, we present our submission to the GOOSE 2D Fine-Grained Semantic Segmentation Challenge, organized as part of the Workshop on Field Robotics at ICRA 2026. The challenge combines data from the GOOSE and GOOSE-Ex datasets, which comprise more than 13k images captured from 4 distinct camera setups, annotated using a hierarchical taxonomy of 56 fine-grained classes and 11 broader categories. Starting from SegFormer as a baseline, we progressively improve segmentation performance through increased training crop sizes, a transition to the query-based Mask2Former architecture, and test-time augmentation. Our experiments show that query-based segmentation significantly outperforms the baseline model. Furthermore, increasing the crop size used during training yields substantial gains, highlighting the relevance of preserving scene context for fine-grained semantic disambiguation. Our final submission, using test-time augmentation, achieves an mIoU of 69.6% on the challenge test set, providing a strong baseline for fine-grained semantic segmentation in outdoor environments. To facilitate reproducibility and future research, code and weights will be made publicly available at https://github.com/RoboticsLabURJC/outdoor-fine-grained-segmentation .
- Abstract(参考訳): 本稿では, ICRA 2026 のフィールドロボティクスワークショップの一環として組織された GOOSE 2D Fine-Grained Semantic Segmentation Challenge に提出する。
この課題は、GOOSEデータセットとGOOSE-Exデータセットのデータを組み合わせて、4つの異なるカメラ設定から取得された13k以上の画像で構成され、56のきめ細かいクラスと11のより広いカテゴリの階層的な分類を用いて注釈付けされている。
SegFormerをベースラインとして開始すると、トレーニング作物のサイズの増大、クエリベースのMask2Formerアーキテクチャへの移行、テスト時間拡張によるセグメント化のパフォーマンスが徐々に向上します。
実験の結果,クエリベースのセグメンテーションはベースラインモデルよりも大幅に優れていた。
さらに、訓練中に使用する作物の規模が大きくなるとかなりの利益が得られ、微粒な意味の曖昧さに対するシーンコンテキスト保存の関連性が強調される。
テスト時間拡張を用いた最終提出は、チャレンジテストセットで69.6%のmIoUを達成し、屋外環境におけるきめ細かいセマンティックセグメンテーションのための強力なベースラインを提供する。
再現性と将来の研究を容易にするため、コードと重みはhttps://github.com/RoboticsLabURJC/outdoor-fine-fine-segmentation で公開されている。
関連論文リスト
- Technical Report for ICRA 2026 GOOSE 2D Fine-Grained Semantic Segmentation Challenge: Leveraging DINOv3 for Robust Outdoor Scene Understanding in Field Robotics [8.77371742508379]
GOOSE 2D Fine-Grained Semantic Challengeはオフロード画像の密接なセマンティックセマンティックセグメンテーションを評価する。
この課題に対する第一の解決策を提示する。
論文 参考訳(メタデータ) (2026-06-17T01:13:22Z) - Evaluating the Efficacy of Cut-and-Paste Data Augmentation in Semantic Segmentation for Satellite Imagery [4.499833362998487]
本研究では,衛星画像のセマンティックセグメンテーションにおけるカット・アンド・ペースト拡張手法の有効性について検討した。
私たちは、通常ラベル付きインスタンスを必要とするこの拡張を、セマンティックセグメンテーションのケースに適用します。
評価のためにDynamicEarthNetデータセットとU-Netモデルを用いて、この拡張により、テストセットのmIoUスコアが37.9から44.1に大幅に向上することを発見した。
論文 参考訳(メタデータ) (2024-04-08T17:18:30Z) - Instance Segmentation under Occlusions via Location-aware Copy-Paste
Data Augmentation [8.335108002480068]
MMSports 2023 DeepSportRadarは、バスケットボールのコンテキスト内での人間の対象のセグメンテーションに焦点を当てたデータセットを導入した。
この課題は、堅牢なデータ拡張技術と賢明なディープラーニングアーキテクチャの適用を必要とする。
我々の研究(コンペで1位)は、まず、より広い分布でより多くのトレーニングサンプルを生成することのできる、新しいデータ拡張技術を提案する。
論文 参考訳(メタデータ) (2023-10-27T07:44:25Z) - High-Quality Entity Segmentation [110.55724145851725]
CropFormerは高解像度画像におけるインスタンスレベルのセグメンテーションの難易度に対処するために設計されている。
よりきめ細かい画像とフルイメージを提供する高解像度の画像作物を融合することで、マスク予測を改善する。
CropFormerでは、難易度の高いエンティティセグメンテーションタスクで1.9ドルという大きなAP利益を達成しています。
論文 参考訳(メタデータ) (2022-11-10T18:58:22Z) - Improving Semi-Supervised and Domain-Adaptive Semantic Segmentation with
Self-Supervised Depth Estimation [94.16816278191477]
本稿では,セミアダプティブなセマンティックセマンティックセマンティックセグメンテーションのためのフレームワークを提案する。
ラベルのない画像シーケンスでのみ訓練された自己教師付き単眼深度推定によって強化される。
提案したモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2021-08-28T01:33:38Z) - Large-scale Unsupervised Semantic Segmentation [163.3568726730319]
本稿では, 大規模無教師付きセマンティックセマンティックセグメンテーション (LUSS) の新たな課題を提案する。
ImageNetデータセットに基づいて、120万のトレーニング画像と40万の高品質なセマンティックセグメンテーションアノテーションを用いた画像Net-Sデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-06T15:02:11Z) - Context-self contrastive pretraining for crop type semantic segmentation [39.81074867563505]
提案したContext-Self Contrastive Loss (CSCL)は、セマンティックバウンダリをポップアップさせる埋め込み空間を学習する。
衛星画像時系列(SITS)からの作物型セマンティックセマンティックセグメンテーションでは,サテライト境界における性能が重要なボトルネックとなる。
より粒度の高い作物のクラスを得るための超解像における意味的セグメンテーションのプロセスを提案する。
論文 参考訳(メタデータ) (2021-04-09T11:29:44Z) - Three Ways to Improve Semantic Segmentation with Self-Supervised Depth
Estimation [90.87105131054419]
ラベルなし画像列からの自己教師付き単眼深度推定により強化された半教師付きセマンティックセマンティックセマンティックセマンティクスのフレームワークを提案する。
提案されたモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2020-12-19T21:18:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。