Fugu-MT 論文翻訳(概要): Technical Report for ICRA 2026 GOOSE 2D Fine-Grained Semantic Segmentation Challenge: Leveraging DINOv3 for Robust Outdoor Scene Understanding in Field Robotics

論文の概要: Technical Report for ICRA 2026 GOOSE 2D Fine-Grained Semantic Segmentation Challenge: Leveraging DINOv3 for Robust Outdoor Scene Understanding in Field Robotics

arxiv url: http://arxiv.org/abs/2606.18582v1
Date: Wed, 17 Jun 2026 01:13:22 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-18 17:16:50.947462
Title: Technical Report for ICRA 2026 GOOSE 2D Fine-Grained Semantic Segmentation Challenge: Leveraging DINOv3 for Robust Outdoor Scene Understanding in Field Robotics
Title（参考訳）: ICRA 2026 GOOSE 2D Fine-Grained Semantic Segmentation Challenge: Leveraging DINOv3 for Robust Outdoor Scene Understanding in Field Robotics 参加報告
Authors: Jaeil Park, Hyobin Choi, Sangjin Lee, Hyungtae Lim, Sung-Hoon Yoon,
Abstract要約: GOOSE 2D Fine-Grained Semantic Challengeはオフロード画像の密接なセマンティックセマンティックセグメンテーションを評価する。この課題に対する第一の解決策を提示する。
参考スコア（独自算出の注目度）: 8.77371742508379
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The GOOSE 2D Fine-Grained Semantic Segmentation Challenge at the ICRA 2026 Workshop on Field Robotics evaluates dense semantic segmentation of off-road imagery over a fine-grained taxonomy of 64 classes and 11 evaluated non-void coarse categories. We present the first-place solution to this challenge. Our solution comprises two complementary improvements: (a) a network-level design that combines a self-supervised DINOv3 ViT-L/16 backbone, a ViT-Adapter, and a Mask2Former mask-classification decoder, together with a coarse-category auxiliary loss on the global [CLS] token; and (b) an inference-time aggregation strategy based on multi-scale and horizontal-flip test-time augmentation and an ensemble of the top three checkpoints selected using Codabench scores. Our method achieves an official composite score of 76.57%, consisting of 69.32% fine-class mIoU and 83.81% category-level mIoU, and ranks first on the final phase leaderboard: www.codabench.org/competitions/14257/#/results-tab.
Abstract（参考訳）: GOOSE 2D Fine-Grained Semantic Segmentation Challenge at the ICRA 2026 Workshop on Field Roboticsは、64クラスの微粒な分類と11種類の非声の粗いカテゴリーで、オフロード画像の密接なセマンティックセグメンテーションを評価する。この課題に対する第一の解決策を提示する。私たちのソリューションには2つの補完的な改善があります。 (a)自己監督型DINOv3 ViT-L/16バックボーン、ViT-Adapter、Mask2Formerマスク分類復号器をグローバル(CLS)トークンの粗いカテゴリー別補助損失と組み合わせたネットワークレベルの設計。 b)マルチスケールおよび水平フリップテスト時間拡張に基づく推論時集約戦略と,コダベッチスコアを用いて選択した上位3つのチェックポイントのアンサンブル。本手法は,69.32%のファインクラスmIoUと83.81%のカテゴリレベルのmIoUからなる76.57%の公式な合成スコアを達成し,最終フェーズのリーダーボードにランクインした。

関連論文リスト

Towards Cross-Platform Generalization: Domain Adaptive 3D Detection with Augmentation and Pseudo-Labeling [58.42010583822351]
この技術レポートは、RoboSense2025 Challengeにおけるクロスプラットフォームの3Dオブジェクト検出タスクに対する受賞したソリューションを表している。提案手法は,ポイントベースとボクセルベースの機能を効果的に統合した,効率的な3次元オブジェクト検出フレームワークであるPVRCNN++に基づいている。我々は,データ拡張と擬似ラベルによる自己学習戦略により,ドメインギャップを狭めることで,クロスプラットフォームの一般化を改善する。
論文参考訳（メタデータ） (2026-01-13T03:09:20Z)
DHR: Dual Features-Driven Hierarchical Rebalancing in Inter- and Intra-Class Regions for Weakly-Supervised Semantic Segmentation [7.545489807578403]
弱教師付きセマンティックセマンティックセマンティクス(WSS)は、限られたデータによる高品質セマンティクスを保証する。 WSSは、隣接する複数のクラスを持つイメージで見過ごされているため、マイナークラスに関連する課題に直面します。まず、従来の手法ではなく、教師なしで弱い教師付き特徴写像を用いてこの問題に対処する。
論文参考訳（メタデータ） (2024-03-30T14:35:31Z)
3rd Place Solution for PVUW2023 VSS Track: A Large Model for Semantic Segmentation on VSPW [68.56017675820897]
本稿では,PVUW2023 VSSトラックの3位解について紹介する。ビデオセマンティックセグメンテーションの課題を解決するために,様々な画像レベルの視覚的バックボーンとセグメンテーションヘッドを探索した。
論文参考訳（メタデータ） (2023-06-04T07:50:38Z)
Unsupervised Semantic Segmentation with Self-supervised Object-centric Representations [54.32381783582341]
近年の自己教師付き特徴学習の進歩により、教師なしオブジェクトの発見とセマンティックセグメンテーションが可能となり、10年前の教師付きセマンティックセグメンテーションにおけるフィールドの状態にマッチする性能が得られた。オブジェクト発見を起動するための教師なしサリエンシマスクと自己教師付き特徴クラスタリングに基づく手法を提案し,その後擬似ラベルを用いたセマンティックセグメンテーションネットワークを訓練し,複数のオブジェクトを持つ画像上でシステムをブートストラップする。
論文参考訳（メタデータ） (2022-07-11T17:28:24Z)
CV 3315 Is All You Need : Semantic Segmentation Competition [14.818852884385015]
このコンペティションは、車載カメラのビューに基づいてUrban-Senseに焦点を当てている。クラスの非バランスなUrban-Senseイメージデータセットは、既存のソリューションに挑戦する。ディープコンベンショナルニューラルネットワークに基づくセマンティックセグメンテーション手法は、現実のアプリケーションに適用可能な柔軟なソリューションとなる。
論文参考訳（メタデータ） (2022-06-25T06:27:57Z)
PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation [111.7241018610573]
私たちは、インスタンスセグメンテーションのための新しいエンドツーエンドボトムアップアーキテクチャであるPointGroupを紹介します。我々は2分岐ネットワークを設計し、ポイントの特徴を抽出し、セマンティックラベルとオフセットを予測し、各ポイントをそれぞれのインスタンスセントロイドに向けてシフトさせる。クラスタリングコンポーネントは、元のおよびオフセットシフトされた点座標セットの両方を利用するために、その相補的な強度を利用する。 ScanNet v2 と S3DIS の2つの挑戦的データセットに対する広範な実験を行い、ScanNet v2 と S3DIS が最も高い性能を達成し、63.6% と 64.0% の2つを以前のベストが達成した54.9% と54.4% と比較した。
論文参考訳（メタデータ） (2020-04-03T16:26:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。