論文の概要: Technical Report for ICRA 2025 GOOSE 2D Semantic Segmentation Challenge: Leveraging Color Shift Correction, RoPE-Swin Backbone, and Quantile-based Label Denoising Strategy for Robust Outdoor Scene Understanding
- arxiv url: http://arxiv.org/abs/2505.06991v1
- Date: Sun, 11 May 2025 14:35:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.149985
- Title: Technical Report for ICRA 2025 GOOSE 2D Semantic Segmentation Challenge: Leveraging Color Shift Correction, RoPE-Swin Backbone, and Quantile-based Label Denoising Strategy for Robust Outdoor Scene Understanding
- Title(参考訳): ICRA 2025 GOOSE 2D Semantic Segmentation Challenge: Leveraging Color Shift Correction, RoPE-Swin Backbone, and Quantile-based Label Denoising Strategy for Robust Outdoor Scene Understanding
- Authors: Chih-Chung Hsu, I-Hsuan Wu, Wen-Hai Tseng, Ching-Heng Cheng, Ming-Hsuan Wu, Jin-Hui Jiang, Yu-Jou Hsiao,
- Abstract要約: 本報告ではICRA 2025 GOOSE 2D Semantic Challengeのためのフレームワークについて述べる。
屋外シーンを現実世界の条件下で9つの意味カテゴリーに解析することに焦点を当てている。
提案手法は,色補正,位置符号化,誤り認識復調を併用し,平均mIoU(mIoU)を0.848で達成した。
- 参考スコア(独自算出の注目度): 5.430801345870568
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This report presents our semantic segmentation framework developed by team ACVLAB for the ICRA 2025 GOOSE 2D Semantic Segmentation Challenge, which focuses on parsing outdoor scenes into nine semantic categories under real-world conditions. Our method integrates a Swin Transformer backbone enhanced with Rotary Position Embedding (RoPE) for improved spatial generalization, alongside a Color Shift Estimation-and-Correction module designed to compensate for illumination inconsistencies in natural environments. To further improve training stability, we adopt a quantile-based denoising strategy that downweights the top 2.5\% of highest-error pixels, treating them as noise and suppressing their influence during optimization. Evaluated on the official GOOSE test set, our approach achieved a mean Intersection over Union (mIoU) of 0.848, demonstrating the effectiveness of combining color correction, positional encoding, and error-aware denoising in robust semantic segmentation.
- Abstract(参考訳): 本稿では,ICRA 2025 GOOSE 2D セマンティックセグメンテーションチャレンジにおいて,チーム ACVLAB によって開発されたセマンティックセグメンテーションフレームワークについて述べる。
本手法では,自然環境における照明の不整合を補償するカラーシフト推定・補正モジュールとともに,ロータリー位置埋め込み(RoPE)を改良したスウィントランスフォーマーのバックボーンを統合する。
トレーニングの安定性をさらに向上するために、最高のエラー画素の2.5倍の重み付けを減らし、ノイズとして扱い、最適化中の影響を抑えるクオンタミリベースのデノナイジング戦略を採用した。
提案手法は, GOOSE の公式テストセットに基づいて, 色補正, 位置符号化, 誤り認識を併用し, 頑健なセマンティックセマンティックセグメンテーションの有効性を実証し, 平均 0.848 の連邦間(mIoU)を達成した。
関連論文リスト
- CASC-AI: Consensus-aware Self-corrective Learning for Noise Cell Segmentation [8.50335568530725]
高解像度ギガピクセル全スライド画像における多クラス細胞セグメンテーションは様々な臨床応用に不可欠である。
近年の取り組みは、医療の専門知識を持たないレイアノテータを巻き込むことによって、このプロセスを民主化している。
本稿では,Consensus Matrixを利用して学習プロセスをガイドする,コンセンサス対応の自己修正型AIエージェントを提案する。
論文 参考訳(メタデータ) (2025-02-11T06:58:50Z) - Adaptively Augmented Consistency Learning: A Semi-supervised Segmentation Framework for Remote Sensing [9.867670296534103]
AACLは、限られたラベル付きデータの下でRSセグメンテーションの精度を高めるために設計された半教師付きセグメンテーションフレームワークである。
AACLは、半教師付きセグメンテーションにおける競争性能を達成し、特定のカテゴリで20%改善し、最先端のフレームワークと比較して全体のパフォーマンスが2%向上した。
論文 参考訳(メタデータ) (2024-11-14T10:47:01Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Semi-supervised Domain Adaptive Medical Image Segmentation through
Consistency Regularized Disentangled Contrastive Learning [11.049672162852733]
本研究では,医用画像分割のための半教師付き領域適応法(SSDA)について検討した。
本稿では,2段階の学習プロセスを提案する。まず,新しいドメイン・コンテント・ディコンタングル・コントラスト学習(CL)と画素レベルの特徴整合性制約を用いて,自己学習パラダイムでエンコーダを事前学習する。
提案手法がUDA設定で容易に拡張可能であることを実験的に検証し、提案手法の優位性を高める。
論文 参考訳(メタデータ) (2023-07-06T06:13:22Z) - ARHNet: Adaptive Region Harmonization for Lesion-aware Augmentation to
Improve Segmentation Performance [61.04246102067351]
本研究では,合成画像をよりリアルに見せるために,前景調和フレームワーク(ARHNet)を提案する。
実画像と合成画像を用いたセグメンテーション性能の向上に本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-02T10:39:29Z) - Advancing Unsupervised Low-light Image Enhancement: Noise Estimation, Illumination Interpolation, and Self-Regulation [55.07472635587852]
低光画像強調(LLIE)技術は、画像の詳細の保存とコントラストの強化に顕著な進歩をもたらした。
これらのアプローチは、動的ノイズを効率的に緩和し、様々な低照度シナリオを収容する上で、永続的な課題に直面する。
まず,低照度画像の雑音レベルを迅速かつ高精度に推定する方法を提案する。
次に、照明と入力の一般的な制約を満たすために、Learningable Illumination Interpolator (LII) を考案する。
論文 参考訳(メタデータ) (2023-05-17T13:56:48Z) - Semi-supervised Crowd Counting via Density Agency [57.3635501421658]
我々は、学習可能な補助構造、すなわち密度エージェンシーを構築し、認識された前景の地域特徴を対応する密度サブクラスに近づける。
第2に,バックボーン特徴抽出器を統合するために,密度誘導型コントラスト学習損失を提案する。
第3に,前景の機能を改良するためにトランス構造を用いて回帰ヘッドを構築する。
論文 参考訳(メタデータ) (2022-09-07T06:34:00Z) - Region-level Contrastive and Consistency Learning for Semi-Supervised
Semantic Segmentation [30.1884540364192]
半教師付きセマンティックセグメンテーションのための領域レベルのコントラスト・一貫性学習フレームワーク(RC2L)を提案する。
具体的には、まず、地域マスクコントラスト(RMC)損失と地域特徴コントラスト(RFC)損失を、地域レベルのコントラスト特性を達成するために提案する。
提案する領域レベルのコントラストと一貫性の規則化に基づいて,半教師付きセマンティックセグメンテーションのための領域レベルのコントラストと一貫性の学習フレームワーク(RC2L)を開発する。
論文 参考訳(メタデータ) (2022-04-28T07:22:47Z) - Context-self contrastive pretraining for crop type semantic segmentation [39.81074867563505]
提案したContext-Self Contrastive Loss (CSCL)は、セマンティックバウンダリをポップアップさせる埋め込み空間を学習する。
衛星画像時系列(SITS)からの作物型セマンティックセマンティックセグメンテーションでは,サテライト境界における性能が重要なボトルネックとなる。
より粒度の高い作物のクラスを得るための超解像における意味的セグメンテーションのプロセスを提案する。
論文 参考訳(メタデータ) (2021-04-09T11:29:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。