論文の概要: First Place Solution to the MLCAS 2025 GWFSS Challenge: The Devil is in the Detail and Minority
- arxiv url: http://arxiv.org/abs/2508.17305v1
- Date: Sun, 24 Aug 2025 11:14:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.458744
- Title: First Place Solution to the MLCAS 2025 GWFSS Challenge: The Devil is in the Detail and Minority
- Title(参考訳): MLCAS 2025 GWFSSの挑戦:悪魔は細部と細部にある
- Authors: Songliang Cao, Tianqi Hu, Hao Lu,
- Abstract要約: 我々は,MLCAS 2025 GWFSS Challengeの解決策を提示する。
この挑戦は小麦植物に特化したセマンティックセグメンテーションの競争を主催している。
ビジュアライゼーションを探索することで、キー -- 幹が重要なのです。
- 参考スコア(独自算出の注目度): 6.292804208359623
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this report, we present our solution during the participation of the MLCAS 2025 GWFSS Challenge. This challenge hosts a semantic segmentation competition specific to wheat plants, which requires to segment three wheat organs including the head, leaf, and stem, and another background class. In 2025, participating a segmentation competition is significantly different from that in previous years where many tricks can play important roles. Nowadays most segmentation tricks have been well integrated into existing codebases such that our naive ViT-Adapter baseline has already achieved sufficiently good performance. Hence, we believe the key to stand out among other competitors is to focus on the problem nature of wheat per se. By probing visualizations, we identify the key -- the stem matters. In contrast to heads and leaves, stems exhibit fine structure and occupy only few pixels, which suffers from fragile predictions and class imbalance. Building on our baseline, we present three technical improvements tailored to stems: i) incorporating a dynamic upsampler SAPA used to enhance detail delineation; ii) leveraging semi-supervised guided distillation with stem-aware sample selection to mine the treasure beneath unlabeled data; and iii) applying a test-time scaling strategy to zoom in and segment twice the image. Despite being simple, the three improvements bring us to the first place of the competition, outperforming the second place by clear margins. Code and models will be released at https://github.com/tiny-smart/gwfss25.
- Abstract(参考訳): 本報告では,MLCAS 2025 GWFSS Challengeに参加する際の解決策について述べる。
このチャレンジでは、小麦の植物に特有のセグメンテーションの競争が開催されており、それは、頭、葉、茎を含む3つの小麦の器官と、別のバックグラウンドクラスを分割する必要がある。
2025年、セグメンテーション競技に参加することは、多くのトリックが重要な役割を果たす前年とは大きく異なる。
現在、ほとんどのセグメンテーションのトリックは既存のコードベースにうまく統合されています。
したがって、他の競争相手の中でも際立つ鍵は、小麦そのものの問題点に焦点を合わせることだと我々は信じている。
ビジュアライゼーションを探索することで、キー -- 幹が重要なのです。
頭や葉とは対照的に、茎は微細な構造を示し、少数のピクセルしか占有せず、脆弱な予測や階級不均衡に悩まされている。
ベースライン上に構築され、茎に合わせた3つの技術的改善を提示します。
一 詳細記述の強化に使用する動的アップサンプラーSAPAを組み込むこと。
二 無ラベルデータの下の宝物を採掘するために、半指導的蒸留を茎状試料選択に活用すること。
三 画像の2倍のズームイン及び分割にテストタイムスケーリング戦略を適用すること。
単純であるにもかかわらず、3つの改善は、競争の第一位に私たちをもたらし、明確なマージンで第二位を上回ります。
コードとモデルはhttps://github.com/tiny-smart/gwfss25.comでリリースされる。
関連論文リスト
- C3S3: Complementary Competition and Contrastive Selection for Semi-Supervised Medical Image Segmentation [2.3441453628908238]
補間競合とコントラスト選択を統合した,新しい半教師付きセグメンテーションモデルであるC3S3を紹介する。
この設計は境界線を著しく鋭くし、全体的な精度を高める。
提案されたC3S3は、2つの公開データセットに対して厳格な検証を行っている。
論文 参考訳(メタデータ) (2025-06-09T02:34:19Z) - Image Segmentation in Foundation Model Era: A Survey [95.60054312319939]
イメージセグメンテーションにおける現在の研究は、異なる特徴、課題、解決策の詳細な分析を欠いている。
本調査は、FM駆動画像セグメンテーションを中心とした最先端の研究を徹底的にレビューすることで、このギャップを埋めようとしている。
現在の研究成果の広さを包括する,300以上のセグメンテーションアプローチの概要を概観する。
論文 参考訳(メタデータ) (2024-08-23T10:07:59Z) - Agriculture-Vision Challenge 2024 -- The Runner-Up Solution for Agricultural Pattern Recognition via Class Balancing and Model Ensemble [20.631333392618327]
CVPR 2024の農業ビジョンチャレンジは、セマンティックセマンティックセマンティクスモデルを活用してピクセルレベルのセマンティクスセマンティクスラベルを作成することを目的としている。
本稿では,モザイクデータ拡張手法を提案する。
提案手法は,テストセットにおいて平均mIoU(mIoU)スコア0.547を達成し,この課題において第2位を確保した。
論文 参考訳(メタデータ) (2024-06-18T04:59:04Z) - Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - CLIP for All Things Zero-Shot Sketch-Based Image Retrieval, Fine-Grained
or Not [109.69076457732632]
ゼロショットスケッチに基づく画像検索(ZS-SBIR)におけるCLIPの利用
私たちはこのシナジーを達成するのにいかに最適かという新しいデザインを提唱した。
これまでの最先端技術よりも26.9%の領域で顕著なパフォーマンス向上が観察された。
論文 参考訳(メタデータ) (2023-03-23T17:02:00Z) - PA-Seg: Learning from Point Annotations for 3D Medical Image
Segmentation using Contextual Regularization and Cross Knowledge Distillation [14.412073730567137]
本稿では,3次元医用画像の7点のみのセグメンテーションターゲットに注釈を付け,弱教師付き学習フレームワークPA-Segを設計する。
第1段階では、より監督的な信号を提供するために、シードポイントを拡張するために測地距離変換を用いる。
第2段階では、第1段階で事前学習されたモデルから得られた予測を擬似ラベルとして使用する。
論文 参考訳(メタデータ) (2022-08-11T07:00:33Z) - Point-to-Voxel Knowledge Distillation for LiDAR Semantic Segmentation [74.67594286008317]
本稿では,大きな教師モデルから,LiDARセマンティックセグメンテーションのためのスリムな学生ネットワークへの知識の抽出の問題に対処する。
本稿では,点レベルとボクセルレベルの両方から隠れた知識を伝達するPVDを提案する。
論文 参考訳(メタデータ) (2022-06-05T05:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。