論文の概要: Strong Instance Segmentation Pipeline for MMSports Challenge
- arxiv url: http://arxiv.org/abs/2209.13899v1
- Date: Wed, 28 Sep 2022 07:56:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 17:13:47.317015
- Title: Strong Instance Segmentation Pipeline for MMSports Challenge
- Title(参考訳): MMSportsチャレンジのためのStrong Instance Segmentation Pipeline
- Authors: Bo Yan, Fengliang Qi, Zhuang Li, Yadong Li, Hongbin Wang
- Abstract要約: ACM MMSports2022 DeepSportRadar Instance Challengeの目標は、バスケットボールコートでの個々の人間のセグメンテーションに取り組むことである。
これらの問題に対処するため、私たちは強力なインスタンスセグメンテーションパイプラインを設計しました。
実験の結果、提案されたパイプラインはDeepSportRadarチャレンジで競合する結果を得ることができた。
- 参考スコア(独自算出の注目度): 13.524030430592362
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The goal of ACM MMSports2022 DeepSportRadar Instance Segmentation Challenge
is to tackle the segmentation of individual humans including players, coaches
and referees on a basketball court. And the main characteristics of this
challenge are there is a high level of occlusions between players and the
amount of data is quite limited. In order to address these problems, we
designed a strong instance segmentation pipeline. Firstly, we employed a proper
data augmentation strategy for this task mainly including photometric
distortion transform and copy-paste strategy, which can generate more image
instances with a wider distribution. Secondly, we employed a strong
segmentation model, Hybrid Task Cascade based detector on the Swin-Base based
CBNetV2 backbone, and we add MaskIoU head to HTCMaskHead that can simply and
effectively improve the performance of instance segmentation. Finally, the SWA
training strategy was applied to improve the performance further. Experimental
results demonstrate the proposed pipeline can achieve a competitive result on
the DeepSportRadar challenge, with 0.768AP@0.50:0.95 on the challenge set.
Source code is available at
https://github.com/YJingyu/Instanc_Segmentation_Pro.
- Abstract(参考訳): ACM MMSports2022 DeepSportRadar Instance Segmentation Challengeの目標は、バスケットボールコートで選手、コーチ、審判を含む個々の人間のセグメンテーションに取り組むことである。
この課題の主な特徴は、プレイヤー間では高いレベルのオクルージョンがあり、データ量は非常に限られていることである。
これらの問題に対処するため、私たちは強力なインスタンスセグメンテーションパイプラインを設計しました。
まず,より広い分布でより多くの画像インスタンスを生成することができるフォトメトリック歪み変換とコピーペースト戦略を含む,この課題に適切なデータ拡張戦略を採用した。
次に,swainベースのcbnetv2バックボーンに基づく,強力なセグメンテーションモデルとハイブリッドタスクカスケードに基づく検出器を採用し,インスタンスセグメンテーションの性能を簡易かつ効果的に向上可能なmaschiouヘッドをhtcmaskheadに追加した。
最後に、SWAトレーニング戦略を適用し、パフォーマンスをさらに向上させた。
実験の結果、提案パイプラインはdeepsportradarチャレンジにおいて0.768ap@0.50:0.95の競合結果が得られることが示された。
ソースコードはhttps://github.com/YJingyu/Instanc_Segmentation_Proで入手できる。
関連論文リスト
- DynaSeg: A Deep Dynamic Fusion Method for Unsupervised Image Segmentation Incorporating Feature Similarity and Spatial Continuity [0.5755004576310334]
我々は、革新的な教師なしイメージセグメンテーションアプローチであるDynaSegを紹介する。
従来の方法とは異なり、DynaSegは画像の特徴に柔軟に対応する動的重み付け方式を採用している。
DynaSegは、予測されたクラスタ数が1つに収束する可能性のある、過小評価の失敗を防ぐ。
論文 参考訳(メタデータ) (2024-05-09T00:30:45Z) - The Surprising Effectiveness of Skip-Tuning in Diffusion Sampling [78.6155095947769]
Skip-Tuningは、スキップ接続上でシンプルだが驚くほど効果的にトレーニング不要なチューニング方法である。
ImageNet 64 では 19 NFE (1.75) で事前訓練された EDM に対して100% FID の改善が可能である。
Skip-Tuningは画素空間におけるスコアマッチング損失を増加させる一方、特徴空間における損失は減少する。
論文 参考訳(メタデータ) (2024-02-23T08:05:23Z) - Instance Segmentation under Occlusions via Location-aware Copy-Paste
Data Augmentation [8.335108002480068]
MMSports 2023 DeepSportRadarは、バスケットボールのコンテキスト内での人間の対象のセグメンテーションに焦点を当てたデータセットを導入した。
この課題は、堅牢なデータ拡張技術と賢明なディープラーニングアーキテクチャの適用を必要とする。
我々の研究(コンペで1位)は、まず、より広い分布でより多くのトレーニングサンプルを生成することのできる、新しいデータ拡張技術を提案する。
論文 参考訳(メタデータ) (2023-10-27T07:44:25Z) - The Second-place Solution for CVPR VISION 23 Challenge Track 1 -- Data
Effificient Defect Detection [3.4853769431047907]
データ有効欠陥検出のためのビジョンチャレンジトラック1は、競合相手がデータ不足の環境で14の産業検査データセットを例示する必要がある。
この課題に対して、Aoi-overfiting-Teamチームの技術詳細を紹介します。
論文 参考訳(メタデータ) (2023-06-25T03:37:02Z) - Mask Matching Transformer for Few-Shot Segmentation [71.32725963630837]
Mask Matching Transformer (MM-Former) は、少数ショットセグメンテーションタスクのための新しいパラダイムである。
まず、MM-Formerは、まず分解し、次にブレンドするというパラダイムに従う。
一般的なCOCO-20i$とPascal-5i$ベンチマークに関する広範な実験を行っている。
論文 参考訳(メタデータ) (2022-12-05T11:00:32Z) - Task-Specific Data Augmentation and Inference Processing for VIPriors
Instance Segmentation Challenge [9.43662534739698]
タスク固有のデータ拡張戦略とタスク固有の推論処理戦略を開発する。
本稿では,VIPriors Instance Challengeにおける提案手法の適用性を示す。
実験結果から,提案手法は2022 VIPriors Instance Challengeのテストセットにおいて,競合的な結果が得られることが示された。
論文 参考訳(メタデータ) (2022-11-21T09:15:30Z) - The Devil is in Classification: A Simple Framework for Long-tail Object
Detection and Instance Segmentation [93.17367076148348]
本稿では,最新のロングテールLVISデータセットを用いて,最先端の2段階のインスタンスセグメンテーションモデルMask R-CNNの性能低下について検討する。
主な原因は、オブジェクト提案の不正確な分類である。
そこで本研究では,2段階のクラスバランスサンプリング手法により,分類ヘッドバイアスをより効果的に緩和する,簡単な校正フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T12:49:07Z) - Mask Encoding for Single Shot Instance Segmentation [97.99956029224622]
マスクエンコーディングに基づくインスタンスセグメンテーション(MEInst)と呼ばれる単純なシングルショットインスタンスセグメンテーションフレームワークを提案する。
二次元マスクを直接予測する代わりに、MEInstはそれをコンパクトで固定的な表現ベクトルに蒸留する。
よりシンプルでフレキシブルな一段階のインスタンスセグメンテーション手法は、競合性能も達成できることを示す。
論文 参考訳(メタデータ) (2020-03-26T02:51:17Z) - 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation [116.25081559037872]
この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
論文 参考訳(メタデータ) (2020-03-17T06:45:07Z) - Learning Fast and Robust Target Models for Video Object Segmentation [83.3382606349118]
ビデオオブジェクトセグメンテーション(VOS)は、ターゲットオブジェクトを定義する初期マスクがテスト時にのみ与えられるため、非常に難しい問題である。
それまでのほとんどの場合、第1フレーム上のファイン・チューン・セグメンテーション・ネットワークにアプローチし、非現実的なフレームレートとオーバーフィッティングのリスクをもたらす。
本稿では,2つのネットワークコンポーネントからなる新しいVOSアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T21:58:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。