論文の概要: 1st Place Solution of LVIS Challenge 2020: A Good Box is not a Guarantee
of a Good Mask
- arxiv url: http://arxiv.org/abs/2009.01559v1
- Date: Thu, 3 Sep 2020 10:09:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 07:43:31.658240
- Title: 1st Place Solution of LVIS Challenge 2020: A Good Box is not a Guarantee
of a Good Mask
- Title(参考訳): lvis challenge 2020の1位: 良い箱は良いマスクの保証ではない
- Authors: Jingru Tan, Gang Zhang, Hanming Deng, Changbao Wang, Lewei Lu,
Quanquan Li, Jifeng Dai
- Abstract要約: この記事では、LVIS Challenge 2020のチーム向けlvisTravelerのソリューションを紹介します。
本稿では,LVISデータセットの特徴として,長期分布と高品質なインスタンスセグメンテーションマスクの2つの特徴について考察する。
We achieve 41.5 and 41.2 AP on LVIS v1.0 val and test-dev splits respectively, out the baseline based on X101-FPN-MaskRCNN by a wide margin。
- 参考スコア(独自算出の注目度): 23.786904438486758
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article introduces the solutions of the team lvisTraveler for LVIS
Challenge 2020. In this work, two characteristics of LVIS dataset are mainly
considered: the long-tailed distribution and high quality instance segmentation
mask. We adopt a two-stage training pipeline. In the first stage, we
incorporate EQL and self-training to learn generalized representation. In the
second stage, we utilize Balanced GroupSoftmax to promote the classifier, and
propose a novel proposal assignment strategy and a new balanced mask loss for
mask head to get more precise mask predictions. Finally, we achieve 41.5 and
41.2 AP on LVIS v1.0 val and test-dev splits respectively, outperforming the
baseline based on X101-FPN-MaskRCNN by a large margin.
- Abstract(参考訳): この記事では、LVIS Challenge 2020のチーム向けlvisTravelerのソリューションを紹介します。
本稿では,LVISデータセットの特徴として,長期分布と高品質なインスタンスセグメンテーションマスクの2つについて考察する。
2段階のトレーニングパイプラインを採用しています。
最初の段階では、EQLと自己学習を取り入れて、一般化された表現を学びます。
第2段階では,Balotd GroupSoftmaxを用いて分類器のプロモートを行い,より正確なマスク予測を行うための新しい提案手法とマスクヘッドのための新しいバランスマスク損失を提案する。
最後に、LVIS v1.0 val と test-dev の 41.5 と 41.2 AP をそれぞれ達成し、X101-FPN-MaskRCNN に基づくベースラインを大きなマージンで上回った。
関連論文リスト
- Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - Semantic Refocused Tuning for Open-Vocabulary Panoptic Segmentation [42.020470627552136]
Open-vocabulary Panoptic segmentationは、イメージを意味のあるマスクに正確に分割することを目的とした、新たなタスクである。
マスク分類は、オープンボキャブ・パノプティクスのセグメンテーションにおける主要なパフォーマンスボトルネックである。
オープンボキャブ・パノプティクスのセグメンテーションを大幅に強化する新しいフレームワークであるセマンティック・リフォーカス・タニングを提案する。
論文 参考訳(メタデータ) (2024-09-24T17:50:28Z) - Masked Face Dataset Generation and Masked Face Recognition [2.4377103193902703]
パンデミック後の時代には、フェイスマスクを着用することは、通常の顔認識に大きな課題をもたらしてきた。
モデルを現実世界の状況に適応させるために、より困難なマスク付き顔データセットを作成しました。
50のアイデンティティMFR上での最良のテスト精度は95%に達した。
論文 参考訳(メタデータ) (2023-11-13T17:09:57Z) - Mask Propagation for Efficient Video Semantic Segmentation [63.09523058489429]
ビデオセマンティックベースライン劣化(VSS)は、ビデオシーケンス内の各ピクセルにセマンティックラベルを割り当てることを含む。
SSSSと呼ばれるVSSのための効率的なマスク伝搬フレームワークを提案する。
当社のフレームワークは,フレーム単位のMask2Formerと比較して最大4倍のFLOPを削減し,Cityscapes検証セット上では最大2% mIoUしか使用できない。
論文 参考訳(メタデータ) (2023-10-29T09:55:28Z) - Mask-Free Video Instance Segmentation [102.50936366583106]
ビデオマスクは面倒で高価なアノテーションで、既存のVISデータセットのスケールと多様性を制限している。
我々は、オブジェクト状態のバウンディングボックスアノテーションのみを使用しながら、非常に競争力のあるVIS性能を実現するMaskFreeVISを提案する。
我々のTK-Lossは、効率的なパッチマッチングステップを経て、フレーム間の一対多のマッチを見つけ、続いてK-アネレスの隣り合う選択を行う。
論文 参考訳(メタデータ) (2023-03-28T11:48:07Z) - LVIS Challenge Track Technical Report 1st Place Solution: Distribution
Balanced and Boundary Refinement for Large Vocabulary Instance Segmentation [12.457303905862775]
本報告では, マスクとバウンダリの長テール分布とセグメンテーション品質の2つの側面に着目する。
先進的なHTCインスタンスセグメンテーションアルゴリズムに基づいて、CBNetv2にインスパイアされた複合接続を介してトランスフォーマーバックボーン(Swin-L)を接続し、ベースライン結果を強化する。
LVISチャレンジ2021では,マルチスケールテストと画像ごとの検出対象数上限の増大により,45.4%以上の境界APを達成した。
論文 参考訳(メタデータ) (2021-11-04T07:23:56Z) - PFENet++: Boosting Few-shot Semantic Segmentation with the
Noise-filtered Context-aware Prior Mask [62.37727055343632]
「Few-Shot」のためのガイド機能強化ネットワークで提案された以前のマスクガイダンスを再考する。
本稿では,クエリ画像中のオブジェクトの配置を改善するために,近隣のセマンティックキューを活用するコンテキスト対応プリエントマスク(CAPM)を提案する。
我々は、不要な応答をスクリーニングするために、軽量ノイズ抑圧モジュール(NSM)を組み込むことにより、さらに一歩前進する。
論文 参考訳(メタデータ) (2021-09-28T15:07:43Z) - RefineMask: Towards High-Quality Instance Segmentation with Fine-Grained
Features [53.71163467683838]
RefineMaskは、オブジェクトやシーンの高品質なインスタンスセグメンテーションのための新しい方法です。
インスタンス毎のセグメンテーションプロセス中に粒度の細かい機能を多段階的に組み込む。
以前のほとんどのメソッドで過剰にスムースされたオブジェクトの曲がった部分のようなハードケースをセグメンテーションすることに成功します。
論文 参考訳(メタデータ) (2021-04-17T15:09:20Z) - BoxInst: High-Performance Instance Segmentation with Box Annotations [102.10713189544947]
本稿では,トレーニング用バウンディングボックスアノテーションのみを用いて,マスクレベルのインスタンスセグメンテーションを実現する高性能な手法を提案する。
私たちの中核となる考え方は、セグメンテーションネットワーク自体を変更することなく、インスタンスセグメンテーションにおける学習マスクの喪失を活用することです。
論文 参考訳(メタデータ) (2020-12-03T22:27:55Z) - Robust Vision Challenge 2020 -- 1st Place Report for Panoptic
Segmentation [13.23676270963484]
私たちのネットワークは、最先端のEfficientPSアーキテクチャの軽量版です。
提案した共有バックボーンと改良されたEfficientNet-B5モデルをエンコーダとして,続いて2方向FPNで意味的にリッチなマルチスケール機能について学習する。
提案するパン光学融合モジュールは,各頭部のロジットを適応的に融合させ,パン光学分割出力を出力する。
論文 参考訳(メタデータ) (2020-08-23T21:41:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。