論文の概要: LVIS Challenge Track Technical Report 1st Place Solution: Distribution
Balanced and Boundary Refinement for Large Vocabulary Instance Segmentation
- arxiv url: http://arxiv.org/abs/2111.02668v1
- Date: Thu, 4 Nov 2021 07:23:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-05 15:01:16.593287
- Title: LVIS Challenge Track Technical Report 1st Place Solution: Distribution
Balanced and Boundary Refinement for Large Vocabulary Instance Segmentation
- Title(参考訳): lvisチャレンジトラック技術報告 第1回:大語彙インスタンスセグメンテーションにおける分散バランスと境界細分化
- Authors: WeiFu Fu, CongChong Nie, Ting Sun, Jun Liu, TianLiang Zhang, Yong Liu
- Abstract要約: 本報告では, マスクとバウンダリの長テール分布とセグメンテーション品質の2つの側面に着目する。
先進的なHTCインスタンスセグメンテーションアルゴリズムに基づいて、CBNetv2にインスパイアされた複合接続を介してトランスフォーマーバックボーン(Swin-L)を接続し、ベースライン結果を強化する。
LVISチャレンジ2021では,マルチスケールテストと画像ごとの検出対象数上限の増大により,45.4%以上の境界APを達成した。
- 参考スコア(独自算出の注目度): 12.457303905862775
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This report introduces the technical details of the team FuXi-Fresher for
LVIS Challenge 2021. Our method focuses on the problem in following two
aspects: the long-tail distribution and the segmentation quality of mask and
boundary. Based on the advanced HTC instance segmentation algorithm, we connect
transformer backbone(Swin-L) through composite connections inspired by CBNetv2
to enhance the baseline results. To alleviate the problem of long-tail
distribution, we design a Distribution Balanced method which includes dataset
balanced and loss function balaced modules. Further, we use a Mask and Boundary
Refinement method composed with mask scoring and refine-mask algorithms to
improve the segmentation quality. In addition, we are pleasantly surprised to
find that early stopping combined with EMA method can achieve a great
improvement. Finally, by using multi-scale testing and increasing the upper
limit of the number of objects detected per image, we achieved more than 45.4%
boundary AP on the val set of LVIS Challenge 2021. On the test data of LVIS
Challenge 2021, we rank 1st and achieve 48.1% AP. Notably, our APr 47.5% is
very closed to the APf 48.0%.
- Abstract(参考訳): 本報告では,LVIS Challenge 2021のFuXi-Fresherチームの技術的詳細を紹介する。
本手法では, 長テール分布とマスクと境界のセグメンテーション品質という2つの側面に着目した。
先進的なHTCインスタンスセグメンテーションアルゴリズムに基づいて、CBNetv2にインスパイアされた複合接続を介してトランスフォーマーバックボーン(Swin-L)を接続し、ベースライン結果を強化する。
ロングテール分布の問題を緩和するため,データセットバランスと損失関数バラックモジュールを含む分散バランス手法を設計した。
さらに,マスクスコアリングアルゴリズムと精細マスクアルゴリズムを組み合わせたMask and Boundary Refinement法を用いて,セグメンテーションの品質を向上する。
また,早期停止法とEMA法を併用することで,大幅な改善が期待できる。
最後に,LVISチャレンジ2021のvalセットにおいて,マルチスケールテストと画像毎の検出対象数上限の増大により,45.4%以上の境界APを達成した。
LVIS Challenge 2021のテストデータでは、第1位、第48.1%のAPを達成した。
APr 47.5%はAPf 48.0%に非常に閉じている。
関連論文リスト
- Ensemble of ConvNeXt V2 and MaxViT for Long-Tailed CXR Classification with View-Based Aggregation [0.13154296174423616]
我々は,MICCAI 2024 CXR-LTチャレンジのソリューションを提案し,Subtask 2と5で4位,Subtask 1では5位となった。
胸部X線データセットを用いて事前訓練したConvNeXt V2およびMaxViTモデルのアンサンブルを用いて,胸部所見の長期分布に対処した。
論文 参考訳(メタデータ) (2024-10-14T16:49:14Z) - TopoMaskV2: Enhanced Instance-Mask-Based Formulation for the Road Topology Problem [3.59986669039879]
TopoMaskは、センターライン予測を強化する新しいアプローチである。
本稿では,フロー情報を用いたマスクインスタンスの強化を目的とした,クワッド指向ラベル表現を提案する。
TopoMaskはOpenLane-V2データセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-17T16:22:38Z) - An Efficient MLP-based Point-guided Segmentation Network for Ore Images
with Ambiguous Boundary [12.258442550351178]
本稿では,エッジバーリングの問題を解決することを目的とした,MLP(Multi-Layer Perceptron)に基づく軽量フレームワークを提案する。
提案手法は, 73MBのモデルサイズで, 毎秒27フレーム以上の処理速度を実現する。
提案手法は,性能スコアが60.4,48.9 in$AP_50box$と$AP_50mask$の順に高い精度を提供する。
論文 参考訳(メタデータ) (2024-02-27T10:09:29Z) - The Surprising Effectiveness of Skip-Tuning in Diffusion Sampling [78.6155095947769]
Skip-Tuningは、スキップ接続上でシンプルだが驚くほど効果的にトレーニング不要なチューニング方法である。
ImageNet 64 では 19 NFE (1.75) で事前訓練された EDM に対して100% FID の改善が可能である。
Skip-Tuningは画素空間におけるスコアマッチング損失を増加させる一方、特徴空間における損失は減少する。
論文 参考訳(メタデータ) (2024-02-23T08:05:23Z) - The Second-place Solution for CVPR VISION 23 Challenge Track 1 -- Data
Effificient Defect Detection [3.4853769431047907]
データ有効欠陥検出のためのビジョンチャレンジトラック1は、競合相手がデータ不足の環境で14の産業検査データセットを例示する必要がある。
この課題に対して、Aoi-overfiting-Teamチームの技術詳細を紹介します。
論文 参考訳(メタデータ) (2023-06-25T03:37:02Z) - The Devil is in the Points: Weakly Semi-Supervised Instance Segmentation
via Point-Guided Mask Representation [61.027468209465354]
本稿では,ポイントラベル付き弱半教師付きインスタンスセグメンテーション(WSSIS)という新しい学習手法を提案する。
本稿では、予算に優しいポイントラベルを強力な弱監督源として効果的に活用できるWSSISの手法を提案する。
我々はCOCOとBDD100Kデータセットの広範な実験を行い、提案手法は完全な教師付きモデルのデータセットに匹敵する有望な結果を得る。
論文 参考訳(メタデータ) (2023-03-27T10:11:22Z) - Blind Face Restoration: Benchmark Datasets and a Baseline Model [63.053331687284064]
Blind Face Restoration (BFR) は、対応する低品質 (LQ) 入力から高品質 (HQ) の顔画像を構築することを目的としている。
EDFace-Celeb-1M (BFR128) と EDFace-Celeb-150K (BFR512) と呼ばれる2つのブラインドフェイス復元ベンチマークデータセットを最初に合成する。
最先端の手法は、ブラー、ノイズ、低解像度、JPEG圧縮アーティファクト、それらの組み合わせ(完全な劣化)の5つの設定でベンチマークされる。
論文 参考訳(メタデータ) (2022-06-08T06:34:24Z) - SEA: Bridging the Gap Between One- and Two-stage Detector Distillation
via SEmantic-aware Alignment [76.80165589520385]
細粒度情報を抽象化する性質から,SEA (SEmantic-Aware Alignment) 蒸留法を命名した。
1段検出器と2段検出器の両方において、挑戦的な物体検出タスクにおいて、最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2022-03-02T04:24:05Z) - Dense Gaussian Processes for Few-Shot Segmentation [66.08463078545306]
本稿では,高密度ガウス過程(GP)回帰に基づく数発のセグメンテーション法を提案する。
GPの高次元出力空間を学習するために,提案手法のエンドツーエンド学習機能を利用する。
提案手法では,PASCAL-5$i$とCOCO-20$i$のベンチマークで,1ショットと5ショットのFSSをそれぞれ新たな最先端に設定する。
論文 参考訳(メタデータ) (2021-10-07T17:57:54Z) - RefineMask: Towards High-Quality Instance Segmentation with Fine-Grained
Features [53.71163467683838]
RefineMaskは、オブジェクトやシーンの高品質なインスタンスセグメンテーションのための新しい方法です。
インスタンス毎のセグメンテーションプロセス中に粒度の細かい機能を多段階的に組み込む。
以前のほとんどのメソッドで過剰にスムースされたオブジェクトの曲がった部分のようなハードケースをセグメンテーションすることに成功します。
論文 参考訳(メタデータ) (2021-04-17T15:09:20Z) - 1st Place Solution of LVIS Challenge 2020: A Good Box is not a Guarantee
of a Good Mask [23.786904438486758]
この記事では、LVIS Challenge 2020のチーム向けlvisTravelerのソリューションを紹介します。
本稿では,LVISデータセットの特徴として,長期分布と高品質なインスタンスセグメンテーションマスクの2つの特徴について考察する。
We achieve 41.5 and 41.2 AP on LVIS v1.0 val and test-dev splits respectively, out the baseline based on X101-FPN-MaskRCNN by a wide margin。
論文 参考訳(メタデータ) (2020-09-03T10:09:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。