論文の概要: BoxTeacher: Exploring High-Quality Pseudo Labels for Weakly Supervised
Instance Segmentation
- arxiv url: http://arxiv.org/abs/2210.05174v1
- Date: Tue, 11 Oct 2022 06:23:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 16:13:28.751454
- Title: BoxTeacher: Exploring High-Quality Pseudo Labels for Weakly Supervised
Instance Segmentation
- Title(参考訳): BoxTeacher: 弱修正インスタンスセグメンテーションのための高品質な擬似ラベルの探索
- Authors: Tianheng Cheng and Xinggang Wang and Shaoyu Chen and Qian Zhang and
Wenyu Liu
- Abstract要約: BoxTeacherは、高性能に教師付きされたインスタンスセグメンテーションのための効率的でエンドツーエンドのトレーニングフレームワークである。
疑似マスクの質を推定するために,マスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスを適応的に最適化する。
- 参考スコア(独自算出の注目度): 33.64088504387974
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Labeling objects with pixel-wise segmentation requires a huge amount of human
labor compared to bounding boxes. Most existing methods for weakly supervised
instance segmentation focus on designing heuristic losses with priors from
bounding boxes. While, we find that box-supervised methods can produce some
fine segmentation masks and we wonder whether the detectors could learn from
these fine masks while ignoring low-quality masks. To answer this question, we
present BoxTeacher, an efficient and end-to-end training framework for
high-performance weakly supervised instance segmentation, which leverages a
sophisticated teacher to generate high-quality masks as pseudo labels.
Considering the massive noisy masks hurt the training, we present a mask-aware
confidence score to estimate the quality of pseudo masks, and propose the
noise-aware pixel loss and noise-reduced affinity loss to adaptively optimize
the student with pseudo masks. Extensive experiments can demonstrate
effectiveness of the proposed BoxTeacher. Without bells and whistles,
BoxTeacher remarkably achieves $34.4$ mask AP and $35.4$ mask AP with ResNet-50
and ResNet-101 respectively on the challenging MS-COCO dataset, which
outperforms the previous state-of-the-art methods by a significant margin. The
code and models are available at \url{https://github.com/hustvl/BoxTeacher}.
- Abstract(参考訳): ピクセル単位のセグメンテーションでオブジェクトをラベリングするには、バウンディングボックスに比べて大量の人的労力が必要です。
弱教師付きインスタンスセグメンテーションのための既存の方法のほとんどは、境界ボックスから先行してヒューリスティックな損失を設計することに焦点を当てている。
しかし、箱詰めの方法が細かなセグメンテーションマスクを生成できることがわかり、低品質のマスクを無視しながら、検出器がこれらのファインマスクから学べるかどうか疑問に思う。
そこで本研究では,高能率な教師付きインスタンスセグメンテーションのための,効率的かつエンドツーエンドのトレーニングフレームワークであるBoxTeacherを提案する。
本研究では,仮マスクの品質を推定するためのマスク認識信頼度スコアを提示し,ノイズ認識画素損失とノイズ低減アフィニティ損失を提案し,学生に仮マスクを適応させる。
広範な実験により,boxteacherの有効性が示された。
ベルとホイッスルがなければ、boxteacherは、挑戦的なms-cocoデータセット上でそれぞれ34.4$ mask apと35.4$ mask apを達成し、resnet-50とresnet-101でそれぞれ35.4$ mask apを達成した。
コードとモデルは \url{https://github.com/hustvl/BoxTeacher} で公開されている。
関連論文リスト
- Downstream Task Guided Masking Learning in Masked Autoencoders Using
Multi-Level Optimization [42.82742477950748]
Masked Autoencoder (MAE) は視覚表現学習における自己教師付き事前学習のための重要な手法である。
プリトレーニング中に最適なマスキング戦略を学習する新しいフレームワークであるMulti-level Optimized Mask Autoencoder (MLO-MAE)を紹介する。
視覚表現学習におけるMLO-MAEの進歩について検討した。
論文 参考訳(メタデータ) (2024-02-28T07:37:26Z) - What You See is What You Classify: Black Box Attributions [61.998683569022006]
我々は、トレーニング済みのブラックボックス分類器であるExpplanandumの属性を予測するために、ディープネットワークであるExplainerを訓練する。
既存のほとんどのアプローチとは異なり、我々の手法はクラス固有のマスクを直接生成することができる。
我々の属性は、視覚的および定量的に確立された方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-23T12:30:04Z) - Mask Transfiner for High-Quality Instance Segmentation [95.74244714914052]
高品質で効率的なインスタンスセグメンテーションのためのMask Transfinerを提案する。
当社のアプローチでは, エラーが発生しやすい木ノードを検出し, エラーを並列に自己修正する。
私たちのコードとトレーニングされたモデルは、http://vis.xyz/pub/transfiner.comで公開されます。
論文 参考訳(メタデータ) (2021-11-26T18:58:22Z) - Open-Vocabulary Instance Segmentation via Robust Cross-Modal
Pseudo-Labeling [61.03262873980619]
Open-vocabularyのインスタンスセグメンテーションは、マスクアノテーションなしで新しいクラスをセグメンテーションすることを目的としている。
本研究では,字幕内の単語の意味を画像中のオブジェクトマスクの視覚的特徴と整合させることで,擬似マスクの訓練を行うクロスモーダルな擬似ラベルフレームワークを提案する。
我々のフレームワークは、生徒の自己学習のための単語意味論を通じて、キャプションに新しいクラスをラベル付けすることができる。
論文 参考訳(メタデータ) (2021-11-24T18:50:47Z) - Mask is All You Need: Rethinking Mask R-CNN for Dense and
Arbitrary-Shaped Scene Text Detection [11.390163890611246]
Mask R-CNNは、任意の形のシーンテキストの検出とスポッティングのための強力なベースラインとして広く採用されている。
1つの提案には複数のインスタンスが存在する可能性があるため、マスクヘッドが異なるインスタンスを区別し、パフォーマンスを劣化させるのが難しくなる。
本稿では,各画素をテキストや非テキストに分類するのではなく,マスクヘッドがインスタンス全体の形状を予測することを学習する事例認識型マスク学習を提案する。
論文 参考訳(メタデータ) (2021-09-08T04:32:29Z) - Box-Adapt: Domain-Adaptive Medical Image Segmentation using Bounding
BoxSupervision [52.45336255472669]
深層学習のための弱教師付きドメイン適応設定を提案する。
Box-Adaptは、ソースドメインのきめ細かいセグナオンマスクとターゲットドメインの弱いバウンディングボックスを完全に探索する。
肝セグメンテーションにおける本手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-08-19T01:51:04Z) - Learning Class-Agnostic Pseudo Mask Generation for Box-Supervised
Semantic Segmentation [156.9155100983315]
ボックス教師付きセマンティクスセグメンテーションに合わせた,より正確な学習ベースのクラス非依存な擬似マスクジェネレータを求める。
この方法は、ボックス監視モデルとフル監視モデルの間のパフォーマンスギャップをさらに埋めることができます。
論文 参考訳(メタデータ) (2021-03-09T14:54:54Z) - BoxInst: High-Performance Instance Segmentation with Box Annotations [102.10713189544947]
本稿では,トレーニング用バウンディングボックスアノテーションのみを用いて,マスクレベルのインスタンスセグメンテーションを実現する高性能な手法を提案する。
私たちの中核となる考え方は、セグメンテーションネットワーク自体を変更することなく、インスタンスセグメンテーションにおける学習マスクの喪失を活用することです。
論文 参考訳(メタデータ) (2020-12-03T22:27:55Z) - Prior to Segment: Foreground Cues for Weakly Annotated Classes in
Partially Supervised Instance Segmentation [3.192503074844774]
部分教師付きインスタンスセグメンテーションは、より豊富な弱いボックスラベルを利用することで、限られたマスクラベルによるマスク予測を改善することを目的としている。
部分教師付きインスタンスセグメンテーションで一般的に使用されるクラス非依存マスクヘッドは,弱アノテーションクラスに対する一般的な前景概念の学習が困難であることを示す。
我々は,すべてのクラスを監督するボックス分類ヘッドによって暗黙的に学習される前景の一般的な概念をマスクヘッドに提供する,OMP(object mask prior)を導入する。
論文 参考訳(メタデータ) (2020-11-23T23:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。