論文の概要: DiscoBox: Weakly Supervised Instance Segmentation and Semantic
Correspondence from Box Supervision
- arxiv url: http://arxiv.org/abs/2105.06464v1
- Date: Thu, 13 May 2021 17:59:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-14 14:05:35.770632
- Title: DiscoBox: Weakly Supervised Instance Segmentation and Semantic
Correspondence from Box Supervision
- Title(参考訳): discobox: 弱い教師付きインスタンスセグメンテーションとボックス監督からのセマンティック対応
- Authors: Shiyi Lan, Zhiding Yu, Christopher Choy, Subhashree Radhakrishnan,
Guilin Liu, Yuke Zhu, Larry S. Davis, Anima Anandkumar
- Abstract要約: バウンディングボックスによるインスタンスセグメンテーションとセマンティック対応を共同学習する新しいフレームワークであるDiscoBoxを紹介します。
教師は、箱内と箱内の両方の画素関係をモデル化するために、ペアワイズ電位とクロスイメージ電位を組み込んだ構造化エネルギーモデルである。
教師のエネルギーを最小化することは、洗練されたオブジェクトマスクとクラス内のオブジェクト間の密接な対応を同時に生み出す。
- 参考スコア(独自算出の注目度): 98.25918224571132
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce DiscoBox, a novel framework that jointly learns instance
segmentation and semantic correspondence using bounding box supervision.
Specifically, we propose a self-ensembling framework where instance
segmentation and semantic correspondence are jointly guided by a structured
teacher in addition to the bounding box supervision. The teacher is a
structured energy model incorporating a pairwise potential and a cross-image
potential to model the pairwise pixel relationships both within and across the
boxes. Minimizing the teacher energy simultaneously yields refined object masks
and dense correspondences between intra-class objects, which are taken as
pseudo-labels to supervise the task network and provide positive/negative
correspondence pairs for dense constrastive learning. We show a symbiotic
relationship where the two tasks mutually benefit from each other. Our best
model achieves 37.9% AP on COCO instance segmentation, surpassing prior weakly
supervised methods and is competitive to supervised methods. We also obtain
state of the art weakly supervised results on PASCAL VOC12 and PF-PASCAL with
real-time inference.
- Abstract(参考訳): 本稿では,バウンディングボックスを用いたインスタンスセグメンテーションとセマンティクス対応を共同で学習する新しいフレームワークであるdiscoboxを紹介する。
具体的には,境界ボックスの監督に加えて,インスタンスセグメンテーションと意味対応を構造化教師が共同で指導する自己センシングフレームワークを提案する。
教師は、箱内と箱内の両方の画素関係をモデル化するために、ペアワイズ電位とクロスイメージ電位を組み込んだ構造化エネルギーモデルである。
教師のエネルギーの最小化は、タスクネットワークを監督するために擬似ラベルとして扱われるクラス内オブジェクト間の洗練されたオブジェクトマスクと密接な対応を同時に生成し、密集的学習のための正/負の対応ペアを提供する。
2つの課題が相互に利益を享受する共生関係を示す。
我々の最良のモデルは、COCOインスタンスのセグメンテーションにおいて37.9%のAPを達成し、以前の弱い教師付き手法を超越し、教師付き手法と競合する。
また,PASCAL VOC12 と PF-PASCAL に対して,リアルタイムの推論で弱教師付きの結果が得られた。
関連論文リスト
- Extreme Point Supervised Instance Segmentation [28.191795758445352]
本稿では,各オブジェクトの極端点,左極端点,最下極点,右極端点を用いて,インスタンスセグメンテーションを学習するための新しいアプローチを提案する。
これらの点は、正確なセグメンテーションのための強力な手がかりを提供しながら、現代のバウンディングボックスアノテーションプロセスで容易に利用可能である。
本モデルでは,対象物を複数の部品に分けた場合に高品質なマスクを生成する。
論文 参考訳(メタデータ) (2024-05-31T09:37:39Z) - Solve the Puzzle of Instance Segmentation in Videos: A Weakly Supervised
Framework with Spatio-Temporal Collaboration [13.284951215948052]
ビデオにおけるtextbfS-patiotextbfTemporal textbfClaboration の例を示す。
提案手法は,TrackR-CNN と MaskTrack R-CNN の完全教師付き性能よりも優れる。
論文 参考訳(メタデータ) (2022-12-15T02:44:13Z) - Weakly Supervised Semantic Segmentation via Alternative Self-Dual
Teaching [82.71578668091914]
本稿では,分類とマスク・リファインメント・コンポーネントを統合された深層モデルに組み込む,コンパクトな学習フレームワークを確立する。
本稿では,高品質な知識相互作用を促進するために,新たな自己双対学習(ASDT)機構を提案する。
論文 参考訳(メタデータ) (2021-12-17T11:56:56Z) - Point Cloud Instance Segmentation with Semi-supervised Bounding-Box
Mining [17.69745159912481]
ラベル付きおよび未ラベルのバウンディングボックスを監視として使用した,最初の半教師付きポイントクラウドインスタンスセグメンテーションフレームワーク(SPIB)を紹介した。
提案手法は,近年の完全教師付き手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2021-11-30T08:40:40Z) - Simpler Does It: Generating Semantic Labels with Objectness Guidance [32.81128493853064]
本稿では、画像のトレーニングのための擬似ラベルを生成する新しいフレームワークについて述べる。
擬似ラベルを生成するには、(i)オブジェクトライクな領域を認識することを学習するクラス非依存のオブジェクトネスネットワーク、(ii)イメージレベルまたはバウンディングボックスアノテーションのいずれからの情報を組み合わせる。
本研究では,対象性ネットワークを自然に活用して,未知のカテゴリに対して対象のような領域を生成する方法を示すことによって,アプローチの有効性を示す。
論文 参考訳(メタデータ) (2021-10-20T01:52:05Z) - Modelling Neighbor Relation in Joint Space-Time Graph for Video
Correspondence Learning [53.74240452117145]
本稿では、ラベルなしビデオから信頼できる視覚対応を学習するための自己教師付き手法を提案する。
接続時空間グラフでは,ノードがフレームからサンプリングされたグリッドパッチであり,2種類のエッジによってリンクされる。
学習した表現は、様々な視覚的タスクにおいて最先端の自己監督手法よりも優れています。
論文 参考訳(メタデータ) (2021-09-28T05:40:01Z) - Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised
Semantic Segmentation [88.49669148290306]
そこで我々はAuxSegNetと呼ばれる弱教師付きマルチタスク・フレームワークを提案し,サリエンシ検出とマルチラベル画像分類を補助タスクとして活用する。
同様の構造的セマンティクスに着想を得て,サリエンシとセグメンテーションの表現から,クロスタスクなグローバル画素レベルの親和性マップを学習することを提案する。
学習されたクロスタスク親和性は、両方のタスクに対して改善された擬似ラベルを提供するために、唾液度予測を洗練し、CAMマップを伝播するために使用することができる。
論文 参考訳(メタデータ) (2021-07-25T11:39:58Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z) - Weakly-Supervised Semantic Segmentation by Iterative Affinity Learning [86.45526827323954]
弱教師付きセマンティックセグメンテーションは、トレーニングのためにピクセル単位のラベル情報が提供されないため、難しい課題である。
このようなペア関係を学習するための反復アルゴリズムを提案する。
本稿では,提案アルゴリズムが最先端手法に対して好適に動作することを示す。
論文 参考訳(メタデータ) (2020-02-19T10:32:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。