論文の概要: Single-Stage Open-world Instance Segmentation with Cross-task
Consistency Regularization
- arxiv url: http://arxiv.org/abs/2208.09023v1
- Date: Thu, 18 Aug 2022 18:55:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-22 17:07:19.971832
- Title: Single-Stage Open-world Instance Segmentation with Cross-task
Consistency Regularization
- Title(参考訳): クロスタスク一貫性規則化によるシングルステージオープンワールドインスタンスセグメンテーション
- Authors: Xizhe Xue and Dongdong Yu and Lingqiao Liu and Yu Liu and Ying Li and
Zehuan Yuan and Ping Song and Mike Zheng Shou
- Abstract要約: オープンワールドのインスタンスセグメンテーションは、イメージからクラスに依存しないインスタンスをセグメントすることを目的としている。
本稿では,各インスタンスのマスクを直接生成する単一ステージフレームワークを提案する。
提案手法は, 完全教師付き設定と半教師付き設定の両方において, 印象的な結果が得られることを示す。
- 参考スコア(独自算出の注目度): 33.434628514542375
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-world instance segmentation (OWIS) aims to segment class-agnostic
instances from images, which has a wide range of real-world applications such
as autonomous driving. Most existing approaches follow a two-stage pipeline:
performing class-agnostic detection first and then class-specific mask
segmentation. In contrast, this paper proposes a single-stage framework to
produce a mask for each instance directly. Also, instance mask annotations
could be noisy in the existing datasets; to overcome this issue, we introduce a
new regularization loss. Specifically, we first train an extra branch to
perform an auxiliary task of predicting foreground regions (i.e. regions
belonging to any object instance), and then encourage the prediction from the
auxiliary branch to be consistent with the predictions of the instance masks.
The key insight is that such a cross-task consistency loss could act as an
error-correcting mechanism to combat the errors in annotations. Further, we
discover that the proposed cross-task consistency loss can be applied to images
without any annotation, lending itself to a semi-supervised learning method.
Through extensive experiments, we demonstrate that the proposed method can
achieve impressive results in both fully-supervised and semi-supervised
settings. Compared to SOTA methods, the proposed method significantly improves
the $AP_{100}$ score by 4.75\% in UVO$\rightarrow$UVO setting and 4.05\% in
COCO$\rightarrow$UVO setting. In the case of semi-supervised learning, our
model learned with only 30\% labeled data, even outperforms its
fully-supervised counterpart with 50\% labeled data. The code will be released
soon.
- Abstract(参考訳): open-world instance segmentation(owis)は、クラスに依存しないインスタンスをイメージからセグメンテーションすることを目的としている。
既存のアプローチのほとんどは、2段階のパイプラインに従っている:まずクラスに依存しない検出を行い、次にクラス固有のマスクセグメンテーションを実行する。
一方,本論文では,各インスタンスのマスクを直接生成する単一ステージフレームワークを提案する。
また、既存のデータセットではインスタンスマスクアノテーションがうるさくなり、この問題を克服するために、新たな正規化損失を導入します。
具体的には、まず、前景領域(例えば、任意のオブジェクトインスタンスに属する領域)を予測する補助タスクを実行するために余分なブランチを訓練し、次に、補助ブランチからの予測をインスタンスマスクの予測と整合するように促す。
重要な洞察は、このようなタスク間の一貫性の損失は、アノテーションのエラーに対処するエラー修正メカニズムとして機能する可能性があるということです。
さらに,提案するクロスタスク一貫性の損失は,半教師付き学習手法に自らを貸与することで,画像に適用できることがわかった。
広範にわたる実験により,提案手法は完全教師付き設定と半教師付き設定の両方において印象的な結果が得られることを示した。
提案手法は, sota法と比較して, uvo$\rightarrow$uvo設定で$ap_{100}$スコアを4.75\%, coco$\rightarrow$uvo設定で4.05\%向上させた。
半教師付き学習の場合、モデルはラベル付きデータはわずか30\%で学習し、50\%のラベル付きデータで完全に教師付き学習モデルよりも優れています。
コードはまもなくリリースされる。
関連論文リスト
- Task-customized Masked AutoEncoder via Mixture of Cluster-conditional
Experts [104.9871176044644]
Masked Autoencoder (MAE) は,モデル事前学習において有望な結果が得られる自己教師型学習手法である。
我々は、新しいMAEベースの事前学習パラダイム、Mixture of Cluster-conditional Experts (MoCE)を提案する。
MoCEは、クラスタ条件ゲートを使用して、各専門家にセマンティックなイメージのみをトレーニングする。
論文 参考訳(メタデータ) (2024-02-08T03:46:32Z) - One-bit Supervision for Image Classification: Problem, Solution, and
Beyond [114.95815360508395]
本稿では,ラベルの少ない新しい学習環境である,画像分類のための1ビット監督について述べる。
多段階学習パラダイムを提案し、負ラベル抑圧を半教師付き半教師付き学習アルゴリズムに組み込む。
複数のベンチマークにおいて、提案手法の学習効率は、フルビットの半教師付き監視手法よりも優れている。
論文 参考訳(メタデータ) (2023-11-26T07:39:00Z) - Rethinking Multiple Instance Learning for Whole Slide Image Classification: A Good Instance Classifier is All You Need [18.832471712088353]
MIL設定下では,インスタンスレベルの弱教師付きコントラスト学習アルゴリズムを初めて提案する。
また,プロトタイプ学習による正確な擬似ラベル生成手法を提案する。
論文 参考訳(メタデータ) (2023-07-05T12:44:52Z) - Multi-Level Contrastive Learning for Dense Prediction Task [59.591755258395594]
本稿では,高密度予測タスクのための領域レベルの特徴表現を効率よく学習するための,MCL(Multi-Level Contrastive Learning for Dense Prediction Task)を提案する。
本手法は, 局所化, スケールの整合性, 認識の3つの要因に動機付けられている。
提案手法は,様々なデータセットにおける最近の最先端の手法よりも有意なマージンを有する。
論文 参考訳(メタデータ) (2023-04-04T17:59:04Z) - MaskDiff: Modeling Mask Distribution with Diffusion Probabilistic Model
for Few-Shot Instance Segmentation [31.648523213206595]
少数ショットのインスタンスセグメンテーションは、数ショットの学習パラダイムをインスタンスセグメンテーションタスクに拡張する。
従来のアプローチでは、ポイント推定と呼ばれるプロトタイプ学習を通じてその課題に対処しようと試みてきた。
本稿では,二項マスクの条件分布をモデル化したMaskDiffという新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-09T08:24:02Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - FreeSOLO: Learning to Segment Objects without Annotations [191.82134817449528]
我々は,単純なインスタンスセグメンテーションメソッドSOLO上に構築された自己教師型インスタンスセグメンテーションフレームワークであるFreeSOLOを紹介する。
また,本手法では,複雑なシーンからオブジェクトを教師なしで検出する,新たなローカライズ対応事前学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-24T16:31:44Z) - Structure-Consistent Weakly Supervised Salient Object Detection with
Local Saliency Coherence [14.79639149658596]
本論文では,スクリブルアノテーションによる弱監督オブジェクト検出のための1ラウンドのエンドツーエンドトレーニング手法を提案する。
6つのベンチマークで最新のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2020-12-08T12:49:40Z) - Deep Semi-supervised Knowledge Distillation for Overlapping Cervical
Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。
摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。
実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-21T13:27:09Z) - EOLO: Embedded Object Segmentation only Look Once [0.0]
3つの独立したブランチで概念的にシンプルであり、完全に畳み込み可能で、モバイルや組み込みデバイスに簡単に組み込むことができるアンカーフリーでシングルショットのインスタンスセグメンテーション手法を導入する。
EOLOと呼ばれる本手法では,各画素のインスタンス中心分類と4次元距離回帰により,意味的セグメンテーションを予測し,重なり合うオブジェクト問題を区別するものとして,インスタンス分割問題を再構成する。
ベルとホイッスルがなければ、EOLOはIoU50の下で27.7$%のマスクmAPを獲得し、1080Ti GPU上で30FPSに達し、シングルモデルとシングルスケールのトレーニング/テストが可能である。
論文 参考訳(メタデータ) (2020-03-31T21:22:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。