論文の概要: Reinforced active learning for image segmentation
- arxiv url: http://arxiv.org/abs/2002.06583v1
- Date: Sun, 16 Feb 2020 14:03:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 18:17:56.887589
- Title: Reinforced active learning for image segmentation
- Title(参考訳): 画像分割のための強化アクティブラーニング
- Authors: Arantxa Casanova, Pedro O. Pinheiro, Negar Rostamzadeh, Christopher J.
Pal
- Abstract要約: 深部強化学習(RL)に基づく意味的セグメンテーションのための新しいアクティブラーニング戦略を提案する。
エージェントは、ラベルなしデータのプールからラベル付けされる小さな情報領域(画像全体とは対照的に)のサブセットを選択するポリシーを学ぶ。
本手法では, 意味的セグメンテーション問題の大規模性質に適応して, 能動的学習のための深部Q-network (DQN) の定式化を新たに提案する。
- 参考スコア(独自算出の注目度): 34.096237671643145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning-based approaches for semantic segmentation have two inherent
challenges. First, acquiring pixel-wise labels is expensive and time-consuming.
Second, realistic segmentation datasets are highly unbalanced: some categories
are much more abundant than others, biasing the performance to the most
represented ones. In this paper, we are interested in focusing human labelling
effort on a small subset of a larger pool of data, minimizing this effort while
maximizing performance of a segmentation model on a hold-out set. We present a
new active learning strategy for semantic segmentation based on deep
reinforcement learning (RL). An agent learns a policy to select a subset of
small informative image regions -- opposed to entire images -- to be labeled,
from a pool of unlabeled data. The region selection decision is made based on
predictions and uncertainties of the segmentation model being trained. Our
method proposes a new modification of the deep Q-network (DQN) formulation for
active learning, adapting it to the large-scale nature of semantic segmentation
problems. We test the proof of concept in CamVid and provide results in the
large-scale dataset Cityscapes. On Cityscapes, our deep RL region-based DQN
approach requires roughly 30% less additional labeled data than our most
competitive baseline to reach the same performance. Moreover, we find that our
method asks for more labels of under-represented categories compared to the
baselines, improving their performance and helping to mitigate class imbalance.
- Abstract(参考訳): セマンティックセグメンテーションのための学習ベースのアプローチには、2つの固有の課題がある。
まず、ピクセル単位のラベルの取得は高価で時間を要する。
第二に、現実的なセグメンテーションデータセットは、非常に不均衡である。いくつかのカテゴリは、他のカテゴリよりもはるかに多く、最も代表されるデータセットにパフォーマンスをバイアスする。
本稿では,データプールの小さなサブセットに人間のラベル付けの取り組みを集中させることに興味を持ち,この取り組みを最小化するとともに,セグメンテーションモデルの性能を最大化する。
深層強化学習(RL)に基づく意味的セグメンテーションのための新しいアクティブラーニング戦略を提案する。
エージェントは、ラベルのないデータのプールからラベル付けされる小さな情報付き画像領域のサブセット(画像全体とは対照的に)を選択するポリシーを学習する。
地域選択決定は、訓練中のセグメンテーションモデルの予測と不確実性に基づいて行われる。
本手法では, 意味的セグメンテーション問題の大規模性質に適応して, 能動的学習のための深部Q-network (DQN) の定式化を新たに提案する。
我々はCamVidで概念実証を検証し、大規模データセットCityscapesで結果を提供する。
Cityscapesでは、当社のRLリージョンベースのDQNアプローチでは、同じパフォーマンスに達するためには、最も競争力のあるベースラインよりも、ラベル付きデータを約30%削減する必要があります。
さらに,本手法では,ベースラインと比較して表示不足のカテゴリのラベルを多く求め,その性能を改善し,クラス不均衡を緩和する。
関連論文リスト
- Two-Step Active Learning for Instance Segmentation with Uncertainty and
Diversity Sampling [20.982992381790034]
本研究では,不確実性に基づくサンプリングと多様性に基づくサンプリングを統合したポストホック能動学習アルゴリズムを提案する。
提案アルゴリズムは単純で実装が容易なだけでなく,様々なデータセットに対して優れた性能を実現する。
論文 参考訳(メタデータ) (2023-09-28T03:40:30Z) - Few-shot Image Classification based on Gradual Machine Learning [6.935034849731568]
少ないショット画像分類は、ラベル付きサンプルのみを使用してラベル付きイメージを正確に分類することを目的としている。
段階的機械学習(GML)の非i.dパラダイムに基づく新しいアプローチを提案する。
提案手法は精度でSOTAの性能を1-5%向上させることができることを示す。
論文 参考訳(メタデータ) (2023-07-28T12:30:41Z) - Exploring Open-Vocabulary Semantic Segmentation without Human Labels [76.15862573035565]
我々は、既存の事前学習された視覚言語モデル(VL)を利用して意味的セグメンテーションモデルを訓練するZeroSegを提案する。
ZeroSegは、VLモデルで学んだ視覚概念をセグメントトークンの集合に蒸留することでこれを克服し、それぞれが対象画像の局所化領域を要約する。
提案手法は,他のゼロショットセグメンテーション法と比較して,同じトレーニングデータを用いた場合と比較して,最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-01T08:47:06Z) - Semantic Segmentation with Active Semi-Supervised Learning [23.79742108127707]
本稿では,能動的学習と半教師付き学習を組み合わせた新しいアルゴリズムを提案する。
本手法は,ネットワークの性能の95%以上をフルトレーニングセットで取得する。
論文 参考訳(メタデータ) (2022-03-21T04:16:25Z) - Learning What Not to Segment: A New Perspective on Few-Shot Segmentation [63.910211095033596]
近年では、FSS ( few-shot segmentation) が広く開発されている。
本稿では,問題を緩和するための新鮮で直接的な知見を提案する。
提案されたアプローチのユニークな性質を踏まえて、より現実的で挑戦的な設定にまで拡張する。
論文 参考訳(メタデータ) (2022-03-15T03:08:27Z) - Dominant Set-based Active Learning for Text Classification and its
Application to Online Social Media [0.0]
本稿では,最小限のアノテーションコストで大規模未ラベルコーパスのトレーニングを行うための,プールベースのアクティブラーニング手法を提案する。
提案手法には調整すべきパラメータが一切ないため,データセットに依存しない。
本手法は,最先端のアクティブラーニング戦略と比較して高い性能を実現する。
論文 参考訳(メタデータ) (2022-01-28T19:19:03Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Large-scale Unsupervised Semantic Segmentation [163.3568726730319]
本稿では, 大規模無教師付きセマンティックセマンティックセグメンテーション (LUSS) の新たな課題を提案する。
ImageNetデータセットに基づいて、120万のトレーニング画像と40万の高品質なセマンティックセグメンテーションアノテーションを用いた画像Net-Sデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-06T15:02:11Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - The Devil is in Classification: A Simple Framework for Long-tail Object
Detection and Instance Segmentation [93.17367076148348]
本稿では,最新のロングテールLVISデータセットを用いて,最先端の2段階のインスタンスセグメンテーションモデルMask R-CNNの性能低下について検討する。
主な原因は、オブジェクト提案の不正確な分類である。
そこで本研究では,2段階のクラスバランスサンプリング手法により,分類ヘッドバイアスをより効果的に緩和する,簡単な校正フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T12:49:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。