論文の概要: Competing for pixels: a self-play algorithm for weakly-supervised segmentation
- arxiv url: http://arxiv.org/abs/2405.16628v1
- Date: Sun, 26 May 2024 17:00:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-28 20:09:48.148268
- Title: Competing for pixels: a self-play algorithm for weakly-supervised segmentation
- Title(参考訳): ピクセルの競合:弱教師付きセグメンテーションのためのセルフプレイアルゴリズム
- Authors: Shaheer U. Saeed, Shiqi Huang, João Ramalhinho, Iani J. M. B. Gayo, Nina Montaña-Brown, Ester Bonmati, Stephen P. Pereira, Brian Davidson, Dean C. Barratt, Matthew J. Clarkson, Yipeng Hu,
- Abstract要約: 本稿では,領域のイメージセグメンテーションをゲーミフィケーションする新しいWSS手法を提案する。
エージェントは、これらのパッチが枯渇するまでROIを含むパッチを選択します。
この競争的な設定により、過剰または過小区分の最小化が保証される。
- 参考スコア(独自算出の注目度): 7.416217935677032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly-supervised segmentation (WSS) methods, reliant on image-level labels indicating object presence, lack explicit correspondence between labels and regions of interest (ROIs), posing a significant challenge. Despite this, WSS methods have attracted attention due to their much lower annotation costs compared to fully-supervised segmentation. Leveraging reinforcement learning (RL) self-play, we propose a novel WSS method that gamifies image segmentation of a ROI. We formulate segmentation as a competition between two agents that compete to select ROI-containing patches until exhaustion of all such patches. The score at each time-step, used to compute the reward for agent training, represents likelihood of object presence within the selection, determined by an object presence detector pre-trained using only image-level binary classification labels of object presence. Additionally, we propose a game termination condition that can be called by either side upon exhaustion of all ROI-containing patches, followed by the selection of a final patch from each. Upon termination, the agent is incentivised if ROI-containing patches are exhausted or disincentivised if an ROI-containing patch is found by the competitor. This competitive setup ensures minimisation of over- or under-segmentation, a common problem with WSS methods. Extensive experimentation across four datasets demonstrates significant performance improvements over recent state-of-the-art methods. Code: https://github.com/s-sd/spurl/tree/main/wss
- Abstract(参考訳): 弱教師付きセグメンテーション (WSS) 法は、対象の存在を示す画像レベルのラベルに依存し、ラベルと関心領域(ROI)との明確な対応が欠如しており、重大な課題となっている。
それにもかかわらず、WSSメソッドは、完全に教師されたセグメンテーションに比べて、アノテーションコストがはるかに低いため、注目を集めている。
強化学習(RL)の自己プレーを活用することで、ROIのイメージセグメンテーションをゲーミフィケーションする新しいWSS手法を提案する。
我々は、これらのパッチが枯渇するまでROIを含むパッチを選択しようとする2つのエージェント間の競合としてセグメンテーションを定式化する。
エージェントトレーニングの報酬を計算するために使用される各タイムステップのスコアは、対象存在のイメージレベルのバイナリ分類ラベルのみを用いて事前訓練された対象存在検知器によって決定された、選択中の対象存在の確率を表す。
さらに,すべてのROIを含むパッチが枯渇すると,各パッチから最終パッチが選択され,双方で呼び出すことができるゲーム終了条件を提案する。
終了すると、競合相手によってROI含有パッチが検出された場合、ROI含有パッチが消毒された場合、または消毒された場合には、エージェントのインセンティブが付与される。
この競合的な設定により、WSSメソッドの一般的な問題であるオーバーセグメンテーションやアンダーセグメンテーションの最小化が保証されます。
4つのデータセットにわたる大規模な実験は、最近の最先端の手法よりも大幅なパフォーマンス向上を示している。
コード:https://github.com/s-sd/spurl/tree/main/wss
関連論文リスト
- AgMTR: Agent Mining Transformer for Few-shot Segmentation in Remote Sensing [12.91626624625134]
Few-shot (FSS) は、関心のあるオブジェクトを少数のラベル付きサンプル(つまりサポートイメージ)でクエリイメージに分割することを目的としている。
以前のスキームでは、サポートクエリのピクセルペア間の類似性を利用して、ピクセルレベルのセマンティックな相関を構築していた。
極端にクラス内変異や乱雑な背景を持つリモートセンシングシナリオでは、そのようなピクセルレベルの相関が大きなミスマッチを引き起こす可能性がある。
本稿では,エージェントレベルの意味的相関を構築するために,一組の局所認識エージェントを適応的にマイニングする新しいエージェントマイニングトランス (AgMTR) を提案する。
論文 参考訳(メタデータ) (2024-09-26T01:12:01Z) - Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - Boundary-RL: Reinforcement Learning for Weakly-Supervised Prostate
Segmentation in TRUS Images [8.057488225592605]
弱教師付きセグメンテーション手法であるBundary-RLを提案する。
セグメント化は,従来のような画素レベルの分類ではなく,境界検出問題として想定される。
特に超音波画像では、強度値が境界間の音響インピーダンスの差を表す場合、境界線法(英語版)の利点もある。
論文 参考訳(メタデータ) (2023-08-22T12:02:05Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z) - Cross-domain Speech Recognition with Unsupervised Character-level
Distribution Matching [60.8427677151492]
2つの領域における各文字間の微粒化適応を行うための文字レベルの分布マッチング手法であるCMatchを提案する。
Libri-Adaptデータセットを用いた実験の結果,提案手法はクロスデバイスとクロス環境の両方で14.39%,16.50%の単語誤り率(WER)を低減できることがわかった。
論文 参考訳(メタデータ) (2021-04-15T14:36:54Z) - Find it if You Can: End-to-End Adversarial Erasing for Weakly-Supervised
Semantic Segmentation [6.326017213490535]
本稿では,注目マップの逆消去の新たな定式化を提案する。
提案手法はサリエンシマスクを必要とせず, 注意マップの識別対象領域への拡散を防止するために, 正規化損失を用いる。
パスカルVOCデータセットを用いた実験により, 従来と比べ2.1mIoU, 1.0mIoUのセグメンテーション性能が向上することが示された。
論文 参考訳(メタデータ) (2020-11-09T18:35:35Z) - 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation [116.25081559037872]
この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
論文 参考訳(メタデータ) (2020-03-17T06:45:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。