論文の概要: IBoxCLA: Towards Robust Box-supervised Segmentation of Polyp via Improved Box-dice and Contrastive Latent-anchors
- arxiv url: http://arxiv.org/abs/2310.07248v4
- Date: Fri, 13 Sep 2024 15:06:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-16 23:47:01.692578
- Title: IBoxCLA: Towards Robust Box-supervised Segmentation of Polyp via Improved Box-dice and Contrastive Latent-anchors
- Title(参考訳): IBoxCLA: 改良されたボックスダイスとコントラスト遅延アンカーによるポリープのロバストボックス制御セグメンテーションを目指して
- Authors: Zhiwei Wang, Qiang Hu, Hongkuan Shi, Li He, Man He, Wenxuan Dai, Yinjiao Tian, Xin Yang, Mei Liu, Qiang Li,
- Abstract要約: Inproved Box-dice (IBox) とContrastive Latent-Anchors (CLA) は、頑健なボックス管理モデルであるIBoxCLAを訓練するために提案されている。
IBoxは、セグメントマップをシェープデカップリングと混乱領域スワップを使用してプロキシマップに変換する。
CLAは2種類の潜伏アンカーを生成して形状学習に寄与する。
- 参考スコア(独自算出の注目度): 17.176054924619056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Box-supervised polyp segmentation attracts increasing attention for its cost-effective potential. Existing solutions often rely on learning-free methods or pretrained models to laboriously generate pseudo masks, triggering Dice constraint subsequently. In this paper, we found that a model guided by the simplest box-filled masks can accurately predict polyp locations/sizes, but suffers from shape collapsing. In response, we propose two innovative learning fashions, Improved Box-dice (IBox) and Contrastive Latent-Anchors (CLA), and combine them to train a robust box-supervised model IBoxCLA. The core idea behind IBoxCLA is to decouple the learning of location/size and shape, allowing for focused constraints on each of them. Specifically, IBox transforms the segmentation map into a proxy map using shape decoupling and confusion-region swapping sequentially. Within the proxy map, shapes are disentangled, while locations/sizes are encoded as box-like responses. By constraining the proxy map instead of the raw prediction, the box-filled mask can well supervise IBoxCLA without misleading its shape learning. Furthermore, CLA contributes to shape learning by generating two types of latent anchors, which are learned and updated using momentum and segmented polyps to steadily represent polyp and background features. The latent anchors facilitate IBoxCLA to capture discriminative features within and outside boxes in a contrastive manner, yielding clearer boundaries. We benchmark IBoxCLA on five public polyp datasets. The experimental results demonstrate the competitive performance of IBoxCLA compared to recent fully-supervised polyp segmentation methods, and its superiority over other box-supervised state-of-the-arts with a relative increase of overall mDice and mIoU by at least 6.5% and 7.5%, respectively.
- Abstract(参考訳): 箱監督型ポリープセグメンテーションは、そのコスト効果の可能性に注目が集まる。
既存のソリューションは、しばしば学習自由な方法や事前訓練されたモデルに頼り、疑似マスクを熱心に生成し、その後にDiceの制約が引き起こされる。
本稿では,最も単純な箱詰めマスクによって導かれるモデルが,ポリプの位置/サイズを正確に予測できるが,形状の崩壊に悩まされていることを発見した。
そこで我々は,IBox-dice (IBox) とContrastive Latent-Anchors (CLA) の2つの革新的な学習手法を提案し,それらを組み合わせて頑健な箱教師モデル IBoxCLA を訓練する。
IBoxCLAの背景にある基本的な考え方は、位置/サイズと形状の学習を分離し、それぞれに制約を集中させることである。
具体的には、IBoxは分割マップをシェイプデカップリングと混乱領域スワップを用いてプロキシマップに変換する。
プロキシマップ内では、形状が切り離され、場所/サイズがボックスのような応答としてエンコードされる。
ボックス満載マスクは、生の予測ではなくプロキシマップを制約することにより、形状学習を誤解することなく、IBoxCLAを十分に監視することができる。
さらに、CLAは2種類の潜伏アンカーを生成し、モーメントとセグメンテーションポリープを用いて学習・更新し、ポリプとバックグラウンドの特徴を着実に表現することで形状学習に寄与する。
潜伏アンカーは、IBoxCLAが箱内および外部の識別的特徴を対照的に捉え、より明確な境界をもたらす。
IBoxCLAを5つの公開ポリプデータセットでベンチマークする。
実験の結果,IBoxCLAの競合性能は,最近の完全教師付きポリープセグメンテーション法と比較して,mDiceとmIoUをそれぞれ6.5%以上,mIoUを7.5%以上増加させた他のボックス教師型技術よりも優れていた。
関連論文リスト
- MonoBox: Tightness-free Box-supervised Polyp Segmentation using Monotonicity Constraint [22.968472794154057]
単調性に制約されたボックス教師付きセグメンテーション手法であるMonoBoxを提案する。
MonoBoxは、ユーザフレンドリーでないボックステトネス仮定からトレーニングを解放する。
パブリックシンセサイザーと社内のリアルノイズデータセットの実験は、MonoBoxが他のアンチ・ノイズ・オブ・ザ・アーティファクトを上回っていることを示している。
論文 参考訳(メタデータ) (2024-04-01T15:45:58Z) - ECC-PolypDet: Enhanced CenterNet with Contrastive Learning for Automatic
Polyp Detection [88.4359020192429]
既存の手法では、計算コストのかかるコンテキストアグリゲーションが伴うか、ポリープの事前モデリングが欠如しているため、難解なケースでは性能が低下する。
本稿では,2段階のトレーニングとエンドツーエンド推論フレームワークである Enhanced CenterNet with Contrastive Learning (ECC-PolypDet) を提案する。
Box-assisted Contrastive Learning (BCL) は, クラス内差を最小限に抑え, 前庭ポリープと背景のクラス間差を最大化するため, 隠れポリープを捕捉する。
微調整段階におけるIoU誘導サンプル再重み付けの導入
論文 参考訳(メタデータ) (2024-01-10T07:03:41Z) - Point2RBox: Combine Knowledge from Synthetic Visual Patterns for End-to-end Oriented Object Detection with Single Point Supervision [81.60564776995682]
我々は、ポイント教師付きオブジェクト検出のためのエンドツーエンドソリューションであるPoint2RBoxを提案する。
提案手法は軽量なパラダイムを用いているが,点教師付き代替品間での競合性能を実現する。
特に,本手法は軽量なパラダイムを用いるが,点教師付き代替品間での競合性能を実現する。
論文 参考訳(メタデータ) (2023-11-23T15:57:41Z) - BoxSnake: Polygonal Instance Segmentation with Box Supervision [34.487089567665556]
ボックスアノテーションのみを用いた効率的な多角形インスタンスセグメンテーションを実現するために,BoxSnakeと呼ばれる新しいエンドツーエンドトレーニング手法を提案する。
BoxSnakeはマスクベースの弱教師付き手法と比較して、予測セグメンテーションとバウンディングボックスの間のパフォーマンスギャップをさらに減らし、Cityscapesデータセットに顕著な優位性を示す。
論文 参考訳(メタデータ) (2023-03-21T06:54:18Z) - BoxPolyp:Boost Generalized Polyp Segmentation Using Extra Coarse
Bounding Box Annotations [79.17754846553866]
我々は、正確なマスクと余分な粗いボックスアノテーションをフル活用するための強化されたBoxPolypモデルを提案する。
実際には、従来のポリプセグメンテーションモデルの過度に適合する問題を緩和するためにボックスアノテーションが適用される。
提案手法は従来の最先端手法よりも大きなマージンで優れていた。
論文 参考訳(メタデータ) (2022-12-07T07:45:50Z) - Box2Mask: Box-supervised Instance Segmentation via Level-set Evolution [38.88010537144528]
本稿では,Box2Maskという新しい単一ショットインスタンスセグメンテーション手法を提案する。
Box2Maskは、古典的なレベルセット進化モデルとディープニューラルネットワーク学習を統合して、バウンディングボックスの監督のみで正確なマスク予測を実現する。
論文 参考訳(メタデータ) (2022-12-03T09:32:14Z) - Bounding Box Priors for Cell Detection with Point Annotations [0.0]
トレーニングプロセス中に,注釈付き(ST)ボックスやバウンディングボックスの予測でポイントを置き換えることを提案する。
本手法は,既存の手法と異なり,ボックスイメージとポイントラベルイメージを併用してトレーニングを行う。
最も難しい設定では、わずか5%のイメージがボックスラベリングされた場合、1段法は5.56mAPの2段法より優れている。
論文 参考訳(メタデータ) (2022-11-11T10:17:30Z) - H2RBox: Horizonal Box Annotation is All You Need for Oriented Object
Detection [63.66553556240689]
オブジェクト指向物体検出は、空中画像から自律運転に至るまで、多くの用途に現れる。
多くの既存の検出ベンチマークには水平バウンディングボックスがアノテートされているが、これはきめ細かな回転ボックスよりもコストが低い。
本稿では,H2RBoxと呼ばれる単純なオブジェクト指向検出手法を提案する。
論文 参考訳(メタデータ) (2022-10-13T05:12:45Z) - What You See is What You Classify: Black Box Attributions [61.998683569022006]
我々は、トレーニング済みのブラックボックス分類器であるExpplanandumの属性を予測するために、ディープネットワークであるExplainerを訓練する。
既存のほとんどのアプローチとは異なり、我々の手法はクラス固有のマスクを直接生成することができる。
我々の属性は、視覚的および定量的に確立された方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-23T12:30:04Z) - DiscoBox: Weakly Supervised Instance Segmentation and Semantic
Correspondence from Box Supervision [98.25918224571132]
バウンディングボックスによるインスタンスセグメンテーションとセマンティック対応を共同学習する新しいフレームワークであるDiscoBoxを紹介します。
教師は、箱内と箱内の両方の画素関係をモデル化するために、ペアワイズ電位とクロスイメージ電位を組み込んだ構造化エネルギーモデルである。
教師のエネルギーを最小化することは、洗練されたオブジェクトマスクとクラス内のオブジェクト間の密接な対応を同時に生み出す。
論文 参考訳(メタデータ) (2021-05-13T17:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。