論文の概要: PatchRefineNet: Improving Binary Segmentation by Incorporating Signals
from Optimal Patch-wise Binarization
- arxiv url: http://arxiv.org/abs/2211.06560v3
- Date: Mon, 11 Sep 2023 17:00:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 18:01:15.365839
- Title: PatchRefineNet: Improving Binary Segmentation by Incorporating Signals
from Optimal Patch-wise Binarization
- Title(参考訳): patchrefinenet: 最適パッチワイズバイナリ化からの信号を取り込むことによるバイナリセグメンテーションの改善
- Authors: Savinay Nagendra, Chaopeng Shen, Daniel Kifer
- Abstract要約: 我々はパッチ固有のバイアスを修正するために学習する小さなネットワークであるPatchNetを提案する。
PRNは一貫してmIoUを2-3%改善する。
PRNが唾液度検出や数発のセグメンテーションにどのように拡張できるかを示す。
- 参考スコア(独自算出の注目度): 8.47180521286796
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The purpose of binary segmentation models is to determine which pixels belong
to an object of interest (e.g., which pixels in an image are part of roads).
The models assign a logit score (i.e., probability) to each pixel and these are
converted into predictions by thresholding (i.e., each pixel with logit score
$\geq \tau$ is predicted to be part of a road). However, a common phenomenon in
current and former state-of-the-art segmentation models is spatial bias -- in
some patches, the logit scores are consistently biased upwards and in others
they are consistently biased downwards. These biases cause false positives and
false negatives in the final predictions. In this paper, we propose
PatchRefineNet (PRN), a small network that sits on top of a base segmentation
model and learns to correct its patch-specific biases. Across a wide variety of
base models, PRN consistently helps them improve mIoU by 2-3\%. One of the key
ideas behind PRN is the addition of a novel supervision signal during training.
Given the logit scores produced by the base segmentation model, each pixel is
given a pseudo-label that is obtained by optimally thresholding the logit
scores in each image patch. Incorporating these pseudo-labels into the loss
function of PRN helps correct systematic biases and reduce false
positives/negatives. Although we mainly focus on binary segmentation, we also
show how PRN can be extended to saliency detection and few-shot segmentation.
We also discuss how the ideas can be extended to multiclass segmentation.
- Abstract(参考訳): バイナリセグメンテーションモデルの目的は、関心のある対象(例えば、画像中のどのピクセルが道路の一部であるか)に属する画素を決定することである。
モデルは各ピクセルにロジットスコア(すなわち確率)を割り当て、これらはしきい値によって予測に変換される(すなわち、ロジットスコア$\geq \tau$を持つ各ピクセルは道路の一部であると予測される)。
しかし、現在および以前の最先端のセグメンテーションモデルでよく見られる現象は、空間バイアスである -- いくつかのパッチでは、ロジットスコアは一貫して上向きに偏り、別のパッチでは一貫して下向きに偏りがある。
これらのバイアスは最終予測において偽陽性と偽陰性を引き起こす。
本稿では,ベースセグメンテーションモデル上に配置し,パッチ固有のバイアスを修正することを学ぶ小さなネットワークであるpatchrefinenet(prn)を提案する。
多様なベースモデルに対して、PRNは一貫してmIoUを2~3倍改善する。
PRNの背後にある重要なアイデアの1つは、トレーニング中に新しい監視信号を追加することである。
ベースセグメンテーションモデルによって生成されるロジットスコアが与えられると、各画素は、各画像パッチでロジットスコアを最適に閾値決めして得られる擬似ラベルが与えられる。
PRNの損失関数に擬似ラベルを組み込むことは、体系的なバイアスを補正し、偽陽性/陰性を減らすのに役立つ。
主にバイナリセグメンテーションに焦点を絞ったが,prnをサリエンシ検出や少数ショットセグメンテーションに拡張する方法も示す。
また、アイデアをマルチクラスセグメンテーションに拡張する方法についても論じる。
関連論文リスト
- Topology-Preserving Downsampling of Binary Images [1.2430809884830318]
本稿では,バイナリ画像のサンプル化バージョンを生成するための離散最適化手法を提案する。
この手法は、黒領域の0番目と第1ベッチ数によって測定された原点と同じ位相を持つことが保証されている。
論文 参考訳(メタデータ) (2024-07-25T05:30:09Z) - CorrMatch: Label Propagation via Correlation Matching for
Semi-Supervised Semantic Segmentation [73.89509052503222]
本稿では、CorrMatchと呼ばれる、単純だが実行可能な半教師付きセマンティックセマンティックセマンティックセマンティクス手法を提案する。
相関写像は、同一カテゴリのクラスタリングピクセルを容易に実現できるだけでなく、良好な形状情報も含んでいることを観察する。
我々は,高信頼画素を拡大し,さらに掘り出すために,画素の対の類似性をモデル化して画素伝搬を行う。
そして、相関地図から抽出した正確なクラス非依存マスクを用いて、領域伝搬を行い、擬似ラベルを強化する。
論文 参考訳(メタデータ) (2023-06-07T10:02:29Z) - Which Pixel to Annotate: a Label-Efficient Nuclei Segmentation Framework [70.18084425770091]
ディープニューラルネットワークは、H&E染色病理像の核インスタンスセグメンテーションに広く応用されている。
通常、類似したパターンと冗長なパターンを含む核画像のデータセットに全てのピクセルをラベル付けするのは非効率で不要である。
そこで本研究では,アノテートするイメージパッチを数個だけ選択し,選択したサンプルからトレーニングセットを増強し,半教師付きで核分割を実現する,新しいフル核分割フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-20T14:53:26Z) - Residual Pattern Learning for Pixel-wise Out-of-Distribution Detection
in Semantic Segmentation [38.784135463275305]
本稿では,新たな残差パターン学習 (RPL) モジュールを提案する。このモジュールはセグメンテーションモデルを用いて,イリヤセグメンテーション性能に影響を与えることなく,OoD画素の検出を支援する。
また,様々な文脈において,RPLがOoD画素を頑健に検出することを強制する新しいコンテクストロバストコントラスト学習(CoroCL)を提案する。
われわれのアプローチは、FPRが約10%改善し、AuPRCが7%向上し、フィッシュスケープ、Segment-Me-If-You-Can、RoadAnomalyデータセットの最先端になった。
論文 参考訳(メタデータ) (2022-11-26T08:32:28Z) - Min-Max Similarity: A Contrastive Learning Based Semi-Supervised
Learning Network for Surgical Tools Segmentation [0.0]
コントラスト学習に基づく半教師付きセグメンテーションネットワークを提案する。
従来の最先端技術とは対照的に、両視点トレーニングの対照的な学習形式を導入する。
提案手法は、最先端の半教師付きおよび完全教師付きセグメンテーションアルゴリズムを一貫して上回る。
論文 参考訳(メタデータ) (2022-03-29T01:40:26Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Efficient Semi-Supervised Gross Target Volume of Nasopharyngeal
Carcinoma Segmentation via Uncertainty Rectified Pyramid Consistency [10.285412678779462]
鼻咽喉頭癌に対する放射線治療計画におけるGross Target Volume(GTV)セグメンテーションの役割
CNNはこのタスクで優れたパフォーマンスを達成したが、トレーニングにはラベル付き画像の大規模なセットに依存している。
半監視型NPC GTVセグメンテーションのための不確かさ補正ピラミッド一貫性(URPC)正規化を用いた新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-13T11:45:00Z) - SegFix: Model-Agnostic Boundary Refinement for Segmentation [75.58050758615316]
既存のセグメンテーションモデルによって生成されるセグメンテーション結果の境界品質を改善するためのモデルに依存しない後処理方式を提案する。
内部画素のラベル予測がより信頼性が高いという実証的な観察により、我々は、内部画素の予測によって、もともと信頼できない境界画素の予測を置き換えることを提案する。
論文 参考訳(メタデータ) (2020-07-08T17:08:08Z) - Sequential Graph Convolutional Network for Active Learning [53.99104862192055]
逐次グラフ畳み込みネットワーク(GCN)を用いた新しいプールベースアクティブラーニングフレームワークを提案する。
少数のランダムなサンプル画像がシードラベル付き例であるので、グラフのパラメータを学習してラベル付きノードと非ラベル付きノードを区別する。
我々はGCNの特性を利用してラベル付けされたものと十分に異なる未ラベルの例を選択する。
論文 参考訳(メタデータ) (2020-06-18T00:55:10Z) - On the Texture Bias for Few-Shot CNN Segmentation [21.349705243254423]
畳み込みニューラルネットワーク(CNN)は、視覚認識タスクを実行するために形状によって駆動される。
最近の証拠は、CNNのテクスチャバイアスが、大きなラベル付きトレーニングデータセットで学習するときに、より高いパフォーマンスのモデルを提供することを示している。
本稿では,特徴空間内の高周波局所成分を減衰させるために,ガウス差分(DoG)の集合を統合する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-09T11:55:47Z) - Pixel-in-Pixel Net: Towards Efficient Facial Landmark Detection in the
Wild [104.61677518999976]
顔のランドマークを検出するために,Pixel-in-Pixel Net(PIPNet)を提案する。
提案モデルは,熱マップ回帰に基づく新しい検出ヘッドを備える。
PIPNetのクロスドメイン一般化能力をさらに向上するため,カリキュラムによる自己学習を提案する。
論文 参考訳(メタデータ) (2020-03-08T12:23:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。