論文の概要: ThreshNet: Segmentation Refinement Inspired by Region-Specific
Thresholding
- arxiv url: http://arxiv.org/abs/2211.06560v1
- Date: Sat, 12 Nov 2022 03:49:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 17:57:55.259514
- Title: ThreshNet: Segmentation Refinement Inspired by Region-Specific
Thresholding
- Title(参考訳): ThreshNet: リージョン特有なThresholdingにヒントを得たセグメンテーションリファインメント
- Authors: Savinay Nagendra, Chaopeng Shen, Daniel Kifer
- Abstract要約: 本稿では,バイナリセグメンテーションタスク用に設計されたニューラルネットワークの出力を洗練するための後処理手法ThreshNetを提案する。
ThreshNetは、ベースネットワークが生成した信頼性マップと、グローバルおよびローカルのパッチ情報を使用して、最先端のメソッドのパフォーマンスを大幅に改善する。
- 参考スコア(独自算出の注目度): 11.153966202832933
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present ThreshNet, a post-processing method to refine the output of neural
networks designed for binary segmentation tasks. ThreshNet uses the confidence
map produced by a base network along with global and local patch information to
significantly improve the performance of even state-of-the-art methods. Binary
segmentation models typically convert confidence maps into predictions by
thresholding the confidence scores at 0.5 (or some other fixed number).
However, we observe that the best threshold is image-dependent and often even
region-specific -- different parts of the image benefit from using different
thresholds. Thus ThreshNet takes a trained segmentation model and learns to
correct its predictions by using a memory-efficient post-processing
architecture that incorporates region-specific thresholds as part of the
training mechanism. Our experiments show that ThreshNet consistently improves
over current the state-of-the-art methods in binary segmentation and saliency
detection, typically by 3 to 5% in mIoU and mBA.
- Abstract(参考訳): 本稿では,バイナリセグメンテーションタスク用に設計されたニューラルネットワークの出力を洗練するための後処理手法ThreshNetを提案する。
ThreshNetは、ベースネットワークが生成した信頼マップとグローバルおよびローカルのパッチ情報を使用して、最先端のメソッドのパフォーマンスを大幅に改善する。
バイナリセグメンテーションモデルは一般的に信頼度マップを0.5(またはその他の固定数)で信頼度スコアをしきい値にすることで予測に変換する。
しかし、最良のしきい値が画像に依存しており、多くの場合、領域固有の -- 画像の異なる部分は、異なるしきい値を使用することで恩恵を受ける。
そのためThreshNetは、トレーニングされたセグメンテーションモデルを採用し、トレーニングメカニズムの一部としてリージョン固有のしきい値を含むメモリ効率の高い後処理アーキテクチャを使用して、その予測を修正することを学ぶ。
我々の実験によると、ThreshNetはバイナリセグメンテーションとサリエンシ検出における最先端の手法を、通常mIoUとmBAで3~5%改善する。
関連論文リスト
- Topology-Preserving Downsampling of Binary Images [1.2430809884830318]
本稿では,バイナリ画像のサンプル化バージョンを生成するための離散最適化手法を提案する。
この手法は、黒領域の0番目と第1ベッチ数によって測定された原点と同じ位相を持つことが保証されている。
論文 参考訳(メタデータ) (2024-07-25T05:30:09Z) - CorrMatch: Label Propagation via Correlation Matching for
Semi-Supervised Semantic Segmentation [73.89509052503222]
本稿では、CorrMatchと呼ばれる、単純だが実行可能な半教師付きセマンティックセマンティックセマンティックセマンティクス手法を提案する。
相関写像は、同一カテゴリのクラスタリングピクセルを容易に実現できるだけでなく、良好な形状情報も含んでいることを観察する。
我々は,高信頼画素を拡大し,さらに掘り出すために,画素の対の類似性をモデル化して画素伝搬を行う。
そして、相関地図から抽出した正確なクラス非依存マスクを用いて、領域伝搬を行い、擬似ラベルを強化する。
論文 参考訳(メタデータ) (2023-06-07T10:02:29Z) - Which Pixel to Annotate: a Label-Efficient Nuclei Segmentation Framework [70.18084425770091]
ディープニューラルネットワークは、H&E染色病理像の核インスタンスセグメンテーションに広く応用されている。
通常、類似したパターンと冗長なパターンを含む核画像のデータセットに全てのピクセルをラベル付けするのは非効率で不要である。
そこで本研究では,アノテートするイメージパッチを数個だけ選択し,選択したサンプルからトレーニングセットを増強し,半教師付きで核分割を実現する,新しいフル核分割フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-20T14:53:26Z) - Residual Pattern Learning for Pixel-wise Out-of-Distribution Detection
in Semantic Segmentation [38.784135463275305]
本稿では,新たな残差パターン学習 (RPL) モジュールを提案する。このモジュールはセグメンテーションモデルを用いて,イリヤセグメンテーション性能に影響を与えることなく,OoD画素の検出を支援する。
また,様々な文脈において,RPLがOoD画素を頑健に検出することを強制する新しいコンテクストロバストコントラスト学習(CoroCL)を提案する。
われわれのアプローチは、FPRが約10%改善し、AuPRCが7%向上し、フィッシュスケープ、Segment-Me-If-You-Can、RoadAnomalyデータセットの最先端になった。
論文 参考訳(メタデータ) (2022-11-26T08:32:28Z) - Min-Max Similarity: A Contrastive Learning Based Semi-Supervised
Learning Network for Surgical Tools Segmentation [0.0]
コントラスト学習に基づく半教師付きセグメンテーションネットワークを提案する。
従来の最先端技術とは対照的に、両視点トレーニングの対照的な学習形式を導入する。
提案手法は、最先端の半教師付きおよび完全教師付きセグメンテーションアルゴリズムを一貫して上回る。
論文 参考訳(メタデータ) (2022-03-29T01:40:26Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Efficient Semi-Supervised Gross Target Volume of Nasopharyngeal
Carcinoma Segmentation via Uncertainty Rectified Pyramid Consistency [10.285412678779462]
鼻咽喉頭癌に対する放射線治療計画におけるGross Target Volume(GTV)セグメンテーションの役割
CNNはこのタスクで優れたパフォーマンスを達成したが、トレーニングにはラベル付き画像の大規模なセットに依存している。
半監視型NPC GTVセグメンテーションのための不確かさ補正ピラミッド一貫性(URPC)正規化を用いた新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-13T11:45:00Z) - SegFix: Model-Agnostic Boundary Refinement for Segmentation [75.58050758615316]
既存のセグメンテーションモデルによって生成されるセグメンテーション結果の境界品質を改善するためのモデルに依存しない後処理方式を提案する。
内部画素のラベル予測がより信頼性が高いという実証的な観察により、我々は、内部画素の予測によって、もともと信頼できない境界画素の予測を置き換えることを提案する。
論文 参考訳(メタデータ) (2020-07-08T17:08:08Z) - Sequential Graph Convolutional Network for Active Learning [53.99104862192055]
逐次グラフ畳み込みネットワーク(GCN)を用いた新しいプールベースアクティブラーニングフレームワークを提案する。
少数のランダムなサンプル画像がシードラベル付き例であるので、グラフのパラメータを学習してラベル付きノードと非ラベル付きノードを区別する。
我々はGCNの特性を利用してラベル付けされたものと十分に異なる未ラベルの例を選択する。
論文 参考訳(メタデータ) (2020-06-18T00:55:10Z) - On the Texture Bias for Few-Shot CNN Segmentation [21.349705243254423]
畳み込みニューラルネットワーク(CNN)は、視覚認識タスクを実行するために形状によって駆動される。
最近の証拠は、CNNのテクスチャバイアスが、大きなラベル付きトレーニングデータセットで学習するときに、より高いパフォーマンスのモデルを提供することを示している。
本稿では,特徴空間内の高周波局所成分を減衰させるために,ガウス差分(DoG)の集合を統合する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-09T11:55:47Z) - Pixel-in-Pixel Net: Towards Efficient Facial Landmark Detection in the
Wild [104.61677518999976]
顔のランドマークを検出するために,Pixel-in-Pixel Net(PIPNet)を提案する。
提案モデルは,熱マップ回帰に基づく新しい検出ヘッドを備える。
PIPNetのクロスドメイン一般化能力をさらに向上するため,カリキュラムによる自己学習を提案する。
論文 参考訳(メタデータ) (2020-03-08T12:23:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。