論文の概要: Image-level Regression for Uncertainty-aware Retinal Image Segmentation
- arxiv url: http://arxiv.org/abs/2405.16815v2
- Date: Thu, 25 Jul 2024 09:29:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-26 18:57:36.018121
- Title: Image-level Regression for Uncertainty-aware Retinal Image Segmentation
- Title(参考訳): 不確かさを意識した網膜画像分割のための画像レベルの回帰
- Authors: Trung Dang, Huy Hoang Nguyen, Aleksei Tiulpin,
- Abstract要約: 我々は,新たな不確実性認識変換(SAUNA)を導入する。
以上の結果から,SAUNA変換の統合とセグメント化損失は,異なるセグメンテーションモデルにおいて大きな性能向上をもたらすことが示唆された。
- 参考スコア(独自算出の注目度): 3.7141182051230914
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate retinal vessel (RV) segmentation is a crucial step in the quantitative assessment of retinal vasculature, which is needed for the early detection of retinal diseases and other conditions. Numerous studies have been conducted to tackle the problem of segmenting vessels automatically using a pixel-wise classification approach. The common practice of creating ground truth labels is to categorize pixels as foreground and background. This approach is, however, biased, and it ignores the uncertainty of a human annotator when it comes to annotating e.g. thin vessels. In this work, we propose a simple and effective method that casts the RV segmentation task as an image-level regression. For this purpose, we first introduce a novel Segmentation Annotation Uncertainty-Aware (SAUNA) transform, which adds pixel uncertainty to the ground truth using the pixel's closeness to the annotation boundary and vessel thickness. To train our model with soft labels, we generalize the earlier proposed Jaccard metric loss to arbitrary hypercubes for soft Jaccard index (Intersection-over-Union) optimization. Additionally, we employ a stable version of the Focal-L1 loss for pixel-wise regression. We conduct thorough experiments and compare our method to a diverse set of baselines across 5 retinal image datasets. Our empirical results indicate that the integration of the SAUNA transform and these segmentation losses led to significant performance boosts for different segmentation models. Particularly, our methodology enables UNet-like architectures to substantially outperform computational-intensive baselines. Our implementation is available at \url{https://github.com/Oulu-IMEDS/SAUNA}.
- Abstract(参考訳): 正確な網膜血管セグメンテーション(RV)は、網膜疾患やその他の疾患の早期発見に必要な網膜血管の定量的評価において重要なステップである。
画素単位の分類手法を用いて, 分割容器の課題に対処するために, 多数の研究がなされている。
基底の真理ラベルを作成する一般的な習慣は、ピクセルを前景と背景に分類することである。
しかし、このアプローチは偏りがあり、egの細い血管に注釈をつけるという点では、人間のアノテーションの不確かさを無視する。
本研究では,RVセグメンテーションタスクを画像レベルの回帰としてキャストする,シンプルで効果的な手法を提案する。
この目的のために,我々はまず,アノテーション境界と血管厚に対する画素の近接性を用いて,地上の真理に画素の不確かさを付加する,新しいセグメンテーションアノテーション不確実性認識変換(SAUNA)を導入する。
ソフトラベルでモデルをトレーニングするために、提案したジャカード距離損失を任意のハイパーキューブに一般化し、ソフトジャカード指数(Intersection-over-Union)の最適化を行う。
さらに,Focal-L1損失の安定バージョンを画素ワイドレグレッションに適用した。
詳細な実験を行い、5つの網膜画像データセットにまたがる多様なベースラインと比較する。
実験結果から,SAUNA変換の統合とセグメント化損失が,異なるセグメント化モデルにおいて顕著な性能向上をもたらしたことが示唆された。
特に,本手法により,UNetのようなアーキテクチャが計算集約ベースラインを大幅に上回る。
我々の実装は \url{https://github.com/Oulu-IMEDS/SAUNA} で利用可能です。
関連論文リスト
- Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - Learning to Rank Patches for Unbiased Image Redundancy Reduction [80.93989115541966]
画像は、隣接する領域の画素が空間的に相関しているため、空間的冗長性に悩まされる。
既存のアプローチでは、意味の少ない画像領域を減らし、この制限を克服しようとしている。
本稿では,Learning to Rank Patchesと呼ばれる画像冗長性低減のための自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T13:12:41Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Difference of Anisotropic and Isotropic TV for Segmentation under Blur
and Poisson Noise [2.6381163133447836]
画像をスムーシング・アンド・スレッディング(SaT)セグメンテーションフレームワークを採用して、スムースなソリューションを見つけ、次に$k-meansで画像のセグメンテーションを行う。
具体的には、画像平滑化ステップにおいて、ムムフォードシャーモデルの最大雑音を正則化として、異方性全変動(AITV)の最大変動に置き換える。
スキームの有効性を検証するための収束解析が提供される。
論文 参考訳(メタデータ) (2023-01-06T01:14:56Z) - SUPRA: Superpixel Guided Loss for Improved Multi-modal Segmentation in
Endoscopy [1.1470070927586016]
ドメインシフトは医療画像コミュニティでよく知られた問題である。
本稿では,そのようなシナリオでDL手法が利用可能となるための領域一般化手法について検討する。
その結果,本手法では,ベースラインに比べて目標領域の20%近くの改善が得られた。
論文 参考訳(メタデータ) (2022-11-09T03:13:59Z) - SePiCo: Semantic-Guided Pixel Contrast for Domain Adaptive Semantic
Segmentation [52.62441404064957]
ドメイン適応セマンティックセグメンテーションは、ラベル付きソースドメインでトレーニングされたモデルを利用することで、ラベル付きターゲットドメイン上で満足のいく密度の予測を試みる。
多くの手法は、ノイズの多い擬似ラベルを緩和する傾向があるが、類似のセマンティックな概念を持つクロスドメインピクセル間の固有の接続を無視する。
本稿では,個々の画素のセマンティックな概念を強調する一段階適応フレームワークSePiCoを提案する。
論文 参考訳(メタデータ) (2022-04-19T11:16:29Z) - Fast Hybrid Image Retargeting [0.0]
本稿では,コンテント・アウェア・トリミングを用いて歪みを定量化し,抑制する手法を提案する。
我々の手法は,実行時間のごく一部で実行しながら,最近の手法より優れています。
論文 参考訳(メタデータ) (2022-03-25T11:46:06Z) - GradViT: Gradient Inversion of Vision Transformers [83.54779732309653]
我々は,視力変換器(ViT)の勾配に基づく逆攻撃に対する脆弱性を実証する。
自然に見える画像にランダムノイズを最適化するGradViTという手法を提案する。
元の(隠された)データに対する前例のない高い忠実さと近接性を観察する。
論文 参考訳(メタデータ) (2022-03-22T17:06:07Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Improving Image co-segmentation via Deep Metric Learning [1.5076964620370268]
本稿では,IS-Triplet Los for Shortという,画像のトリプレットロスを新たに提案し,従来の画像分割損失と組み合わせた。
提案手法を画像共同分割に適用し,SBCosegデータセットとインターネットデータセット上でテストする。
論文 参考訳(メタデータ) (2021-03-19T07:30:42Z) - Adaptive Fractional Dilated Convolution Network for Image Aesthetics
Assessment [33.945579916184364]
適応型分数拡張畳み込み(AFDC)は、畳み込みカーネルレベルでこの問題に取り組むために開発された。
ミニバッチ学習のための簡潔な定式化を行い,グループ化戦略を用いて計算オーバーヘッドを削減する。
提案手法は,AVAデータセットを用いた画像美学評価において,最先端の性能を実現することを実証した。
論文 参考訳(メタデータ) (2020-04-06T21:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。