論文の概要: Rectifying Noisy Labels with Sequential Prior: Multi-Scale Temporal
Feature Affinity Learning for Robust Video Segmentation
- arxiv url: http://arxiv.org/abs/2307.05898v1
- Date: Wed, 12 Jul 2023 04:10:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-13 14:31:00.987226
- Title: Rectifying Noisy Labels with Sequential Prior: Multi-Scale Temporal
Feature Affinity Learning for Robust Video Segmentation
- Title(参考訳): 逐次優先順位付き雑音ラベルの定式化:ロバストビデオセグメンテーションのための多段階時間特徴親和性学習
- Authors: Beilei Cui, Minqing Zhang, Mengya Xu, An Wang, Wu Yuan, Hongliang Ren
- Abstract要約: ノイズラベル問題は、医療画像セグメンテーション内に必然的に存在し、性能が著しく低下する。
ノイズラベル付き医療ビデオセグメンテーション問題を解決するために,マルチスケールの時間的特徴親和性学習フレームワークを提案する。
合成および実世界のラベルノイズを用いた実験により,本手法は最近の最先端のロバストなセグメンテーション手法より優れていることが示された。
- 参考スコア(独自算出の注目度): 15.509243984236162
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Noisy label problems are inevitably in existence within medical image
segmentation causing severe performance degradation. Previous segmentation
methods for noisy label problems only utilize a single image while the
potential of leveraging the correlation between images has been overlooked.
Especially for video segmentation, adjacent frames contain rich contextual
information beneficial in cognizing noisy labels. Based on two insights, we
propose a Multi-Scale Temporal Feature Affinity Learning (MS-TFAL) framework to
resolve noisy-labeled medical video segmentation issues. First, we argue the
sequential prior of videos is an effective reference, i.e., pixel-level
features from adjacent frames are close in distance for the same class and far
in distance otherwise. Therefore, Temporal Feature Affinity Learning (TFAL) is
devised to indicate possible noisy labels by evaluating the affinity between
pixels in two adjacent frames. We also notice that the noise distribution
exhibits considerable variations across video, image, and pixel levels. In this
way, we introduce Multi-Scale Supervision (MSS) to supervise the network from
three different perspectives by re-weighting and refining the samples. This
design enables the network to concentrate on clean samples in a coarse-to-fine
manner. Experiments with both synthetic and real-world label noise demonstrate
that our method outperforms recent state-of-the-art robust segmentation
approaches. Code is available at https://github.com/BeileiCui/MS-TFAL.
- Abstract(参考訳): ノイズラベル問題は、医療画像セグメンテーション内に必然的に存在し、性能が著しく低下する。
ノイズラベル問題に対する従来のセグメンテーション手法は単一の画像のみを使用し、画像間の相関を利用した可能性を見落としている。
特にビデオセグメンテーションでは、隣接するフレームはノイズラベルを認識するのに役立つ豊富なコンテキスト情報を含んでいる。
2つの知見に基づいて,ノイズラベル付き医療ビデオセグメンテーション問題を解決するため,MS-TFAL(Multi-Scale Temporal Feature Affinity Learning)フレームワークを提案する。
まず,ビデオの逐次的先行は効果的な参照であり,隣接するフレームからのピクセルレベルの特徴は同じクラスに対して距離が近かったり,あるいは距離が遠かったりする。
そのため、2つの隣接フレームにおける画素間の親和性を評価することにより、うるうるノイズラベルを示すために、TFAL(Temporal Feature Affinity Learning)を考案した。
また、ノイズ分布はビデオ、画像、ピクセルレベルによってかなり異なることに気付きました。
そこで,本研究では,サンプルの再重み付けと精錬によりネットワークを3つの異なる視点から監視するマルチスケール・スーパーバイザリング(mss)を導入する。
この設計により、ネットワークは粗い方法でクリーンなサンプルに集中することができる。
合成ラベルノイズと実世界のラベルノイズの両方を用いた実験により,最近の最先端のロバストセグメンテーション手法に勝ることを示す。
コードはhttps://github.com/BeileiCui/MS-TFALで入手できる。
関連論文リスト
- SegRefiner: Towards Model-Agnostic Segmentation Refinement with Discrete
Diffusion Process [102.18226145874007]
そこで我々は,異なるセグメンテーションモデルによって生成されるオブジェクトマスクの品質を高めるために,SegRefinerと呼ばれるモデルに依存しないソリューションを提案する。
SegRefinerは粗いマスクを入力として取り、離散拡散プロセスを用いてそれらを洗練する。
さまざまな種類の粗いマスクにわたるセグメンテーションメトリックとバウンダリメトリックの両方を一貫して改善する。
論文 参考訳(メタデータ) (2023-12-19T18:53:47Z) - Accurate Segmentation of Optic Disc And Cup from Multiple Pseudo-labels by Noise-aware Learning [16.09436396639938]
本稿では,光ディスクとカップセグメンテーションの精度向上を目的として,MPNN(Multiple Pseudo-labels Noise-aware Network)のラベルデノベーション手法を提案する。
具体的には、MPNNは、真のラベルに基づいて訓練された複数の異なるネットワークと、これらの擬似ラベルガイドから抽出された画素レベルのコンセンサス情報によって擬似ラベルを生成する。
MPNNのトレーニングフレームワークは、清潔なピクセルとノイズの多いピクセルからセグメンテーションを学ぶための教師/学生アーキテクチャによって構築されている。
論文 参考訳(メタデータ) (2023-11-30T12:17:16Z) - Semi-supervised Pathological Image Segmentation via Cross Distillation
of Multiple Attentions [19.236045479697797]
我々は,CDMA(Cross Distillation of Multiple Attentions)に基づく新しい半教師付き学習(SSL)手法を提案する。
提案したCDMAは,公開DigestPathデータセット上の8つの最先端SSL手法と比較した。
論文 参考訳(メタデータ) (2023-05-30T08:23:07Z) - Multi-Granularity Denoising and Bidirectional Alignment for Weakly
Supervised Semantic Segmentation [75.32213865436442]
本稿では,雑音ラベルと多クラス一般化問題を緩和するために,MDBAモデルを提案する。
MDBAモデルはPASCAL VOC 2012データセットの検証とテストセットにおいて69.5%と70.2%のmIoUに達することができる。
論文 参考訳(メタデータ) (2023-05-09T03:33:43Z) - On the Effects of Different Types of Label Noise in Multi-Label Remote
Sensing Image Classification [1.6758573326215689]
リモートセンシング(RS)画像のマルチラベル分類(MLC)のための高精度な手法の開発は、RSにおいて最も重要な研究トピックの1つである。
複数のランドカバークラスラベル (multi-labels) でアノテートされた多数の信頼できるトレーニングイメージを必要とするディープニューラルネットワークの使用は、RSで人気がある。
本稿では,3つの異なる雑音頑健なCV SLC法について検討し,RSのマルチラベル雑音シナリオに対して頑健であるように適応する。
論文 参考訳(メタデータ) (2022-07-28T09:38:30Z) - Joint Class-Affinity Loss Correction for Robust Medical Image
Segmentation with Noisy Labels [22.721870430220598]
ノイズラベルは 医用画像分割アルゴリズムが 正確な意味的相関を 学習するのを防いでいる
画素ワイズとペアワイズの両方を取り入れたノイズ緩和のための新しい視点を提案する。
医用画像のセグメンテーションにおけるラベルノイズ問題に対処する頑健なジョイントクラスアフィニティ(JCAS)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-16T08:19:33Z) - Superpixel-guided Iterative Learning from Noisy Labels for Medical Image
Segmentation [24.557755528031453]
セグメンテーションネットワークの雑音認識学習とノイズラベル改善を組み合わせた,頑健な反復学習戦略を開発する。
2つのベンチマーク実験により,本手法は最近の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-07-21T14:27:36Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Synergy Between Semantic Segmentation and Image Denoising via Alternate
Boosting [102.19116213923614]
ノイズ除去とセグメンテーションを交互に行うためのブーストネットワークを提案する。
我々は,ノイズによるセグメンテーション精度の低下に対処するだけでなく,画素別意味情報によってデノージング能力が向上することを示す。
実験の結果,デノイド画像の品質が大幅に向上し,セグメンテーション精度がクリーン画像に近いことを示した。
論文 参考訳(メタデータ) (2021-02-24T06:48:45Z) - Generative Multi-Label Zero-Shot Learning [136.17594611722285]
マルチラベルゼロショット学習は、トレーニング中にデータが入手できない複数の見えないカテゴリにイメージを分類する試みである。
我々の研究は、(一般化された)ゼロショット設定におけるマルチラベル機能の問題に最初に取り組みました。
私たちのクロスレベル核融合に基づく生成アプローチは、3つのデータセットすべてにおいて最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2021-01-27T18:56:46Z) - Attention-Aware Noisy Label Learning for Image Classification [97.26664962498887]
大規模ラベル付きサンプルで学習した深層畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおいて顕著な進歩を遂げている。
大量のラベル付きビジュアルデータを取得する最も安価な方法は、Flickrのようなユーザーが提供するラベルでウェブサイトからクロールすることである。
本稿では,潜在的なラベルノイズのあるデータセットに基づいて学習したネットワークの識別能力を向上させるために,注目に敏感なラベル学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-30T15:45:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。