論文の概要: Enjoying Information Dividend: Gaze Track-based Medical Weakly Supervised Segmentation
- arxiv url: http://arxiv.org/abs/2505.22230v1
- Date: Wed, 28 May 2025 11:05:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.562758
- Title: Enjoying Information Dividend: Gaze Track-based Medical Weakly Supervised Segmentation
- Title(参考訳): ゲーズトラックをベースとした医療支援型セグメンテーション
- Authors: Zhisong Wang, Yiwen Ye, Ziyang Chen, Yong Xia,
- Abstract要約: GradTrackは、医師の視線トラック(固定点、期間、時間順を含む)を利用して、WSSSのパフォーマンスを向上させるフレームワークである。
Kvasir-SEGとNCI-I SBIデータセットの実験は、GradTrackが既存の視線ベースの手法を一貫して上回っていることを示している。
- 参考スコア(独自算出の注目度): 13.149889117975725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised semantic segmentation (WSSS) in medical imaging struggles with effectively using sparse annotations. One promising direction for WSSS leverages gaze annotations, captured via eye trackers that record regions of interest during diagnostic procedures. However, existing gaze-based methods, such as GazeMedSeg, do not fully exploit the rich information embedded in gaze data. In this paper, we propose GradTrack, a framework that utilizes physicians' gaze track, including fixation points, durations, and temporal order, to enhance WSSS performance. GradTrack comprises two key components: Gaze Track Map Generation and Track Attention, which collaboratively enable progressive feature refinement through multi-level gaze supervision during the decoding process. Experiments on the Kvasir-SEG and NCI-ISBI datasets demonstrate that GradTrack consistently outperforms existing gaze-based methods, achieving Dice score improvements of 3.21\% and 2.61\%, respectively. Moreover, GradTrack significantly narrows the performance gap with fully supervised models such as nnUNet.
- Abstract(参考訳): 医用画像における弱教師付きセマンティックセグメンテーション(WSSS)はスパースアノテーションの有効利用に苦慮している。
WSSSの有望な方向性の1つは、診断手順中に関心のある領域を記録するアイトラッカーを介してキャプチャされる、ガゼアノテーションを活用することである。
しかし、GazeMedSegのような既存のガゼベース手法は、ガゼデータに埋め込まれた豊富な情報を十分に活用していない。
本稿では,医師の視線情報を利用するフレームワークであるGradTrackを提案する。
GradTrackには2つの重要なコンポーネントがある: Gaze Track Map Generation と Track Attention 。
Kvasir-SEG と NCI-ISBI のデータセットの実験では、GradTrack は既存の視線ベースの手法を一貫して上回り、Dice のスコアは 3.21 % と 2.61 % である。
さらに、GradTrackは、nnUNetのような完全に教師されたモデルでパフォーマンスギャップを著しく狭める。
関連論文リスト
- SlideGCD: Slide-based Graph Collaborative Training with Knowledge Distillation for Whole Slide Image Classification [4.994171453938461]
最近の研究は、スライド間の相関を無視した1つのWSIの内部コンテキスト情報に主に焦点を当てている。
本稿では,既存のマルチインスタンス学習(MIL)手法をバックボーンとして考慮し,ノード分類問題としてWSI分類タスクをフォークする汎用的なWSI解析パイプラインSlideGCDを提案する。
2つのTCGAベンチマークデータセットで、これまでの4つの最先端MILメソッドのSlideGCDによる一貫したパフォーマンス向上が観察された。
論文 参考訳(メタデータ) (2024-07-12T03:32:13Z) - Weakly-supervised Medical Image Segmentation with Gaze Annotations [46.32764942078478]
人間の観察パターンを明らかにする視線は、視覚タスクのソリューションにますます取り入れられている。
本稿では, 医用画像のセグメンテーションにおいて, 医用画像のセグメンテーションを集中的に管理する手法を提案する。
本研究では,複数のネットワークを識別的人間の注意から訓練する多層フレームワークを提案する。
医用セグメンテーションデータセットの拡張として,GazeMedSegと題する高品質な視線データセットをコントリビュートする。
論文 参考訳(メタデータ) (2024-07-10T07:07:58Z) - Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - Pseudo Label-Guided Data Fusion and Output Consistency for
Semi-Supervised Medical Image Segmentation [9.93871075239635]
より少ないアノテーションで医用画像のセグメンテーションを行うための平均教師ネットワーク上に構築されたPLGDFフレームワークを提案する。
本稿では,ラベル付きデータとラベルなしデータを組み合わせてデータセットを効果的に拡張する,新しい擬似ラベル利用方式を提案する。
本フレームワークは,最先端の6つの半教師あり学習手法と比較して,優れた性能が得られる。
論文 参考訳(メタデータ) (2023-11-17T06:36:43Z) - GraphCoCo: Graph Complementary Contrastive Learning [65.89743197355722]
グラフコントラスト学習(GCL)は、手作業によるアノテーションの監督なしに、グラフ表現学習(GRL)において有望な性能を示した。
本稿では,この課題に対処するため,グラフココというグラフ補完型コントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2022-03-24T02:58:36Z) - Every Annotation Counts: Multi-label Deep Supervision for Medical Image
Segmentation [85.0078917060652]
この障壁を克服する半弱教師付きセグメンテーションアルゴリズムを提案する。
このアプローチは,深層指導と生徒・教師モデルの新しい定式化に基づいている。
我々の新しいセグメンテーションのトレーニング体制は、完全にラベル付けされ、バウンディングボックスでマークされた画像、単にグローバルラベル、あるいは全くないイメージを柔軟に活用することで、高価なラベルの要件を94.22%削減することができる。
論文 参考訳(メタデータ) (2021-04-27T14:51:19Z) - Learning Whole-Slide Segmentation from Inexact and Incomplete Labels
using Tissue Graphs [11.315178576537768]
グラフを用いた弱教師付きセマンティックセグメンテーション手法であるSegGiniを提案する。
SegGiniセグメントは、組織マイクロアレイ(TMA)から全スライド画像(WSI)まで、任意かつ大規模な画像です。
論文 参考訳(メタデータ) (2021-03-04T16:04:24Z) - Dynamic Graph Modeling of Simultaneous EEG and Eye-tracking Data for
Reading Task Identification [79.41619843969347]
我々は、脳波(EEG)と眼球運動(EM)データからヒトの読取意図を特定するための新しいアプローチAdaGTCNを提案する。
本稿では,AdaGTCN(Adaptive Graph Temporal Convolution Network)の手法として,Adaptive Graph Learning LayerとDeep Neighborhood Graph Convolution Layerを用いた。
このアプローチといくつかのベースラインを比較し、ZuCo 2.0データセットの6.29%の改善と広範なアブレーション実験を報告します。
論文 参考訳(メタデータ) (2021-02-21T18:19:49Z) - Towards Robust Partially Supervised Multi-Structure Medical Image
Segmentation on Small-Scale Data [123.03252888189546]
データ不足下における部分教師付き学習(PSL)における方法論的ギャップを埋めるために,不確実性下でのビシナルラベル(VLUU)を提案する。
マルチタスク学習とヴィジナルリスク最小化によって動機づけられたVLUUは、ビジナルラベルを生成することによって、部分的に教師付き問題を完全な教師付き問題に変換する。
本研究は,ラベル効率の高い深層学習における新たな研究の方向性を示唆するものである。
論文 参考訳(メタデータ) (2020-11-28T16:31:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。