Fugu-MT 論文翻訳(概要): Semi-Supervised Multi-Task Learning for Interpretable Quality As- sessment of Fundus Images

論文の概要: Semi-Supervised Multi-Task Learning for Interpretable Quality As- sessment of Fundus Images

arxiv url: http://arxiv.org/abs/2511.13353v1
Date: Mon, 17 Nov 2025 13:17:42 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-18 14:36:25.2278
Title: Semi-Supervised Multi-Task Learning for Interpretable Quality As- sessment of Fundus Images
Title（参考訳）: ファウンダス画像の解釈可能な品質保証のための半教師付きマルチタスク学習
Authors: Lucas Gabriel Telesco, Danila Nejamkin, Estefanía Mata, Francisco Filizzola, Kevin Wignall, Lucía Franco Troilo, María de los Angeles Cenoz, Melissa Thompson, Mercedes Leguía, Ignacio Larrabide, José Ignacio Orlando,
Abstract要約: 網膜画像品質評価(RIQA)は、眼疾患のコンピュータ支援診断を支援する。ほとんどのツールは、画像の全体的な品質のみを分類するが、再キャプチャーをガイドするための取得欠陥は示さない。本稿では,マルチタスクフレームワーク内で,手動による品質ラベルと品質詳細の擬似ラベルを併用した半教師付きハイブリッド学習手法を提案する。
参考スコア（独自算出の注目度）: 0.1265345507370037
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Retinal image quality assessment (RIQA) supports computer-aided diagnosis of eye diseases. However, most tools classify only overall image quality, without indicating acquisition defects to guide recapture. This gap is mainly due to the high cost of detailed annotations. In this paper, we aim to mitigate this limitation by introducing a hybrid semi-supervised learning approach that combines manual labels for overall quality with pseudo-labels of quality details within a multi-task framework. Our objective is to obtain more interpretable RIQA models without requiring extensive manual labeling. Pseudo-labels are generated by a Teacher model trained on a small dataset and then used to fine-tune a pre-trained model in a multi-task setting. Using a ResNet-18 backbone, we show that these weak annotations improve quality assessment over single-task baselines (F1: 0.875 vs. 0.863 on EyeQ, and 0.778 vs. 0.763 on DeepDRiD), matching or surpassing existing methods. The multi-task model achieved performance statistically comparable to the Teacher for most detail prediction tasks (p > 0.05). In a newly annotated EyeQ subset released with this paper, our model performed similarly to experts, suggesting that pseudo-label noise aligns with expert variability. Our main finding is that the proposed semi-supervised approach not only improves overall quality assessment but also provides interpretable feedback on capture conditions (illumination, clarity, contrast). This enhances interpretability at no extra manual labeling cost and offers clinically actionable outputs to guide image recapture.
Abstract（参考訳）: 網膜画像品質評価(RIQA)は、眼疾患のコンピュータ支援診断を支援する。しかし、ほとんどのツールは画像の全体的な品質だけを分類する。このギャップは主に詳細なアノテーションのコストが高いためです。本稿では,この制限を緩和するために,マルチタスクフレームワーク内で手動ラベルと品質の詳細の擬似ラベルを組み合わせた,半教師付きハイブリッド学習手法を提案する。我々の目標は、広範囲な手動ラベリングを必要とせず、より解釈可能なRIQAモデルを得ることである。擬似ラベルは、小さなデータセットでトレーニングされた教師モデルによって生成され、マルチタスク設定で事前訓練されたモデルを微調整するために使用される。 ResNet-18のバックボーンを用いて、これらの弱いアノテーションはシングルタスクベースライン(EyeQでは0.875 vs. 0.863、DeepDRiDでは0.778 vs. 0.763)に対する品質評価を改善し、既存のメソッドをマッチングまたは超えることを示した。マルチタスクモデルは、最も詳細な予測タスク(p > 0.05)において、統計学的に教師に匹敵する性能を達成した。本論文で新たに発表されたEyeQサブセットでは,本モデルが専門家と類似し,擬似ラベルノイズが専門家の変動と一致していることが示唆された。我々の主な発見は、提案手法が全体的な品質評価を改善するだけでなく、捕獲条件(照度、明度、コントラスト)に対する解釈可能なフィードバックも提供することである。これにより、余分な手動ラベリングコストを伴わずに解釈可能性を高め、画像再取り込みを誘導するための臨床的に実行可能な出力を提供する。

論文の概要: Semi-Supervised Multi-Task Learning for Interpretable Quality As- sessment of Fundus Images

関連論文リスト