論文の概要: PSScreen V2: Partially Supervised Multiple Retinal Disease Screening
- arxiv url: http://arxiv.org/abs/2510.22589v1
- Date: Sun, 26 Oct 2025 09:09:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.255117
- Title: PSScreen V2: Partially Supervised Multiple Retinal Disease Screening
- Title(参考訳): PSScreen V2: 部分的に複数の網膜疾患のスクリーニングを監督
- Authors: Boyi Zheng, Yalin Zheng, Hrvoje Bogunović, Qing Liu,
- Abstract要約: PSScreen V2は、複数の網膜疾患スクリーニングのための部分的に制御された自己学習フレームワークである。
ラベルの欠如とドメインシフトの課題に対処するため、異なる分布を持つ複数のラベル付きデータセットから学習する。
最先端の性能と優れたドメイン一般化能力を実現する。
- 参考スコア(独自算出の注目度): 6.181991548659357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we propose PSScreen V2, a partially supervised self-training framework for multiple retinal disease screening. Unlike previous methods that rely on fully labelled or single-domain datasets, PSScreen V2 is designed to learn from multiple partially labelled datasets with different distributions, addressing both label absence and domain shift challenges. To this end, PSScreen V2 adopts a three-branch architecture with one teacher and two student networks. The teacher branch generates pseudo labels from weakly augmented images to address missing labels, while the two student branches introduce novel feature augmentation strategies: Low-Frequency Dropout (LF-Dropout), which enhances domain robustness by randomly discarding domain-related low-frequency components, and Low-Frequency Uncertainty (LF-Uncert), which estimates uncertain domain variability via adversarially learned Gaussian perturbations of low-frequency statistics. Extensive experiments on multiple in-domain and out-of-domain fundus datasets demonstrate that PSScreen V2 achieves state-of-the-art performance and superior domain generalization ability. Furthermore, compatibility tests with diverse backbones, including the vision foundation model DINOv2, as well as evaluations on chest X-ray datasets, highlight the universality and adaptability of the proposed framework. The codes are available at https://github.com/boyiZheng99/PSScreen_V2.
- Abstract(参考訳): 本研究では,多発性網膜疾患スクリーニングのための自己学習フレームワークであるPSScreen V2を提案する。
完全なラベル付きデータセットや単一ドメインのデータセットに依存する従来の方法とは異なり、PSScreen V2は、ラベルの欠如とドメインシフトの課題に対処するために、複数の部分ラベル付きデータセットから学習するように設計されている。
この目的のために、PSScreen V2は1人の教師と2人の学生ネットワークを持つ3ブランチアーキテクチャを採用している。
教師ブランチは、弱い強調画像から擬似ラベルを生成し、不足ラベルに対応するために、2つの学生ブランチは、ドメイン関連低周波成分をランダムに破棄することでドメインの堅牢性を高める低周波ドロップアウト(LF-Dropout)と、低周波統計の逆学習による不確実なドメインの変動を推定する低周波アンサーティ(LF-Uncert)という、新しい特徴増強戦略を導入する。
複数のドメイン内およびドメイン外ファンドデータセットに対する大規模な実験は、PSScreen V2が最先端のパフォーマンスと優れたドメイン一般化能力を達成することを示した。
さらに、ビジョンファウンデーションモデルDINOv2を含む多様なバックボーンとの互換性テストや胸部X線データセットの評価では、提案フレームワークの普遍性と適応性を強調している。
コードはhttps://github.com/boyiZheng99/PSScreen_V2で公開されている。
関連論文リスト
- Few-shot Class-incremental Fault Diagnosis by Preserving Class-Agnostic Knowledge with Dual-Granularity Representations [16.182587421358235]
FSC-FD(Few-Shot Class-Incremental Fault Diagnosis)は,実世界の産業システムにおいて重要である。
本稿では,Dual-Granularity Guidance Network(DGGN)と呼ばれる,Dual-Granularity Representationsに基づく新しいフレームワークを提案する。
提案したDGGNは最先端のFSC-FD手法と比較して診断性能と安定性に優れる。
論文 参考訳(メタデータ) (2025-08-16T03:14:07Z) - PSScreen: Partially Supervised Multiple Retinal Disease Screening [1.9390337588247535]
PSScreenは、部分的に監視された多発性網膜疾患スクリーニングモデルである。
PSScreenは6つの網膜疾患の検出性能を大幅に向上させる。
論文 参考訳(メタデータ) (2025-08-14T11:39:15Z) - Prior2Former -- Evidential Modeling of Mask Transformers for Assumption-Free Open-World Panoptic Segmentation [74.55677741919035]
顕在学習に根ざしたセグメンテーション・ビジョン・トランスフォーマの最初のアプローチである Prefer2Former (P2F) を提案する。
P2Fは、ピクセル単位のバイナリマスク割り当てにおいて、モデル不確実性を計算するためのベータを組み込むことで、マスクビジョントランスフォーマーアーキテクチャを拡張している。
未知のクラスに対処するほとんどのセグメンテーションモデルとは異なり、P2FはOODデータサンプルへのアクセスや、ヴォイド(ラベルなし)クラスに対する対照的なトレーニングなしで動作する。
論文 参考訳(メタデータ) (2025-04-07T08:53:14Z) - Graph Domain Adaptation with Dual-branch Encoder and Two-level Alignment for Whole Slide Image-based Survival Prediction [40.21378307349686]
本稿では,WSI ドメイン間の機能およびカテゴリレベルのアライメントを検討するために,デュアルブランチと2レベルアライメント(DETA)フレームワークを提案する。
当社の作業は、WSIデータ分析におけるドメインシフト問題を緩和する最初の試みです。
論文 参考訳(メタデータ) (2024-11-21T10:35:16Z) - Hierarchical Forgery Classifier On Multi-modality Face Forgery Clues [61.37306431455152]
我々は,HFC-MFFD (hierarchical Forgery for Multi-modality Face Forgery Detection) を提案する。
HFC-MFFDは、マルチモーダルシナリオにおけるフォージェリー認証を強化するために、堅牢なパッチベースのハイブリッド表現を学習する。
クラス不均衡問題を緩和し、さらに検出性能を高めるために、特定の階層的な顔偽造を提案する。
論文 参考訳(メタデータ) (2022-12-30T10:54:29Z) - Target and Task specific Source-Free Domain Adaptive Image Segmentation [73.78898054277538]
ソースフリー領域適応画像分割のための2段階のアプローチを提案する。
我々は,高エントロピー領域を抑えつつ,ターゲット固有の擬似ラベルを生成することに注力する。
第2段階では、タスク固有の表現にネットワークを適用することに重点を置いている。
論文 参考訳(メタデータ) (2022-03-29T17:50:22Z) - N\"UWA-LIP: Language Guided Image Inpainting with Defect-free VQGAN [130.84343735976233]
本稿では,欠陥のないVQGANとマルチパースペクティブシーケンス(MP-S2S)を組み合わせたN"UWA-LIPを提案する。
特に、DF-VQGANは、受容拡散を制御する相対推定を導入し、情報を保護するために対称接続を採用する。
MP-S2Sは、低レベル画素と高レベルトークンの両方を含む相補的な視点から視覚情報を強化する。
論文 参考訳(メタデータ) (2022-02-10T13:10:23Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Camera Invariant Feature Learning for Generalized Face Anti-spoofing [95.30490139294136]
本稿では,特徴レベルの取得カメラから固有のばらつきの影響を排除したフレームワークについて述べる。
実験により、提案手法はデータセット内設定とデータセット間設定の両方でより良いパフォーマンスを達成できることが示された。
論文 参考訳(メタデータ) (2021-01-25T13:40:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。