論文の概要: Context-Aware Asymmetric Ensembling for Interpretable Retinopathy of Prematurity Screening via Active Query and Vascular Attention
- arxiv url: http://arxiv.org/abs/2602.05208v1
- Date: Thu, 05 Feb 2026 02:06:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.711497
- Title: Context-Aware Asymmetric Ensembling for Interpretable Retinopathy of Prematurity Screening via Active Query and Vascular Attention
- Title(参考訳): 未熟検診の可読性網膜症に対する文脈認識型非対称組換え法 : 能動的検索と血管注意による検討
- Authors: Md. Mehedi Hassan, Taufiq Hasan,
- Abstract要約: 未熟児網膜症(ROP:Retinopathy of Prematurity)は、小児期盲症の主要な原因の一つである。
現在のディープラーニングモデルは、大きなプライベートデータセットとパッシブマルチモーダル融合に大きく依存している。
本研究では,2つの専門ストリームによる臨床推論をシミュレートする文脈認識非対称アンサンブルモデル(CAAアンサンブル)を提案する。
- 参考スコア(独自算出の注目度): 1.8420107091891775
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retinopathy of Prematurity (ROP) is among the major causes of preventable childhood blindness. Automated screening remains challenging, primarily due to limited data availability and the complex condition involving both structural staging and microvascular abnormalities. Current deep learning models depend heavily on large private datasets and passive multimodal fusion, which commonly fail to generalize on small, imbalanced public cohorts. We thus propose the Context-Aware Asymmetric Ensemble Model (CAA Ensemble) that simulates clinical reasoning through two specialized streams. First, the Multi-Scale Active Query Network (MS-AQNet) serves as a structure specialist, utilizing clinical contexts as dynamic query vectors to spatially control visual feature extraction for localization of the fibrovascular ridge. Secondly, VascuMIL encodes Vascular Topology Maps (VMAP) within a gated Multiple Instance Learning (MIL) network to precisely identify vascular tortuosity. A synergistic meta-learner ensembles these orthogonal signals to resolve diagnostic discordance across multiple objectives. Tested on a highly imbalanced cohort of 188 infants (6,004 images), the framework attained State-of-the-Art performance on two distinct clinical tasks: achieving a Macro F1-Score of 0.93 for Broad ROP staging and an AUC of 0.996 for Plus Disease detection. Crucially, the system features `Glass Box' transparency through counterfactual attention heatmaps and vascular threat maps, proving that clinical metadata dictates the model's visual search. Additionally, this study demonstrates that architectural inductive bias can serve as an effective bridge for the medical AI data gap.
- Abstract(参考訳): 未熟児網膜症(ROP)は予防可能な小児期盲症の主要な原因の一つである。
自動スクリーニングは、主にデータ可用性の制限と、構造的なステージングと微小血管の異常の両方を含む複雑な状態のため、依然として困難である。
現在のディープラーニングモデルは、大きなプライベートデータセットと受動的マルチモーダル融合に大きく依存している。
そこで我々は,2つの専門ストリームによる臨床推論をシミュレートする文脈認識非対称アンサンブルモデル(CAAアンサンブルモデル)を提案する。
まず、Multi-Scale Active Query Network (MS-AQNet) が構造スペシャリストとして機能し、臨床コンテキストを動的クエリベクトルとして利用して、線維血管尾根の局所化のための視覚的特徴抽出を空間的に制御する。
第2に、VascuMILは血管トポロジマップ(VMAP)をゲート型多重インスタンス学習(MIL)ネットワークにエンコードし、血管の好奇心を正確に識別する。
相乗的メタリアナーは、これらの直交シグナルをアンサンブルして、複数の目的にまたがる診断の不一致を解決する。
188人の乳幼児(6,004画像)の高度にバランスの取れないコホートで試験され、このフレームワークは2つの異なる臨床課題において、Broad ROPステージングのためのマクロF1スコア(0.93)、Plus Disease DetectionのためのAUC(0.996)を達成した。
重要なことに、このシステムは反ファクトの注意熱マップと血管の脅威マップを通して「Glass Box」の透明性を特徴とし、臨床メタデータがモデルの視覚検索を規定していることを証明している。
さらに、この研究は、設計上の帰納バイアスが、医療AIデータギャップの効果的なブリッジとして機能することを示した。
関連論文リスト
- Multi-View Stenosis Classification Leveraging Transformer-Based Multiple-Instance Learning Using Real-World Clinical Data [76.89269238957593]
冠動脈狭窄は心血管疾患の主要な原因であり,多発血管造影で冠動脈を解析し診断した。
患者レベルの狭窄分類のためのトランスフォーマーベースマルチビューマルチインスタンス学習フレームワークであるSegmentMILを提案する。
論文 参考訳(メタデータ) (2026-02-02T13:07:52Z) - MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement [63.82954136824963]
医療ビジョンランゲージモデルでは、現実世界のシナリオで必要とされる複雑な臨床推論を伴う知覚タスクが優れている。
本稿ではドメイン固有の適応とガイドライン強化を通じてこれらの課題に対処する新しい推論MedVLMを提案する。
論文 参考訳(メタデータ) (2026-01-16T02:32:07Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - WMKA-Net: A Weighted Multi-Kernel Attention Network for Retinal Vessel Segmentation [0.48536814705421105]
本研究では,マルチスケール機能融合の不十分,文脈連続性の破壊,ノイズ干渉といった問題に対処する二段階解を提案する。
第1段では、階層的な適応的畳み込みを使用して、キャピラリーからメイン船へのクロススケール機能を動的にマージするマルチスケール核融合モジュール(Multi-Scale Fusion Module, RMS)を採用している。
第2段階では、軸方向の経路を通じて長距離血管の連続性をモデル化する血管指向性注意機構が導入された。
論文 参考訳(メタデータ) (2025-04-21T06:32:25Z) - RURANET++: An Unsupervised Learning Method for Diabetic Macular Edema Based on SCSE Attention Mechanisms and Dynamic Multi-Projection Head Clustering [13.423253964156117]
RURANET++は、糖尿病黄斑浮腫(DME)の教師なし学習に基づく自動診断システムである
特徴処理中、トレーニング済みのGoogLeNetモデルは網膜画像から深い特徴を抽出し、PCAベースの次元を50次元に減らして計算効率を向上する。
実験の結果,複数の測定値に対して優れた性能を示し,最大精度(0.8411),精度(0.8593),リコール(0.8411),F1スコアを異常なクラスタリング品質で達成した。
論文 参考訳(メタデータ) (2025-02-27T16:06:57Z) - Adversarial Vessel-Unveiling Semi-Supervised Segmentation for Retinopathy of Prematurity Diagnosis [9.683492465191241]
広範囲な手動血管アノテーションを必要とせず,ROP研究を進めるための半教師付きセグメンテーションフレームワークを提案する。
ラベル付きデータにのみ依存する従来の手法とは異なり,本手法では不確実性重み付き容器公開モジュールとドメイン対向学習を統合している。
我々は、パブリックデータセットと社内ROPデータセットに対するアプローチを検証し、複数の評価指標で優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-11-14T02:40:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。