論文の概要: HD-DinoMoE: A Class-Aware Hierarchical Dual Mixture-of-Experts Network for Scleral Anomaly Segmentation in Complex Acquisition Scenarios
- arxiv url: http://arxiv.org/abs/2606.04888v1
- Date: Wed, 03 Jun 2026 13:48:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.794209
- Title: HD-DinoMoE: A Class-Aware Hierarchical Dual Mixture-of-Experts Network for Scleral Anomaly Segmentation in Complex Acquisition Scenarios
- Title(参考訳): HD-DinoMoE:複雑獲得シナリオにおける強膜異常分割のための階層的二元混合ネットワーク
- Authors: Yinxiang Yu, Maoxiang Chu, Qi Niu, Guanghu Liu, Wei Xu, Haotian Wang, Zhi Chen, Yutian Zhu, Yuelong Fan, Guanghao Liao,
- Abstract要約: 本研究は,TCMにインスパイアされた人工知能眼科診断システム(TAO)について述べる。
本稿では,HD-DinoMoEを提案する。
HD-DinoMoEは、クラス対応のデュアルストリームDINOv3と、クラス固有のデコードを組み合わせて、Vessels、Yellow and Black Spots、Blood Spotsを分割する。
- 参考スコア(独自算出の注目度): 8.3383077730857
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional Chinese Medicine (TCM) ocular inspection provides empirical cues for assessing scleral surface anomalies, but its clinical use remains subjective and difficult to quantify. To support intelligent and quantifiable ocular inspection, this study presents the TCM-inspired Artificial Intelligence Ocular Auxiliary Diagnosis System (TAO) and focuses on pixel-level scleral surface anomaly segmentation. For clinical and user-acquired images affected by multi-source distributional discrepancies, diverse anomaly morphologies, and scleral specular reflection (SSR), we propose HD-DinoMoE, a class-aware hierarchical dual mixture-of-experts network. HD-DinoMoE combines class-aware dual-stream DINOv3 feature fusion with class-specific multi-expert decoding to segment Vessels, Yellow and Black Spots, and Blood Spots. A three-stage backbone-frozen routing strategy stabilizes dual-backbone adaptation; Progressive Confidence Penalty (PCP) Loss reduces high-confidence false positives and segmentation leakage in SSR regions; and Class-Aware Adaptive Sample Weighting (CA-ASW) balances sample- and class-level training contributions. We further construct the Multi-label Scleral Anomaly Segmentation Dataset (ML-SASD), a new benchmark with Clinical, Wild, and Mix settings and pixel-wise annotations for three anomaly categories. On ML-SASD-Mix, HD-DinoMoE achieves a mean Dice of 72.11% and a mean Intersection-over-Union of 58.44%, while maintaining favorable boundary localization and specular-region false-positive control. It also shows competitive generalization on the Vessels subset of the public SBVPI dataset. These results indicate that HD-DinoMoE provides a feasible segmentation solution for TAO under complex acquisition scenarios. The code and data access information are available at https://github.com/FX-CMX/HD-DinoMoE.
- Abstract(参考訳): 伝統的な中国医学(TCM)の眼科検査は、頭蓋表面の異常を評価するための経験的手がかりを提供するが、その臨床利用は主観的で定量化が難しい。
知的で定量的な眼科検査を支援するために,TCMにインスパイアされた人工知能眼補助診断システム(TAO)を提示し,画素レベルの硬化面異常セグメンテーションに焦点を当てた。
マルチソース分布の相違,多彩な異常形態,および硬化性スペックル反射(SSR)に影響を及ぼす臨床およびユーザ取得画像に対して,クラス対応の階層的デュアル・オブ・エキスパート・ネットワークであるHD-DinoMoEを提案する。
HD-DinoMoEは、クラス対応のデュアルストリームDINOv3とクラス固有のマルチエキスパートデコードを組み合わせて、Vessels、Yellow and Black Spots、Blood Spotsを分割する。
3段階のバックボーン凍結ルーティング戦略は、二重バックボーン適応を安定化させ、プログレッシブ信頼度(PCP)損失はSSR領域における高い信頼度偽陽性とセグメンテーションリークを減少させ、クラスアウェア適応サンプル重み付け(CA-ASW)はサンプルレベルとクラスレベルのトレーニングコントリビューションのバランスをとる。
さらに,3つの異常カテゴリに対して,臨床,ワイルド,ミキシング設定と画素ワイズアノテーションを併用した新しいベンチマークであるML-SASD(Multi-label Scleral Anomaly Segmentation Dataset)を構築した。
ML-SASD-Mixでは、HD-DinoMoEは平均Dice 72.11%、平均Intersection-over-Union 58.44%を達成し、良好な境界ローカライゼーションとスペクトル領域偽陽性制御を維持している。
また、パブリックなSBVPIデータセットのVesselsサブセット上での競合一般化も示す。
これらの結果から,HD-DinoMoEは複雑な取得シナリオ下でTAOに対して実行可能なセグメンテーションソリューションを提供することが示された。
コードとデータアクセス情報はhttps://github.com/FX-CMX/HD-DinoMoE.comで公開されている。
関連論文リスト
- DMDSC: A Dynamic-Margin Deep Simplex Classifier for Open-Set Recognition on Medical Image Datasets [1.6076071340549412]
医用画像データセットは、しばしば極端な階級的不均衡によって特徴づけられる。
この不均衡は、オープンセット認識(OSR: Open-Set Recognition)において二重の課題となり、モデルは、臨床環境での見知らぬトレーニングにおいて、未知のサンプルを確実に拒否しながら、既知のクラスにおける高い分類精度を維持する必要がある。
本稿では, ダイナミック・マージン・アプローチを特徴とする拡張フレームワークを提案する。本手法では, 周波数に基づいてクラス固有のマージンを自動的に適応し, 高いペナルティとより厳格な特徴クラスタリングを行うことで, データの不均衡を解消する。
論文 参考訳(メタデータ) (2026-05-01T13:57:41Z) - Multimodal Visual Surrogate Compression for Alzheimer's Disease Classification [69.87877580725768]
MVSC(Multimodal Visual Surrogate Compression)は、大規模な3D sMRIボリュームをコンパクトな2D機能に圧縮し、適応させることを学ぶ。
MVSCには2つの重要なコンポーネントがある: テキストガイダンスの下でグローバルなクロススライスコンテキストをキャプチャするボリュームコンテキストと、テキストエンハンスでパッチワイズな方法でスライスレベルの情報を集約するAdaptive Slice Fusionモジュール。
論文 参考訳(メタデータ) (2026-01-29T13:05:46Z) - DinoAtten3D: Slice-Level Attention Aggregation of DinoV2 for 3D Brain MRI Anomaly Classification [2.731729370870452]
医用画像の異常検出と分類は早期診断には重要であるが, 注釈付きデータ, クラス不均衡, 専門家によるラベル付けのコストが高いため, 依然として困難である。
本稿では,3次元画像異常分類に特化して,注目に基づくグローバルアグリゲーションフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-15T23:31:40Z) - MSA-UNet3+: Multi-Scale Attention UNet3+ with New Supervised Prototypical Contrastive Loss for Coronary DSA Image Segmentation [8.850534640462081]
冠状DSA画像のセグメンテーションを高めるために,教師付きおよび原型的コントラスト学習を融合させるスーパービジョン型コントラスト損失を提案する。
MSA-UNet3+: Multi-Scale Attention-Enhanced UNet3+アーキテクチャで提案したSPCL損失を実装した。
プライベート冠DSAデータセットの実験では、MSA-UNet3+が最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2025-04-07T15:35:30Z) - Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning [51.525891360380285]
HDMILは階層的な蒸留マルチインスタンス学習フレームワークであり、無関係なパッチを排除して高速かつ正確な分類を実現する。
HDMILは、動的マルチインスタンスネットワーク(DMIN)と軽量インスタンスプレスクリーンネットワーク(LIPN)の2つの重要なコンポーネントで構成されている。
論文 参考訳(メタデータ) (2025-02-28T15:10:07Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。