論文の概要: Anatomy-Slot: Unsupervised Anatomical Factorization for Homologous Bilateral Reasoning in Retinal Diagnosis
- arxiv url: http://arxiv.org/abs/2605.12929v1
- Date: Wed, 13 May 2026 03:04:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.777925
- Title: Anatomy-Slot: Unsupervised Anatomical Factorization for Homologous Bilateral Reasoning in Retinal Diagnosis
- Title(参考訳): Anatomy-Slot: 網膜診断におけるホモロジーバイラテラル推論のための教師なし解剖学的因子化
- Authors: Yingzhe Ma, Xiao Yang, Yuguo Yin, Zheyu Wang,
- Abstract要約: Anatomy-Slotは、トークンをスロットにパッチし、横断的注意によって視線を横切るスロットをアライメントすることで、教師なしの解剖学的ボトルネックを導入する。
ODIR-5Kと$n=10$のシードでは、一致したViT-LベースラインよりもAUCを4.2%改善する。
また、REFUGEとクロスアテンション・ローカライゼーション分析に基づく定量的光学ディスクを報告する。
- 参考スコア(独自算出の注目度): 5.803785816612362
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retinal diagnosis is inherently bilateral: clinicians compare homologous structures across eyes (e.g., optic disc asymmetry), yet most deep models operate on monocular representations. We investigate whether explicit structural correspondence improves diagnosis, and propose Anatomy-Slot to operationalize this hypothesis. Anatomy-Slot introduces an unsupervised anatomical bottleneck by decomposing patch tokens into slots and aligning slots across eyes via bidirectional cross-attention. On ODIR-5K with $n=10$ seeds, the method improves AUC by 4.2% over a matched ViT-L baseline (95% CIs; Wilcoxon signed-rank test, $W=0$, $p=0.002$). Pairing disruption and stress testing under Gaussian noise provide controlled tests of correspondence dependence and robustness under corruption. We further report quantitative optic disc grounding on REFUGE and cross-attention localization analysis.
- Abstract(参考訳): 臨床医は目全体(例えば、光ディスク非対称性)のホモロジー構造を比較するが、ほとんどの深部モデルは単分子的表現で機能する。
明示的な構造対応が診断を改善するかどうかを考察し,この仮説を運用するために解剖スロットを提案する。
Anatomy-Slotは、パッチトークンをスロットに分解し、双方向のクロスアテンションを介して、目を通してスロットを調整することで、教師なしの解剖学的ボトルネックを導入する。
ODIR-5Kと$n=10$のシードでは、一致したViT-Lベースライン(95%CI、ウィルコクソン署名ランクテスト、$W=0$、$p=0.002$)よりもAUCを4.2%改善する。
ガウス雑音下でのペアリング破壊と応力試験は、汚損下での対応性および堅牢性の制御試験を提供する。
また、REFUGEとクロスアテンション・ローカライゼーション分析に基づく定量的光学ディスクを報告する。
関連論文リスト
- Anatomy-Aware Unsupervised Detection and Localization of Retinal Abnormalities in Optical Coherence Tomography [4.828654519487229]
教師なしの異常検出フレームワークは、病変のアノテーションなしで正常な網膜解剖の規範的な分布を学習する。
網膜層を意識した3重項学習と構造的三重項学習を併用し,病的表現と健康的表現を分離する。
Kermany データセット (AUROC: 0.799) では,VAE, VQVAE, VQGAN, f-AnoGAN ベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2026-04-24T01:09:05Z) - PHASOR: Anatomy- and Phase-Consistent Volumetric Diffusion for CT Virtual Contrast Enhancement [60.81732730684265]
本稿では,高忠実度仮想コントラスト拡張(VCE)のための体積拡散フレームワークPHASORを紹介する。
我々は、CTボリュームをコヒーレントシーケンスとして扱うことにより、ビデオ拡散モデルを利用して、構造的コヒーレンスとボリューム精度を向上させる。
まず, 解剖学的意味論に固有の拡張パターンを固定し, 臓器特異的なメモリを付加して, より詳細な情報を収集する。
第二に、インテンシティ・フェイズ・アウェアメント・アライメント・アライメント(IP-REPA)は、不完全な空間アライメントの影響を緩和しつつ、複雑なコントラスト信号を強調する。
論文 参考訳(メタデータ) (2026-04-01T15:57:18Z) - Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - ARIADNE: A Perception-Reasoning Synergy Framework for Trustworthy Coronary Angiography Analysis [11.092207850601488]
ARIADNEは2段階のフレームワークを結合し,RLに基づく狭窄検出のための診断的推論を行う。
1,400の臨床血管造影では、ARIADNEは最先端のセンターラインDice 0.838を達成し、幾何学的ベースラインと比較して偽陽性を41%減少させる。
論文 参考訳(メタデータ) (2026-03-19T17:25:19Z) - Topology-Guided Biomechanical Profiling: A White-Box Framework for Opportunistic Screening of Spinal Instability on Routine CT [22.852860041642078]
Topology-Guided Biomechanical Profiling (TGBP)は、構造的推論から解剖学的知覚を分離する監査可能なホワイトボックスフレームワークである。
TGBPは2つの決定論的幾何学的革新についてSINSの評価をアンカーする: (i) 後外側境界の曖昧さを解決するための運河参照分割、 (ii) 共分散型指向的境界箱(OBB)による文脈認識型形態素正規化 (i) 脊椎の崩壊の定量化。
論文 参考訳(メタデータ) (2026-03-17T06:34:18Z) - Context-Aware Asymmetric Ensembling for Interpretable Retinopathy of Prematurity Screening via Active Query and Vascular Attention [1.8420107091891775]
未熟児網膜症(ROP:Retinopathy of Prematurity)は、小児期盲症の主要な原因の一つである。
現在のディープラーニングモデルは、大きなプライベートデータセットとパッシブマルチモーダル融合に大きく依存している。
本研究では,2つの専門ストリームによる臨床推論をシミュレートする文脈認識非対称アンサンブルモデル(CAAアンサンブル)を提案する。
論文 参考訳(メタデータ) (2026-02-05T02:06:26Z) - Multi-View Stenosis Classification Leveraging Transformer-Based Multiple-Instance Learning Using Real-World Clinical Data [76.89269238957593]
冠動脈狭窄は心血管疾患の主要な原因であり,多発血管造影で冠動脈を解析し診断した。
患者レベルの狭窄分類のためのトランスフォーマーベースマルチビューマルチインスタンス学習フレームワークであるSegmentMILを提案する。
論文 参考訳(メタデータ) (2026-02-02T13:07:52Z) - Hide-and-Seek Attribution: Weakly Supervised Segmentation of Vertebral Metastases in CT [68.09387763135236]
脊椎レベルの健康・悪性のラベルにのみ、病変マスクを伴わずに訓練を施した弱い指導方法を提案する。
マスクの監視がないにも関わらず,強い爆発・解析性能を達成する。
論文 参考訳(メタデータ) (2025-12-07T14:03:28Z) - RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.25593938175618]
RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文 参考訳(メタデータ) (2025-06-17T03:10:33Z) - Act Like a Radiologist: Towards Reliable Multi-view Correspondence
Reasoning for Mammogram Mass Detection [49.14070210387509]
マンモグラム質量検出のための解剖学的グラフ畳み込みネットワーク(AGN)を提案する。
AGNはマンモグラムの質量検出用に調整されており、既存の検出手法を多視点推論能力で実現している。
2つの標準ベンチマークの実験によると、AGNは最先端のパフォーマンスを大幅に上回っている。
論文 参考訳(メタデータ) (2021-05-21T06:48:34Z) - Anatomy-Aware Siamese Network: Exploiting Semantic Asymmetry for
Accurate Pelvic Fracture Detection in X-ray Images [36.35987775099686]
本研究では,空間トランス層で強化されたシームズネットワーク上に構築された新しいフラクチャー検出フレームワークを提案する。
提案法は, 特発性患者2,359例のPXRに対して広範囲に評価されている。
これは最先端の骨折検出方法の中でも最高であり、臨床症状の改善がある。
論文 参考訳(メタデータ) (2020-07-03T02:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。