論文の概要: Hierarchical Attention for Sparse Volumetric Anomaly Detection in Subclinical Keratoconus
- arxiv url: http://arxiv.org/abs/2512.03346v2
- Date: Wed, 10 Dec 2025 21:30:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 14:11:14.99609
- Title: Hierarchical Attention for Sparse Volumetric Anomaly Detection in Subclinical Keratoconus
- Title(参考訳): 鎖骨下角膜における小体積異常検出のための階層的注意
- Authors: Lynn Kandakji, William Woof, Nikolas Pontikos,
- Abstract要約: 階層アーキテクチャーは21~23%の感度と特異性を実現します。
力学解析は、この利点が空間スケールのアライメントから生じることを示唆している。
サブクリニカルケースは、健康的または過剰な病理学的ボリュームよりも長い空間的な統合を必要とする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The detection of weak, spatially distributed anomalies in volumetric medical imaging remains challenging due to the difficulty of integrating subtle signals across non-adjacent regions. This study presents a controlled comparison of sixteen architectures spanning convolutional, hybrid, and transformer families for subclinical keratoconus detection from three-dimensional anterior segment optical coherence tomography (AS-OCT). The results demonstrate that hierarchical architectures achieve 21-23% higher sensitivity and specificity, particularly in the difficult subclinical regime, outperforming both convolutional neural networks (CNNs) and global-attention Vision Transformer (ViT) baselines. Mechanistic analyses indicate that this advantage arises from spatial scale alignment: hierarchical windowing produces effective receptive fields matched to the intermediate extent of subclinical abnormalities, avoiding the excessive locality observed in convolutional models and the diffuse integration characteristic of pure global attention. Attention-distance measurements show that subclinical cases require longer spatial integration than healthy or overtly pathological volumes, with hierarchical models exhibiting lower variance and more anatomically coherent focus. Representational similarity further indicates that hierarchical attention learns a distinct feature space that balances local structure sensitivity with flexible long-range interactions. Auxiliary age and sex prediction tasks demonstrate moderately high cross-task consistency, supporting the generalizability of these inductive principles. The findings provide design guidance for volumetric anomaly detection and highlight hierarchical attention as a principled approach for early pathological change analysis in medical imaging.
- Abstract(参考訳): 非隣接領域における微妙な信号の統合が困難であることから, ボリューム医療画像における弱い空間分布異常の検出はいまだに困難である。
本研究では,3次元前方光コヒーレンストモグラフィー(AS-OCT)による角膜下角膜検出のための,畳み込み,ハイブリッド,トランスフォーマーファミリーにまたがる16のアーキテクチャの制御比較を行った。
その結果、階層型アーキテクチャは21~23%の感度と特異性、特に難易度のサブクリニカルなシステムにおいて、畳み込みニューラルネットワーク(CNN)とグローバルアテンション・ビジョン・トランスフォーマー(ViT)のベースラインを上回っていることが示された。
階層的ウィンドウニングは、畳み込みモデルで観測される過度な局所性や、純粋なグローバルな注意の拡散積分特性を回避し、サブクリニカルな異常の中間的な範囲に適合する効果的な受容場を生成する。
アテンション・ディスタンス測定では、サブクリニカルケースは健康的または過度に病理的なボリュームよりも長い空間的統合を必要とし、階層モデルはより低い分散とより解剖学的に一貫性のある焦点を示す。
表現的類似性はさらに、階層的注意が局所構造感度とフレキシブルな長距離相互作用のバランスをとる特徴空間を学習していることを示している。
補助年齢と性予測タスクは、これらの帰納的原則の一般化性を支持する、適度に高いクロスタスク一貫性を示す。
本研究は, 画像診断における早期病理組織学的変化解析の原則的アプローチとして, ボリューム異常検出のための設計指針を提供し, 階層的注意を浮き彫りにするものである。
関連論文リスト
- Silhouette-to-Contour Registration: Aligning Intraoral Scan Models with Cephalometric Radiographs [10.70146635420186]
提案するDorgeSCRは,高精度かつ解釈可能なシルエット・ツー・コントゥール登録のための,ポーズ安定・輪郭誘導型フレームワークである。
当科で経験した34症例の歯科SCRについて検討した。
論文 参考訳(メタデータ) (2025-11-18T10:50:04Z) - Bidirectional Mammogram View Translation with Column-Aware and Implicit 3D Conditional Diffusion [17.309030641962]
ビュー・ツー・ビューの翻訳は、行方不明のビューを回復し、病変のアライメントを改善するのに役立つ。
自然画像とは異なり、マンモグラフィーにおけるこの課題は、X線投影において大きな非剛性変形と重い組織が重なり合うため、非常に困難である。
本稿では,新しい双方向マンモグラムビュー変換フレームワークであるカラム・アウェア・インプリシット3次元拡散(CA3D-Diff)を提案する。
論文 参考訳(メタデータ) (2025-10-06T15:48:27Z) - AI-CNet3D: An Anatomically-Informed Cross-Attention Network with Multi-Task Consistency Fine-tuning for 3D Glaucoma Classification [0.4999814847776097]
緑内障は進行性眼疾患であり、視神経の損傷を引き起こす。
本稿では、3次元畳み込みニューラルネットワークにクロスアテンション機構を統合するハイブリッドディープラーニングモデルを提案する。
我々は、AI-CNet3D (AI-See'-Net3D) と命名し、3Dデータを操作する解剖学的インフォームド・クロスアテンション・ネットワークとしての設計を反映した。
論文 参考訳(メタデータ) (2025-10-01T13:30:55Z) - PHASE-Net: Physics-Grounded Harmonic Attention System for Efficient Remote Photoplethysmography Measurement [63.007237197267834]
既存のディープラーニング手法は、主に生理学的モニタリングであり、理論的な堅牢性を欠いている。
本研究では,Navier-Stokes方程式のヘモダイナミックスから導かれる物理インフォームド r パラダイムを提案し,パルス信号が2次系に従うことを示す。
これは、時間的円錐ネットワーク(TCN)を使用する理論的正当性を提供する。
Phase-Netは高い効率で最先端のパフォーマンスを実現し、理論上は基礎的でデプロイ可能な r ソリューションを提供する。
論文 参考訳(メタデータ) (2025-09-29T14:36:45Z) - TRELLIS-Enhanced Surface Features for Comprehensive Intracranial Aneurysm Analysis [2.624902795082451]
頭蓋内大動脈瘤は, 注釈付き3Dデータによる検出, デライン化, モデル化が困難である。
本稿では,大規模非医学的3次元データセットに基づいて学習した生成モデルTRELLISで学習した潜在幾何学的埋め込みを利用したクロスドメイン特徴伝達手法を提案する。
論文 参考訳(メタデータ) (2025-09-03T07:51:17Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - 3D Vessel Reconstruction from Sparse-View Dynamic DSA Images via Vessel Probability Guided Attenuation Learning [79.60829508459753]
現在の商用デジタルサブトラクション・アンジオグラフィー(DSA)システムは通常、再構築を行うために数百のスキャンビューを要求する。
スパース・ビューDSA画像のダイナミックな血流と不十分な入力は,3次元血管再建作業において重要な課題である。
本稿では,時間に依存しない容器確率場を用いてこの問題を効果的に解くことを提案する。
論文 参考訳(メタデータ) (2024-05-17T11:23:33Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Explainable multiple abnormality classification of chest CT volumes with
AxialNet and HiResCAM [89.2175350956813]
本稿では,容積医用画像における多変量分類の課題について紹介する。
本稿では,複数のインスタンス学習型畳み込みニューラルネットワークであるAxialNetを提案する。
そして、HiResCAMと3D許容領域を利用した新しいマスクロスにより、モデルの学習を改善することを目指す。
論文 参考訳(メタデータ) (2021-11-24T01:14:33Z) - Joint Semi-supervised 3D Super-Resolution and Segmentation with Mixed
Adversarial Gaussian Domain Adaptation [13.477290490742224]
医用画像の高解像度化は、画像の解像度を向上させることを目的としているが、従来は低解像度データセットの特徴に基づいて訓練されている。
本稿では,画像とそのラベルの同時超解像を行う半教師付きマルチタスク生成対向ネットワーク(Gemini-GAN)を提案する。
提案手法は, 成人1,331人, 成人205人のトランスナショナル多民族集団に対して広く評価された。
論文 参考訳(メタデータ) (2021-07-16T15:42:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。