論文の概要: Hierarchical Attention for Sparse Volumetric Anomaly Detection in Subclinical Keratoconus
- arxiv url: http://arxiv.org/abs/2512.03346v1
- Date: Wed, 03 Dec 2025 01:20:13 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 12:04:49.508258
- Title: Hierarchical Attention for Sparse Volumetric Anomaly Detection in Subclinical Keratoconus
- Title(参考訳): 鎖骨下角膜における小体積異常検出のための階層的注意
- Authors: Lynn Kandakji, William Woof, Nikolas Pontikos,
- Abstract要約: 階層型アテンションモデルは2D, 3D CNN, ViTの双方のパフォーマンスを上回り, より優れたパラメータ効率の帰納バイアスを与えることを示す。
力学解析により、この利点は正確な空間スケールアライメントに由来することが判明した。
その結果,将来的なボリューム異常検出システムの設計指針が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The detection of weak, spatially distributed anomalies in volumetric medical imaging remains a major challenge. The subtle, non-adjacent nature of early disease signals is often lost due to suboptimal architectural inductive biases: 2D/3D CNNs impose strong locality, while ViTs diffuse unconstrained global attention. This conflict leaves the optimal inductive structure for robust, sparse volumetric pattern recognition unresolved. This study presents a controlled comparison of sixteen modern deep learning architectures spanning 2D/3D convolutional, hybrid, and volumetric transformer families for subclinical keratoconus (SKC) detection from 3D anterior segment OCT volumes. We demonstrate that hierarchical attention models offer a superior and more parameter-efficient inductive bias, surpassing the performance of both 2D and 3D CNNs and ViTs. Our results show 21-23% higher sensitivity and specificity in the sparse anomaly (subclinical) regime. Mechanistic analyses reveal that this advantage stems from precise spatial scale alignment: hierarchical windowing produces effective receptive fields matched to the intermediate, multi-slice extent of subclinical abnormalities. This avoids excessive CNN locality and diffuse global attention. Attention-distance measurements confirm a key insight into architectural adaptation: the required spatial integration length shifts significantly based on the signal strength, with subclinical cases necessitating longer integration compared to both healthy and manifest disease states. Representational similarity and auxiliary age/sex prediction tasks further support the generalizability of these inductive principles. The findings provide design guidance for future volumetric anomaly detection systems, establishing hierarchical attention as a principled and effective approach for early pathological change analysis in 3D medical imaging.
- Abstract(参考訳): ボリューム医療画像における弱い空間分布異常の検出は依然として大きな課題である。
2D/3D CNNは強い局所性を課し、ViTは制約のない世界的な注目を集めている。
この矛盾は、頑健でスパースな容積パターン認識を未解決にするために最適な帰納的構造を残している。
本研究では,2D/3D畳み込み,ハイブリッド,ボリュームトランスフォーマーファミリーにまたがる16種類の最新のディープラーニングアーキテクチャを,3次元前部CTボリュームから検出するための制御された比較を行った。
階層型アテンションモデルは2D, 3D CNN, ViTの両方の性能を上回り, より優れたパラメータ効率の帰納バイアスを与えることを示した。
スパース異常 (サブクリニカル) では21~23%の感度, 特異性を示した。
階層的ウィンドウリングは、中間的・多重スライスなサブクリナル異常の範囲に適合する効果的な受容場を生成する。
これにより、CNNの局部性が過度に回避され、世界的な注目を集める。
必要となる空間積分長は信号強度に基づいて大きく変化し、サブクリニカルケースは健康状態と明らかな疾患状態の両方と比較して長い積分を必要とする。
表現的類似性と補助年齢/性予測タスクは、これらの帰納的原則の一般化性をさらに支援する。
本研究は,3次元医用画像における早期病的変化解析の原則的,効果的なアプローチとして階層的注意を定め,将来的なボリューム異常検出システムの設計指針を提供する。
関連論文リスト
- Silhouette-to-Contour Registration: Aligning Intraoral Scan Models with Cephalometric Radiographs [10.70146635420186]
提案するDorgeSCRは,高精度かつ解釈可能なシルエット・ツー・コントゥール登録のための,ポーズ安定・輪郭誘導型フレームワークである。
当科で経験した34症例の歯科SCRについて検討した。
論文 参考訳(メタデータ) (2025-11-18T10:50:04Z) - Bidirectional Mammogram View Translation with Column-Aware and Implicit 3D Conditional Diffusion [17.309030641962]
ビュー・ツー・ビューの翻訳は、行方不明のビューを回復し、病変のアライメントを改善するのに役立つ。
自然画像とは異なり、マンモグラフィーにおけるこの課題は、X線投影において大きな非剛性変形と重い組織が重なり合うため、非常に困難である。
本稿では,新しい双方向マンモグラムビュー変換フレームワークであるカラム・アウェア・インプリシット3次元拡散(CA3D-Diff)を提案する。
論文 参考訳(メタデータ) (2025-10-06T15:48:27Z) - AI-CNet3D: An Anatomically-Informed Cross-Attention Network with Multi-Task Consistency Fine-tuning for 3D Glaucoma Classification [0.4999814847776097]
緑内障は進行性眼疾患であり、視神経の損傷を引き起こす。
本稿では、3次元畳み込みニューラルネットワークにクロスアテンション機構を統合するハイブリッドディープラーニングモデルを提案する。
我々は、AI-CNet3D (AI-See'-Net3D) と命名し、3Dデータを操作する解剖学的インフォームド・クロスアテンション・ネットワークとしての設計を反映した。
論文 参考訳(メタデータ) (2025-10-01T13:30:55Z) - PHASE-Net: Physics-Grounded Harmonic Attention System for Efficient Remote Photoplethysmography Measurement [63.007237197267834]
既存のディープラーニング手法は、主に生理学的モニタリングであり、理論的な堅牢性を欠いている。
本研究では,Navier-Stokes方程式のヘモダイナミックスから導かれる物理インフォームド r パラダイムを提案し,パルス信号が2次系に従うことを示す。
これは、時間的円錐ネットワーク(TCN)を使用する理論的正当性を提供する。
Phase-Netは高い効率で最先端のパフォーマンスを実現し、理論上は基礎的でデプロイ可能な r ソリューションを提供する。
論文 参考訳(メタデータ) (2025-09-29T14:36:45Z) - TRELLIS-Enhanced Surface Features for Comprehensive Intracranial Aneurysm Analysis [2.624902795082451]
頭蓋内大動脈瘤は, 注釈付き3Dデータによる検出, デライン化, モデル化が困難である。
本稿では,大規模非医学的3次元データセットに基づいて学習した生成モデルTRELLISで学習した潜在幾何学的埋め込みを利用したクロスドメイン特徴伝達手法を提案する。
論文 参考訳(メタデータ) (2025-09-03T07:51:17Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - 3D Vessel Reconstruction from Sparse-View Dynamic DSA Images via Vessel Probability Guided Attenuation Learning [79.60829508459753]
現在の商用デジタルサブトラクション・アンジオグラフィー(DSA)システムは通常、再構築を行うために数百のスキャンビューを要求する。
スパース・ビューDSA画像のダイナミックな血流と不十分な入力は,3次元血管再建作業において重要な課題である。
本稿では,時間に依存しない容器確率場を用いてこの問題を効果的に解くことを提案する。
論文 参考訳(メタデータ) (2024-05-17T11:23:33Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Explainable multiple abnormality classification of chest CT volumes with
AxialNet and HiResCAM [89.2175350956813]
本稿では,容積医用画像における多変量分類の課題について紹介する。
本稿では,複数のインスタンス学習型畳み込みニューラルネットワークであるAxialNetを提案する。
そして、HiResCAMと3D許容領域を利用した新しいマスクロスにより、モデルの学習を改善することを目指す。
論文 参考訳(メタデータ) (2021-11-24T01:14:33Z) - Joint Semi-supervised 3D Super-Resolution and Segmentation with Mixed
Adversarial Gaussian Domain Adaptation [13.477290490742224]
医用画像の高解像度化は、画像の解像度を向上させることを目的としているが、従来は低解像度データセットの特徴に基づいて訓練されている。
本稿では,画像とそのラベルの同時超解像を行う半教師付きマルチタスク生成対向ネットワーク(Gemini-GAN)を提案する。
提案手法は, 成人1,331人, 成人205人のトランスナショナル多民族集団に対して広く評価された。
論文 参考訳(メタデータ) (2021-07-16T15:42:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。