論文の概要: Hierarchical Attention for Sparse Volumetric Anomaly Detection in Subclinical Keratoconus
- arxiv url: http://arxiv.org/abs/2512.03346v1
- Date: Wed, 03 Dec 2025 01:20:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-04 20:02:55.067968
- Title: Hierarchical Attention for Sparse Volumetric Anomaly Detection in Subclinical Keratoconus
- Title(参考訳): 鎖骨下角膜における小体積異常検出のための階層的注意
- Authors: Lynn Kandakji, William Woof, Nikolas Pontikos,
- Abstract要約: 階層型アテンションモデルは2D, 3D CNN, ViTの双方のパフォーマンスを上回り, より優れたパラメータ効率の帰納バイアスを与えることを示す。
力学解析により、この利点は正確な空間スケールアライメントに由来することが判明した。
その結果,将来的なボリューム異常検出システムの設計指針が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The detection of weak, spatially distributed anomalies in volumetric medical imaging remains a major challenge. The subtle, non-adjacent nature of early disease signals is often lost due to suboptimal architectural inductive biases: 2D/3D CNNs impose strong locality, while ViTs diffuse unconstrained global attention. This conflict leaves the optimal inductive structure for robust, sparse volumetric pattern recognition unresolved. This study presents a controlled comparison of sixteen modern deep learning architectures spanning 2D/3D convolutional, hybrid, and volumetric transformer families for subclinical keratoconus (SKC) detection from 3D anterior segment OCT volumes. We demonstrate that hierarchical attention models offer a superior and more parameter-efficient inductive bias, surpassing the performance of both 2D and 3D CNNs and ViTs. Our results show 21-23% higher sensitivity and specificity in the sparse anomaly (subclinical) regime. Mechanistic analyses reveal that this advantage stems from precise spatial scale alignment: hierarchical windowing produces effective receptive fields matched to the intermediate, multi-slice extent of subclinical abnormalities. This avoids excessive CNN locality and diffuse global attention. Attention-distance measurements confirm a key insight into architectural adaptation: the required spatial integration length shifts significantly based on the signal strength, with subclinical cases necessitating longer integration compared to both healthy and manifest disease states. Representational similarity and auxiliary age/sex prediction tasks further support the generalizability of these inductive principles. The findings provide design guidance for future volumetric anomaly detection systems, establishing hierarchical attention as a principled and effective approach for early pathological change analysis in 3D medical imaging.
- Abstract(参考訳): ボリューム医療画像における弱い空間分布異常の検出は依然として大きな課題である。
2D/3D CNNは強い局所性を課し、ViTは制約のない世界的な注目を集めている。
この矛盾は、頑健でスパースな容積パターン認識を未解決にするために最適な帰納的構造を残している。
本研究では,2D/3D畳み込み,ハイブリッド,ボリュームトランスフォーマーファミリーにまたがる16種類の最新のディープラーニングアーキテクチャを,3次元前部CTボリュームから検出するための制御された比較を行った。
階層型アテンションモデルは2D, 3D CNN, ViTの両方の性能を上回り, より優れたパラメータ効率の帰納バイアスを与えることを示した。
スパース異常 (サブクリニカル) では21~23%の感度, 特異性を示した。
階層的ウィンドウリングは、中間的・多重スライスなサブクリナル異常の範囲に適合する効果的な受容場を生成する。
これにより、CNNの局部性が過度に回避され、世界的な注目を集める。
必要となる空間積分長は信号強度に基づいて大きく変化し、サブクリニカルケースは健康状態と明らかな疾患状態の両方と比較して長い積分を必要とする。
表現的類似性と補助年齢/性予測タスクは、これらの帰納的原則の一般化性をさらに支援する。
本研究は,3次元医用画像における早期病的変化解析の原則的,効果的なアプローチとして階層的注意を定め,将来的なボリューム異常検出システムの設計指針を提供する。
関連論文リスト
- Prior-AttUNet: Retinal OCT Fluid Segmentation Based on Normal Anatomical Priors and Attention Gating [6.013762133627291]
本研究は, 生成解剖学的先行を付加したセグメンテーションモデルである Pre-AttUNet を紹介する。
このフレームワークは、生成前の経路とセグメンテーションネットワークを統合するハイブリッドなデュアルパスアーキテクチャを採用している。
このモデルは計算コストが 0.37 TFLOPs で、セグメント精度と推論効率の効果的なバランスを保っている。
論文 参考訳(メタデータ) (2025-12-25T14:37:04Z) - Seizure-NGCLNet: Representation Learning of SEEG Spatial Pathological Patterns for Epileptic Seizure Detection via Node-Graph Dual Contrastive Learning [6.0084265792882166]
薬物耐性てんかん(DRE)発作検出の精度は複雑である。
本稿では,SEEGの相互抑制と信号伝達パターンを学習するためのノードグラフ二重コントラスト学習フレームワークであるSezure-NGCLNetを提案する。
最新の技術性能は, 平均精度95.93%, 感度96.25%, 特異性94.12%である。
論文 参考訳(メタデータ) (2025-11-19T01:33:13Z) - Silhouette-to-Contour Registration: Aligning Intraoral Scan Models with Cephalometric Radiographs [10.70146635420186]
提案するDorgeSCRは,高精度かつ解釈可能なシルエット・ツー・コントゥール登録のための,ポーズ安定・輪郭誘導型フレームワークである。
当科で経験した34症例の歯科SCRについて検討した。
論文 参考訳(メタデータ) (2025-11-18T10:50:04Z) - GROVER: Graph-guided Representation of Omics and Vision with Expert Regulation for Adaptive Spatial Multi-omics Fusion [8.680469644745463]
本稿では,適応型空間マルチオミクス融合のエキスパートレギュレーションによるオミとビジョンのグラフ誘導表現を提案する。
GROVERは空間マルチオミクスデータの適応的統合のための新しいフレームワークである。
GROVERは最先端のベースラインより優れていることを示す。
論文 参考訳(メタデータ) (2025-11-13T06:20:37Z) - Bidirectional Mammogram View Translation with Column-Aware and Implicit 3D Conditional Diffusion [17.309030641962]
ビュー・ツー・ビューの翻訳は、行方不明のビューを回復し、病変のアライメントを改善するのに役立つ。
自然画像とは異なり、マンモグラフィーにおけるこの課題は、X線投影において大きな非剛性変形と重い組織が重なり合うため、非常に困難である。
本稿では,新しい双方向マンモグラムビュー変換フレームワークであるカラム・アウェア・インプリシット3次元拡散(CA3D-Diff)を提案する。
論文 参考訳(メタデータ) (2025-10-06T15:48:27Z) - AI-CNet3D: An Anatomically-Informed Cross-Attention Network with Multi-Task Consistency Fine-tuning for 3D Glaucoma Classification [0.4999814847776097]
緑内障は進行性眼疾患であり、視神経の損傷を引き起こす。
本稿では、3次元畳み込みニューラルネットワークにクロスアテンション機構を統合するハイブリッドディープラーニングモデルを提案する。
我々は、AI-CNet3D (AI-See'-Net3D) と命名し、3Dデータを操作する解剖学的インフォームド・クロスアテンション・ネットワークとしての設計を反映した。
論文 参考訳(メタデータ) (2025-10-01T13:30:55Z) - Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.350584471060756]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。
本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。
SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文 参考訳(メタデータ) (2025-09-30T08:59:06Z) - PHASE-Net: Physics-Grounded Harmonic Attention System for Efficient Remote Photoplethysmography Measurement [63.007237197267834]
既存のディープラーニング手法は、主に生理学的モニタリングであり、理論的な堅牢性を欠いている。
本研究では,Navier-Stokes方程式のヘモダイナミックスから導かれる物理インフォームド r パラダイムを提案し,パルス信号が2次系に従うことを示す。
これは、時間的円錐ネットワーク(TCN)を使用する理論的正当性を提供する。
Phase-Netは高い効率で最先端のパフォーマンスを実現し、理論上は基礎的でデプロイ可能な r ソリューションを提供する。
論文 参考訳(メタデータ) (2025-09-29T14:36:45Z) - Automated Labeling of Intracranial Arteries with Uncertainty Quantification Using Deep Learning [2.6279333406008476]
3D Time-of-light Magnetic Resonance Angiography (3D ToF-MRA) を用いたディープラーニングによる自動動脈ラベル作成フレームワークを提案する。
我々のフレームワークは、自動脳血管ラベリングのためのスケーラブルで正確で不確実なソリューションを提供し、下流血行動態解析をサポートし、臨床統合を容易にする。
論文 参考訳(メタデータ) (2025-09-22T12:57:21Z) - TRELLIS-Enhanced Surface Features for Comprehensive Intracranial Aneurysm Analysis [2.624902795082451]
頭蓋内大動脈瘤は, 注釈付き3Dデータによる検出, デライン化, モデル化が困難である。
本稿では,大規模非医学的3次元データセットに基づいて学習した生成モデルTRELLISで学習した潜在幾何学的埋め込みを利用したクロスドメイン特徴伝達手法を提案する。
論文 参考訳(メタデータ) (2025-09-03T07:51:17Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - 3D Vessel Reconstruction from Sparse-View Dynamic DSA Images via Vessel Probability Guided Attenuation Learning [79.60829508459753]
現在の商用デジタルサブトラクション・アンジオグラフィー(DSA)システムは通常、再構築を行うために数百のスキャンビューを要求する。
スパース・ビューDSA画像のダイナミックな血流と不十分な入力は,3次元血管再建作業において重要な課題である。
本稿では,時間に依存しない容器確率場を用いてこの問題を効果的に解くことを提案する。
論文 参考訳(メタデータ) (2024-05-17T11:23:33Z) - K-Space-Aware Cross-Modality Score for Synthesized Neuroimage Quality
Assessment [71.27193056354741]
クロスモダリティな医用画像合成をどう評価するかという問題は、ほとんど解明されていない。
本稿では,この課題の進展を促すため,新しい指標K-CROSSを提案する。
K-CROSSは、トレーニング済みのマルチモードセグメンテーションネットワークを使用して、病変の位置を予測する。
論文 参考訳(メタデータ) (2023-07-10T01:26:48Z) - Fuzzy Attention Neural Network to Tackle Discontinuity in Airway
Segmentation [67.19443246236048]
気道セグメンテーションは肺疾患の検査、診断、予後に重要である。
いくつかの小型の気道支線(気管支や終端など)は自動セグメンテーションの難しさを著しく増す。
本稿では,新しいファジィアテンションニューラルネットワークと包括的損失関数を備える,気道セグメンテーションの効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-09-05T16:38:13Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - SQUID: Deep Feature In-Painting for Unsupervised Anomaly Detection [76.01333073259677]
無線画像からの異常検出のための空間認識型メモリキューを提案する(略してSQUID)。
SQUIDは, 微細な解剖学的構造を逐次パターンに分類でき, 推測では画像中の異常(見えない/修正されたパターン)を識別できる。
論文 参考訳(メタデータ) (2021-11-26T13:47:34Z) - Explainable multiple abnormality classification of chest CT volumes with
AxialNet and HiResCAM [89.2175350956813]
本稿では,容積医用画像における多変量分類の課題について紹介する。
本稿では,複数のインスタンス学習型畳み込みニューラルネットワークであるAxialNetを提案する。
そして、HiResCAMと3D許容領域を利用した新しいマスクロスにより、モデルの学習を改善することを目指す。
論文 参考訳(メタデータ) (2021-11-24T01:14:33Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z) - Symmetry-Enhanced Attention Network for Acute Ischemic Infarct
Segmentation with Non-Contrast CT Images [50.55978219682419]
急性虚血性梗塞セグメンテーションのための対称性増強型注意ネットワーク(SEAN)を提案する。
提案するネットワークは、入力されたCT画像を、脳組織が左右対称な標準空間に自動的に変換する。
提案したSEANは、ダイス係数と梗塞局所化の両方の観点から、対称性に基づく最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-10-11T07:13:26Z) - Joint Semi-supervised 3D Super-Resolution and Segmentation with Mixed
Adversarial Gaussian Domain Adaptation [13.477290490742224]
医用画像の高解像度化は、画像の解像度を向上させることを目的としているが、従来は低解像度データセットの特徴に基づいて訓練されている。
本稿では,画像とそのラベルの同時超解像を行う半教師付きマルチタスク生成対向ネットワーク(Gemini-GAN)を提案する。
提案手法は, 成人1,331人, 成人205人のトランスナショナル多民族集団に対して広く評価された。
論文 参考訳(メタデータ) (2021-07-16T15:42:39Z) - Efficient and high accuracy 3-D OCT angiography motion correction in
pathology [6.875092432376952]
光コヒーレンス断層撮影用血管造影ボリュームの非剛性3次元運動補正法を提案する。
これは、ジョイント最適化において主に軸方向の構造的特徴を整列する最初のアプローチである。
横方向のコアライメントと歪み補正,特に病的部分群において有意な進歩を示した。
論文 参考訳(メタデータ) (2020-10-14T10:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。