論文の概要: Learning from Compressed CT: Feature Attention Style Transfer and Structured Factorized Projections for Resource-Efficient Medical Image Analysis
- arxiv url: http://arxiv.org/abs/2605.00448v1
- Date: Fri, 01 May 2026 06:35:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.877458
- Title: Learning from Compressed CT: Feature Attention Style Transfer and Structured Factorized Projections for Resource-Efficient Medical Image Analysis
- Title(参考訳): 圧縮CTから学ぶ:資源効率の良い医用画像解析のための特徴注意スタイル転送と構造化因子投影
- Authors: Shadid Yousuf, S. M. Mahbubur Rahman, Mohammed Imamul Hassan Bhuiyan,
- Abstract要約: Feature Attention Style Transfer (FAST) は、高忠実度CT表現から圧縮入力で動作するビジュアルエンコーダへ転送する新しいフレームワークである。
構造因子射影(Structured Factorized Projection, SFP)は、高密度射影層に対するパラメータ効率の代替であり、パラメータをほぼ半分削減する。
対照的な学習パイプラインであるCT-Liteは、これらのコンポーネントをSigLIPベースの客観的アライメント目標と統合します。
- 参考スコア(独自算出の注目度): 0.18352113484137622
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The deployment of artificial intelligence in medical imaging is hindered by high computational complexity and resource-intensive processing of volumetric data. Although chest computed tomography (CT) volumes offer richer diagnostic information than projection radiography, their use in AI-based diagnosis remains limited due to the computational burden of processing uncompressed volumetric images (typically stored in NIfTI or DICOM format). Addressing the growing need for low-resource deployment and efficient electronic data transfer, we investigate the utilization of JPEG-compressed chest CT volumes for thoracic abnormality detection. We propose Feature Attention Style Transfer (FAST), a novel distillation framework that transfers both activation patterns and structural relationships from high-fidelity CT representations to a spatiotemporal visual encoder operating on compressed inputs. By combining Gram-matrix-based attention style preservation with dual-attention feature alignment, FAST enables robust feature extraction from degraded volumes. Furthermore, we introduce Structured Factorized Projection (SFP), leveraging Block Tensor Train decomposition as a parameter-efficient alternative to dense projection layers, reducing projection-head parameters by almost half. Our contrastive learning pipeline, CT-Lite, integrates these components with a SigLIP-based multimodal alignment objective. Experiments on CT-RATE, NIDCH, and Rad-ChestCT demonstrate that CT-Lite achieves AUROC within 5-7\% of the uncompressed-input baseline across all three datasets, despite operating on compressed inputs with significantly fewer parameters, paving the way for AI-based clinical evaluation under resource constraints.
- Abstract(参考訳): 医用画像への人工知能の展開は、高い計算複雑性とボリュームデータのリソース集約処理によって妨げられている。
胸部CTはプロジェクションラジオグラフィーよりもリッチな診断情報を提供するが、非圧縮ボリューム画像(典型的にはNIfTIまたはDICOM形式で保存される)の処理の計算負担のため、AIベースの診断での使用は制限されている。
低リソース展開と効率的な電子データ転送の必要性の増大に対処し,胸部異常検出のためのJPEG圧縮胸部CTボリュームの利用について検討した。
本研究では,高忠実度CT表現からのアクティベーションパターンと構造的関係を,圧縮入力で動作する時空間視覚エンコーダに転送する新しい蒸留フレームワークであるFeature Attention Style Transfer (FAST)を提案する。
グラム行列に基づくアテンションスタイル保存と二重アテンション特徴アライメントを組み合わせることで、FASTは劣化ボリュームから堅牢な特徴抽出を可能にする。
さらに,高密度射影層に対するパラメータ効率の代替として,ブロックテンソルトレイン分解を利用した構造因子射影(SFP)を導入し,プロジェクションヘッドパラメータをほぼ半分に削減した。
対照的な学習パイプラインであるCT-Liteは、これらのコンポーネントをSigLIPベースのマルチモーダルアライメント目標と統合する。
CT-RATE、NIDCH、Rad-ChestCTの実験により、CT-Liteは、リソース制約の下でAIベースの臨床評価を行うために、パラメータが大幅に少ない圧縮入力で操作されているにもかかわらず、3つのデータセットで圧縮されていないインプットベースラインの5~7倍のAUROCを達成することが示された。
関連論文リスト
- Distilling Photon-Counting CT into Routine Chest CT through Clinically Validated Degradation Modeling [51.330452704464925]
145の病院から1,046のPCCTと405,379のEICTで潜伏拡散モデルを訓練した。
我々は,PCCTライクな品質に拡張された17,316以上の公開EICTの大規模データセットを構築した。
以上の結果から,現像技術の進歩は,限られた高画質スキャンを基準として,定期的なEICTに体系的に蒸留できることが示唆された。
論文 参考訳(メタデータ) (2026-04-08T17:47:35Z) - Resolution-Independent Neural Operators for Multi-Rate Sparse-View CT [67.14700058302016]
深層学習手法は高忠実度再構成を実現するが、しばしば固定された取得設定に過度に適合する。
本稿では,連続関数空間に拡張したCT再構成フレームワークであるComputed Tomography Neural Operator (CTO)を提案する。
CTOは一貫性のあるマルチサンプリングレートとクロスレゾリューションのパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-13T08:31:46Z) - Accelerating 3D Photoacoustic Computed Tomography with End-to-End Physics-Aware Neural Operators [74.65171736966131]
光音響計算トモグラフィ(PACT)は、光コントラストと超音波分解能を組み合わせることで、光拡散限界を超える深部像を実現する。
現在の実装では、高密度トランスデューサアレイと長い取得時間を必要とし、臨床翻訳を制限している。
本研究では,センサ計測からボリューム再構成まで,逆音響マッピングを直接学習する物理認識モデルであるPanoを紹介する。
論文 参考訳(メタデータ) (2025-09-11T23:12:55Z) - CAPRI-CT: Causal Analysis and Predictive Reasoning for Image Quality Optimization in Computed Tomography [2.422970122886921]
CAPRI-CTは、CT画像における画像品質最適化のための因果解析および予測推論のための因果学習フレームワークである。
画像データと取得メタデータを統合し、画像品質に影響を与える根底にある因果関係をモデル化する。
アンサンブル学習アプローチを用いてトレーニングされ、検証され、強力な予測性能を達成する。
論文 参考訳(メタデータ) (2025-07-23T11:23:02Z) - Recurrent Visual Feature Extraction and Stereo Attentions for CT Report Generation [18.113659670915474]
本稿では,大規模言語モデル (LLM) に基づくCTRG法を提案する。
具体的には、視覚変換器を用いて、各スライスをCTボリュームで繰り返し処理し、異なる視点から符号化したスライスに注意を払って重要な視覚情報を得る。
ベンチマークM3D-Capデータセットの実験結果とさらなる解析により,本手法が強いベースラインモデルより優れていることが示された。
論文 参考訳(メタデータ) (2025-06-24T14:29:06Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - Feature-oriented Deep Learning Framework for Pulmonary Cone-beam CT
(CBCT) Enhancement with Multi-task Customized Perceptual Loss [9.59233136691378]
コーンビームCT(CBCT)は画像誘導放射線治療中に定期的に収集される。
近年, 深層学習に基づくCBCT強調法は, 人工物抑制に有望な成果を上げている。
本稿では,高画質CBCT画像から高画質CTライク画像へ変換する特徴指向ディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-01T10:09:01Z) - Self-Attention Generative Adversarial Network for Iterative
Reconstruction of CT Images [0.9208007322096533]
本研究の目的は、ノイズや不完全なデータから高品質なCT画像を再構成するために、単一のニューラルネットワークを訓練することである。
ネットワークには、データ内の長距離依存関係をモデル化するセルフアテンションブロックが含まれている。
我々のアプローチはCIRCLE GANに匹敵する全体的なパフォーマンスを示し、他の2つのアプローチよりも優れています。
論文 参考訳(メタデータ) (2021-12-23T19:20:38Z) - Incremental Cross-view Mutual Distillation for Self-supervised Medical
CT Synthesis [88.39466012709205]
本稿では,スライス間の分解能を高めるために,新しい医療スライスを構築した。
臨床実践において, 根本・中間医療スライスは常に欠落していることを考慮し, 相互蒸留の段階的相互蒸留戦略を導入する。
提案手法は,最先端のアルゴリズムよりも明確なマージンで優れる。
論文 参考訳(メタデータ) (2021-12-20T03:38:37Z) - CT-SGAN: Computed Tomography Synthesis GAN [4.765541373485143]
胸部CTスキャンの小さなデータセットを用いて,大規模な3次元合成CTスキャンボリュームを生成するCT-SGANモデルを提案する。
その結果,CT-SGANは大量の合成データに基づいて結節を事前訓練することにより,肺検出精度を著しく向上させることができることがわかった。
論文 参考訳(メタデータ) (2021-10-14T22:20:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。