論文の概要: AVP-AP: Self-supervised Automatic View Positioning in 3D cardiac CT via Atlas Prompting
- arxiv url: http://arxiv.org/abs/2504.05966v1
- Date: Tue, 08 Apr 2025 12:24:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-09 13:28:50.684610
- Title: AVP-AP: Self-supervised Automatic View Positioning in 3D cardiac CT via Atlas Prompting
- Title(参考訳): AVP-AP:Atlas Promptingによる3次元心臓CTにおける自動視線位置計測
- Authors: Xiaolin Fan, Yan Wang, Yingying Zhang, Mingkun Bao, Bosen Jia, Dong Lu, Yifan Gu, Jian Cheng, Haogang Zhu,
- Abstract要約: AVP-APは、Atlas Promptingを3D CTボリュームにおける自己教師付き自動視線位置決めに使用した最初のフレームワークである。
対象CT体積の粗い位置を3次元アトラスと対象CT体積との剛性変換を用いて同定した。
我々のフレームワークは他の手法と比較して柔軟で効率的であり、任意の視点位置決めにおける平均構造類似度(SSIM)を19.8%上回っている。
- 参考スコア(独自算出の注目度): 17.710578002931545
- License:
- Abstract: Automatic view positioning is crucial for cardiac computed tomography (CT) examinations, including disease diagnosis and surgical planning. However, it is highly challenging due to individual variability and large 3D search space. Existing work needs labor-intensive and time-consuming manual annotations to train view-specific models, which are limited to predicting only a fixed set of planes. However, in real clinical scenarios, the challenge of positioning semantic 2D slices with any orientation into varying coordinate space in arbitrary 3D volume remains unsolved. We thus introduce a novel framework, AVP-AP, the first to use Atlas Prompting for self-supervised Automatic View Positioning in the 3D CT volume. Specifically, this paper first proposes an atlas prompting method, which generates a 3D canonical atlas and trains a network to map slices into their corresponding positions in the atlas space via a self-supervised manner. Then, guided by atlas prompts corresponding to the given query images in a reference CT, we identify the coarse positions of slices in the target CT volume using rigid transformation between the 3D atlas and target CT volume, effectively reducing the search space. Finally, we refine the coarse positions by maximizing the similarity between the predicted slices and the query images in the feature space of a given foundation model. Our framework is flexible and efficient compared to other methods, outperforming other methods by 19.8% average structural similarity (SSIM) in arbitrary view positioning and achieving 9% SSIM in two-chamber view compared to four radiologists. Meanwhile, experiments on a public dataset validate our framework's generalizability.
- Abstract(参考訳): 心臓CT検査では, 疾患診断や手術計画など, 自動視線位置決めが重要である。
しかし、個々の変数と大きな3D検索空間のため、非常に困難である。
既存の作業では、固定された平面のみを予測することに限定される、ビュー固有のモデルをトレーニングするために、労働集約的で時間を要する手作業のアノテーションが必要です。
しかし、実際の臨床シナリオでは、任意の3次元体積の座標空間に任意の向きのセマンティック2次元スライスを配置するという課題は未解決のままである。
そこで我々は,Atlas Prompting を用いた新しいフレームワーク AVP-AP を導入する。
具体的には,まず,3次元標準アトラスを生成するアトラスプロセッシング手法を提案し,ネットワークを訓練して,自己監督的な方法でスライスをアトラス空間の対応する位置にマッピングする。
そして, 基準CTにおける検索画像に対応するアトラスプロンプトを用いて, 3次元アトラスと対象CTボリュームとの剛性変換を用いて, 対象CTボリューム内のスライスの位置の粗い位置を同定し, 探索空間を効果的に低減する。
最後に,所定の基礎モデルの特徴空間における予測スライスとクエリ画像との類似性を最大化することにより,粗い位置を改良する。
フレームワークは他の手法に比べて柔軟で効率が良く、任意の視点の位置決めにおいて平均的構造類似度(SSIM)を19.8%上回り、2チャンバービューでは9%のSSIMを実現している。
一方、パブリックデータセットの実験は、我々のフレームワークの一般化可能性を検証する。
関連論文リスト
- SliceOcc: Indoor 3D Semantic Occupancy Prediction with Vertical Slice Representation [50.420711084672966]
室内3Dセマンティック占有予測に適したRGBカメラベースモデルであるSliceOccを提案する。
EmbodiedScanデータセットの実験結果は、SliceOccが81の屋内カテゴリで15.45%のmIoUを達成したことを示している。
論文 参考訳(メタデータ) (2025-01-28T03:41:24Z) - Automatic view plane prescription for cardiac magnetic resonance imaging
via supervision by spatial relationship between views [30.59897595586657]
本研究は、自動心臓磁気共鳴(CMR)ビュープランニングのための、臨床互換でアノテーションのないシステムを提案する。
システムは、特に、対象の平面とソースビューの間の交差する線の位置を空間的関係にマイニングする。
ソースビューで予測される複数のターゲット面の相互作用は、積み重ねられた時間ガラスアーキテクチャで利用され、徐々にレグレッションが向上する。
論文 参考訳(メタデータ) (2023-09-22T11:36:42Z) - PointOcc: Cylindrical Tri-Perspective View for Point-based 3D Semantic
Occupancy Prediction [72.75478398447396]
本稿では,点雲を効果的かつ包括的に表現する円筒型三重対視図を提案する。
また,LiDAR点雲の距離分布を考慮し,円筒座標系における三点ビューを構築した。
プロジェクション中に構造の詳細を維持するために空間群プーリングを使用し、各TPV平面を効率的に処理するために2次元バックボーンを採用する。
論文 参考訳(メタデータ) (2023-08-31T17:57:17Z) - Occupancy Planes for Single-view RGB-D Human Reconstruction [120.5818162569105]
暗黙的な機能を持つシングルビューRGB-Dヒト再構成は、しばしばポイント単位の分類として定式化される。
本稿では,カメラの視野フラストラムをスライスする平面上での占有率予測として,一視点のRGB-D人間の再構成を定式化できる占有面(OPlanes)表現を提案する。
論文 参考訳(メタデータ) (2022-08-04T17:59:56Z) - Agent with Tangent-based Formulation and Anatomical Perception for
Standard Plane Localization in 3D Ultrasound [56.7645826576439]
3D USにおけるSP自動位置決めのための新しい強化学習フレームワークを提案する。
まず、RLにおける接点に基づく問題として、3D USにおけるSP局所化を定式化し、作用空間を再構成する。
第2に、平面探索における非SPとSPの交差する微妙な違いを認識するモデルの能力を高めるための補助的タスク学習戦略を設計する。
論文 参考訳(メタデータ) (2022-07-01T14:53:27Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Using the Order of Tomographic Slices as a Prior for Neural Networks
Pre-Training [1.1470070927586016]
ボリュームの代わりにスライス上でSortingLossを事前学習する手法を提案する。
ボリュームではなくスライスで事前トレーニングを行うので、スライスのスパースセットでモデルを微調整することができる。
提案手法はSimCLRと同等に動作し、2倍高速に動作し、1.5倍少ないメモリを必要とすることを示す。
論文 参考訳(メタデータ) (2022-03-17T14:58:15Z) - Automated Atlas-based Segmentation of Single Coronal Mouse Brain Slices
using Linear 2D-2D Registration [0.0]
本稿では,1枚の2次元冠動脈スライスを自動的に3次元のアトラスに分割する手法を提案する。
全脳規模での探索的アプローチによる頑健さと性能の検証を行った。
論文 参考訳(メタデータ) (2021-11-16T12:33:09Z) - Training Automatic View Planner for Cardiac MR Imaging via
Self-Supervision by Spatial Relationship between Views [28.27778627797572]
本研究は, 自動心磁気共鳴画像診断のためのクリニック互換でアノテーションのないシステムを提案する。
このシステムは、ソースビューとターゲットビューの間の空間的関係(具体的には、交差する線の位置と利用)をマイニングし、これらの交差する線で定義されたヒートマップを回帰するように、ディープネットワークを訓練する。
ターゲットビューのすべてのソースビューに対して予測されたヒートマップから情報を集約し、グローバルに最適な処方則を求めるマルチビュー計画戦略を提案する。
論文 参考訳(メタデータ) (2021-09-24T02:25:22Z) - 3D Axial-Attention for Lung Nodule Classification [0.11458853556386794]
通常の非ローカルネットワークの計算能力のほんの一部を必要とする3D Axial-Attentionを使用することを提案する。
非局所ネットワークの位置不変問題を,共有埋め込みに3次元位置符号化を加えることを提案する。
その結果、3D Axial-Attentionモデルは、AUCやAccuracyを含むすべての評価指標で最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2020-12-28T06:49:09Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。