論文の概要: TomoGraphView: 3D Medical Image Classification with Omnidirectional Slice Representations and Graph Neural Networks
- arxiv url: http://arxiv.org/abs/2511.09605v1
- Date: Fri, 14 Nov 2025 01:01:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.370577
- Title: TomoGraphView: 3D Medical Image Classification with Omnidirectional Slice Representations and Graph Neural Networks
- Title(参考訳): TomoGraphView: 一方向スライス表現とグラフニューラルネットワークを用いた3次元医用画像分類
- Authors: Johannes Kiechle, Stefan M. Fischer, Daniel M. Lang, Cosmin I. Bercea, Matthew J. Nyflot, Lina Felsner, Julia A. Schnabel, Jan C. Peeken,
- Abstract要約: 3次元医用画像分類は、複雑な空間的関係と、アクセス可能なデータに固有の長距離依存のため、依然として困難な課題である。
近年の研究では、医用画像解析のための強力な特徴抽出器として、当初自然画像に基づいて訓練された2次元視覚基盤モデルの可能性を強調している。
我々は,全方向ボリュームスライシングと球面グラフに基づく特徴集約を統合した新しいフレームワークである TomoGraphView を提案する。
- 参考スコア(独自算出の注目度): 2.2906925991630085
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The growing number of medical tomography examinations has necessitated the development of automated methods capable of extracting comprehensive imaging features to facilitate downstream tasks such as tumor characterization, while assisting physicians in managing their growing workload. However, 3D medical image classification remains a challenging task due to the complex spatial relationships and long-range dependencies inherent in volumetric data. Training models from scratch suffers from low data regimes, and the absence of 3D large-scale multimodal datasets has limited the development of 3D medical imaging foundation models. Recent studies, however, have highlighted the potential of 2D vision foundation models, originally trained on natural images, as powerful feature extractors for medical image analysis. Despite these advances, existing approaches that apply 2D models to 3D volumes via slice-based decomposition remain suboptimal. Conventional volume slicing strategies, which rely on canonical planes such as axial, sagittal, or coronal, may inadequately capture the spatial extent of target structures when these are misaligned with standardized viewing planes. Furthermore, existing slice-wise aggregation strategies rarely account for preserving the volumetric structure, resulting in a loss of spatial coherence across slices. To overcome these limitations, we propose TomoGraphView, a novel framework that integrates omnidirectional volume slicing with spherical graph-based feature aggregation. We publicly share our accessible code base at http://github.com/compai-lab/2025-MedIA-kiechle and provide a user-friendly library for omnidirectional volume slicing at https://pypi.org/project/OmniSlicer.
- Abstract(参考訳): 医用トモグラフィー検査の増大は、腫瘍のキャラクタリゼーションなどの下流の作業を容易にするための包括的な画像特徴を抽出し、医師が成長するワークロードを管理するのを補助する自動化手法の開発を必要としている。
しかし,3次元医用画像の分類は,ボリュームデータに固有の複雑な空間的関係と長距離依存のため,依然として困難な課題である。
スクラッチからのトレーニングモデルは低データ構造に悩まされており、3Dの大規模マルチモーダルデータセットが欠如しているため、3D画像基盤モデルの開発は制限されている。
しかし近年の研究では、医用画像解析のための強力な特徴抽出器として、元々は自然画像に基づいて訓練された2次元視覚基盤モデルの可能性を強調している。
これらの進歩にもかかわらず、スライスベースの分解による3次元ボリュームに2次元モデルを適用する既存のアプローチは、まだ最適ではない。
従来のボリュームスライシング戦略は、軸、矢状、またはコロナのような正準平面に依存しており、これらが標準視界と不一致である場合、ターゲット構造の空間的範囲を不適切に捉えることができる。
さらに,既存のスライス・ワイズ・アグリゲーション・ストラテジーでは,体積構造を保存することがほとんどなく,スライス全体の空間コヒーレンスが失われる。
このような制限を克服するために,全方向ボリュームスライシングと球面グラフに基づく特徴集約を統合した新しいフレームワークである TomoGraphView を提案する。
アクセス可能なコードベースはhttp://github.com/compai-lab/2025-MedIA-kiechleで公開しています。
関連論文リスト
- Structured Spectral Graph Representation Learning for Multi-label Abnormality Analysis from 3D CT Scans [0.0]
3次元胸部CTスキャンのマルチラベル分類は依然として重要な課題である。
3次元畳み込みニューラルネットワークに基づく既存の手法は、長距離依存を捉えるのに苦労する。
本稿では3次元CTボリュームを構造化グラフとして表現するグラフベースの新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-12T19:49:51Z) - Neural Image Unfolding: Flattening Sparse Anatomical Structures using Neural Fields [6.5082099033254135]
トモグラフィーは3次元物体の内部構造を明らかにし、診断に不可欠である。
臓器特異的な展開技術は、密集した3次元表面を歪み最小化された2次元表現にマッピングするために存在する。
我々は、関心の解剖学的変換を2次元概要画像に適合させるために、ニューラルネットワークをデプロイする。
論文 参考訳(メタデータ) (2024-11-27T14:58:49Z) - E3D-GPT: Enhanced 3D Visual Foundation for Medical Vision-Language Model [23.56751925900571]
3次元医用視覚言語モデルの開発は、疾患の診断と患者の治療に有意な可能性を秘めている。
自己教師付き学習を用いて3次元視覚特徴抽出のための3次元視覚基盤モデルを構築した。
本研究では,3次元空間畳み込みを高精細画像の特徴の集約・投影に応用し,計算複雑性を低減した。
本モデルは,既存の報告生成法,視覚的質問応答法,疾患診断法と比較して,優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-18T06:31:40Z) - Generative Enhancement for 3D Medical Images [74.17066529847546]
本稿では,3次元医用画像合成の新しい生成手法であるGEM-3Dを提案する。
本手法は2次元スライスから始まり,3次元スライスマスクを用いて患者に提供するための情報スライスとして機能し,生成過程を伝搬する。
3D医療画像をマスクと患者の事前情報に分解することで、GEM-3Dは多目的な3D画像を生成する柔軟な、かつ効果的なソリューションを提供する。
論文 参考訳(メタデータ) (2024-03-19T15:57:04Z) - On the Localization of Ultrasound Image Slices within Point Distribution
Models [84.27083443424408]
甲状腺疾患は高分解能超音波(US)で診断されることが多い
縦断追跡は病理甲状腺形態の変化をモニタリングするための重要な診断プロトコルである。
3次元形状表現におけるUS画像の自動スライスローカライズのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-01T10:10:46Z) - Spatiotemporal Modeling Encounters 3D Medical Image Analysis:
Slice-Shift UNet with Multi-View Fusion [0.0]
本稿では,2次元CNNにおける3次元特徴をエンコードする2次元モデルSlice SHift UNetを提案する。
より正確にマルチビュー機能は、ボリュームの3次元平面に沿って2次元の畳み込みを実行することで協調的に学習される。
提案手法の有効性は,多モード腹部多臓器軸 (AMOS) と Cranial Vault (BTCV) データセットを越えたマルチアトラスラベリング (Multi-Atlas Labeling Beyond the Cranial Vault) で検証した。
論文 参考訳(メタデータ) (2023-07-24T14:53:23Z) - Interpretable 2D Vision Models for 3D Medical Images [47.75089895500738]
本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文 参考訳(メタデータ) (2023-07-13T08:27:09Z) - Weakly Supervised Volumetric Image Segmentation with Deformed Templates [80.04326168716493]
対象対象物の表面にスパースな3次元点のセットのみを提供する必要があるという意味で、真に弱い教師付きアプローチを提案する。
監督コストの削減により、3Dの弱スーパービジョンに対する従来のアプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-06-07T22:09:34Z) - Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN [52.851990439671475]
本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-05T02:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。