論文の概要: Graph Neural Networks for Surgical Scene Segmentation
- arxiv url: http://arxiv.org/abs/2511.16430v1
- Date: Thu, 20 Nov 2025 14:58:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.682245
- Title: Graph Neural Networks for Surgical Scene Segmentation
- Title(参考訳): 手術シーンセグメンテーションのためのグラフニューラルネットワーク
- Authors: Yihan Li, Nikhil Churamani, Maria Robu, Imanol Luengo, Danail Stoyanov,
- Abstract要約: 視覚変換器(ViT)機能エンコーダとグラフニューラルネットワーク(GNN)を統合し,解剖学的領域間の空間関係を明示的にモデル化する2つのセグメンテーションモデルを提案する。
提案手法は,mIoU(Mean Intersection over Union)の最大7~8%の改善,mDice(Mean Dice)の6%改善を実現している。
- 参考スコア(独自算出の注目度): 10.617051271345018
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Purpose: Accurate identification of hepatocystic anatomy is critical to preventing surgical complications during laparoscopic cholecystectomy. Deep learning models often struggle with occlusions, long-range dependencies, and capturing the fine-scale geometry of rare structures. This work addresses these challenges by introducing graph-based segmentation approaches that enhance spatial and semantic understanding in surgical scene analyses. Methods: We propose two segmentation models integrating Vision Transformer (ViT) feature encoders with Graph Neural Networks (GNNs) to explicitly model spatial relationships between anatomical regions. (1) A static k Nearest Neighbours (k-NN) graph with a Graph Convolutional Network with Initial Residual and Identity Mapping (GCNII) enables stable long-range information propagation. (2) A dynamic Differentiable Graph Generator (DGG) with a Graph Attention Network (GAT) supports adaptive topology learning. Both models are evaluated on the Endoscapes-Seg50 and CholecSeg8k benchmarks. Results: The proposed approaches achieve up to 7-8% improvement in Mean Intersection over Union (mIoU) and 6% improvement in Mean Dice (mDice) scores over state-of-the-art baselines. It produces anatomically coherent predictions, particularly on thin, rare and safety-critical structures. Conclusion: The proposed graph-based segmentation methods enhance both performance and anatomical consistency in surgical scene segmentation. By combining ViT-based global context with graph-based relational reasoning, the models improve interpretability and reliability, paving the way for safer laparoscopic and robot-assisted surgery through a precise identification of critical anatomical features.
- Abstract(参考訳): 目的:腹腔鏡下胆嚢摘出術において肝嚢胞性解剖の正確な同定は外科的合併症の予防に重要である。
深層学習モデルは、しばしば閉塞、長距離依存、希少構造の微細な幾何学に苦しむ。
本研究は,手術シーン解析における空間的・意味的理解を高めるグラフベースのセグメンテーションアプローチを導入することで,これらの課題に対処する。
方法:視覚変換器(ViT)機能エンコーダとグラフニューラルネットワーク(GNN)を統合し,解剖学的領域間の空間関係を明示的にモデル化する2つのセグメンテーションモデルを提案する。
1) 初期残差・同一性マッピング(GCNII)を用いたグラフ畳み込みネットワークを用いたk-NNグラフにより, 安定な長距離情報伝達が可能となる。
2)グラフ注意ネットワーク(GAT)を備えた動的微分可能グラフ生成器(DGG)は適応的トポロジ学習を支援する。
どちらのモデルもEndoscapes-Seg50とCholecSeg8kベンチマークで評価されている。
結果: 提案手法は,mIoU(Mean Intersection over Union)の最大7~8%の改善,mDice(Mean Dice)の6%改善を実現している。
解剖学的にコヒーレントな予測、特に細く、希少で、安全に重要な構造で発生する。
結論: 手術シーンのセグメンテーションにおいて, グラフベースのセグメンテーション法は, パフォーマンスと解剖学的整合性を両立させる。
ViTベースのグローバルコンテキストとグラフベースのリレーショナル推論を組み合わせることで、モデルは解釈可能性と信頼性を改善し、重要な解剖学的特徴を正確に識別することで、より安全な腹腔鏡手術とロボット支援手術の道を開く。
関連論文リスト
- Morphology-Aware KOA Classification: Integrating Graph Priors with Vision Models [13.437469558862084]
解剖学的構造と放射線学的特徴を組み合わせた新しい枠組みを提案する。
提案手法は,幾何学的インフォームドグラフ埋め込みとラジオグラフィー特徴のアライメントを強制する。
変形性関節症のデータセットの実験では、我々のアプローチが単一モダリティのベースラインを最大10%の精度で越えていることが示されている。
論文 参考訳(メタデータ) (2025-10-20T17:20:19Z) - A Graph-Based Framework for Interpretable Whole Slide Image Analysis [86.37618055724441]
我々は,全スライディング画像を生物学的にインフォームドされたグラフ表現に変換するフレームワークを開発した。
我々のアプローチは、任意の格子ではなく、自然構造を尊重する組織領域からグラフノードを構築する。
がんのステージングと生存予測の課題に強いパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-03-14T20:15:04Z) - Towards Robust Cardiac Segmentation using Graph Convolutional Networks [0.9507020058422264]
本稿では,心解剖学に基づく2つの畳み込み環を用いたグラフアーキテクチャを提案する。
この予測器は,分布外および不適な入力画像をリアルタイムに検出できることを示す。
論文 参考訳(メタデータ) (2023-10-02T13:55:06Z) - Mixed Graph Contrastive Network for Semi-Supervised Node Classification [63.924129159538076]
我々はMixed Graph Contrastive Network(MGCN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
本研究では,非摂動増強戦略と相関還元機構により,潜伏埋め込みの識別能力を向上する。
これら2つの設定を組み合わせることで、識別表現学習のために、豊富なノードと稀に価値あるラベル付きノードの両方から、豊富な監視情報を抽出する。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Heterogeneous Graph Neural Networks using Self-supervised Reciprocally
Contrastive Learning [102.9138736545956]
不均一グラフニューラルネットワーク(HGNN)は異種グラフのモデリングと解析において非常に一般的な手法である。
我々は,ノード属性とグラフトポロジの各ガイダンスに関する2つの視点を取り入れた,新規で頑健なヘテロジニアスグラフコントラスト学習手法であるHGCLを初めて開発する。
この新しいアプローチでは,属性とトポロジに関連情報を別々にマイニングする手法として,異なるが最も適した属性とトポロジの融合機構を2つの視点に適用する。
論文 参考訳(メタデータ) (2022-04-30T12:57:02Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。