論文の概要: Decoding the Surgical Scene: A Scoping Review of Scene Graphs in Surgery
- arxiv url: http://arxiv.org/abs/2509.20941v1
- Date: Thu, 25 Sep 2025 09:25:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.820372
- Title: Decoding the Surgical Scene: A Scoping Review of Scene Graphs in Surgery
- Title(参考訳): 手術シーンのデコード:手術シーングラフのスコープレビュー
- Authors: Angelo Henriques, Korab Hoxha, Daniel Zapp, Peter C. Issa, Nassir Navab, M. Ali Nasseri,
- Abstract要約: シーングラフ(SG)は、複雑なダイナミックな手術環境のデコードに不可欠な構造化された表現を提供する。
The PRISMA-ScR-guided scoping review systemally map the evolution landscape of SG research in surgery。
我々の分析は急速に成長しているが、重要な「データ分割」を明らかにしている
SGは重要なセマンティックブリッジに成熟し、新しい世代のインテリジェントシステムによって外科の安全性、効率、訓練を改善することができる。
- 参考スコア(独自算出の注目度): 36.192962258966105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scene graphs (SGs) provide structured relational representations crucial for decoding complex, dynamic surgical environments. This PRISMA-ScR-guided scoping review systematically maps the evolving landscape of SG research in surgery, charting its applications, methodological advancements, and future directions. Our analysis reveals rapid growth, yet uncovers a critical 'data divide': internal-view research (e.g., triplet recognition) almost exclusively uses real-world 2D video, while external-view 4D modeling relies heavily on simulated data, exposing a key translational research gap. Methodologically, the field has advanced from foundational graph neural networks to specialized foundation models that now significantly outperform generalist large vision-language models in surgical contexts. This progress has established SGs as a cornerstone technology for both analysis, such as workflow recognition and automated safety monitoring, and generative tasks like controllable surgical simulation. Although challenges in data annotation and real-time implementation persist, they are actively being addressed through emerging techniques. Surgical SGs are maturing into an essential semantic bridge, enabling a new generation of intelligent systems to improve surgical safety, efficiency, and training.
- Abstract(参考訳): シーングラフ(SG)は複雑なダイナミックな手術環境のデコードに不可欠な構造的リレーショナル表現を提供する。
The PRISMA-ScR-guided scoping review systemally map the evolution landscape of SG research in surgery, charting its application, methodological advanceement, and future direction。
内部ビュー(例えば、トリプルト認識)は現実世界の2Dビデオのみを使用し、外部ビュー4Dモデリングはシミュレーションデータに大きく依存し、重要な翻訳研究ギャップを露呈する。
方法論的には、基礎的なグラフニューラルネットワークから専門的な基礎モデルへと発展し、外科的文脈における一般の視覚言語モデルよりもはるかに優れている。
この進歩は、ワークフロー認識や自動安全監視、制御可能な手術シミュレーションのような生成タスクなど、分析の基盤技術としてSGを確立している。
データアノテーションとリアルタイム実装の課題は継続するが、新興技術によって積極的に対処されている。
外科用SGは重要なセマンティックブリッジに成熟しており、新しい世代のインテリジェントシステムによって外科の安全性、効率、訓練を改善することができる。
関連論文リスト
- Data-Efficient Learning for Generalizable Surgical Video Understanding [0.0]
本研究は, 深層学習に基づく外科的ビデオ解析と実世界の臨床環境とのギャップを埋めることを目的としている。
私は最先端のニューラルネットワークアーキテクチャをベンチマークして、各タスクの最も効果的な設計を特定しました。
我々は,大量の未ラベルの手術ビデオを活用することにより,タスク間のモデル性能を向上させる半駆動型フレームワークを開発した。
論文 参考訳(メタデータ) (2025-08-13T22:00:23Z) - SurgTPGS: Semantic 3D Surgical Scene Understanding with Text Promptable Gaussian Splatting [45.16104996137126]
本稿では,このギャップを埋めるために,新しいテキストプロンプタブルなガウス分割法であるSurgTPGSを提案する。
本研究では,意味的特徴のシームレスな変形を捉え,テクスチャと意味的特徴の双方をより正確に再構築する意味認識変形追跡法を提案する。
本研究では,SurgTPGSの最先端技術に対する優位性を示すために,実世界の2つの外科的データセットの総合的な実験を行った。
論文 参考訳(メタデータ) (2025-06-29T15:55:01Z) - CAT-SG: A Large Dynamic Scene Graph Dataset for Fine-Grained Understanding of Cataract Surgery [38.59801869721841]
本稿では,CAT-SGデータセットを紹介し,ツールとタスク間の相互作用,手続き的変動,時間的変動の構造化アノテーションを初めて提供する。
詳細な意味関係を取り入れることで、CAT-SGは外科的依存関係の全体像を提供し、外科的フェーズや技法をより正確に認識することができる。
論文 参考訳(メタデータ) (2025-06-26T23:25:23Z) - Surgical Foundation Model Leveraging Compression and Entropy Maximization for Image-Guided Surgical Assistance [50.486523249499115]
低侵襲手術(MIS)におけるリアルタイム映像理解の重要性
手術ビデオからコンパクトで情報的表現を学習するための,新しい自己教師型フレームワークであるCompress-to-Explore (C2E)を提案する。
C2Eは、エントロピー最大化デコーダを使用して、臨床的に関連する詳細を保持しながら画像を圧縮し、ラベル付きデータなしでエンコーダのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2025-05-16T14:02:24Z) - Surgeons vs. Computer Vision: A comparative analysis on surgical phase recognition capabilities [65.66373425605278]
自動手術相認識(SPR)は、人工知能(AI)を使用して、手術ワークフローをその重要なイベントに分割する。
従来の研究は、短い外科手術と直線的な外科手術に焦点を合わせており、時間的文脈が手術の段階をよりよく分類する専門家の能力に影響を与えるかどうかを探索していない。
本研究は,ロボットによる部分腎切除(RAPN)を高度に非直線的に行うことに焦点を当て,これらのギャップに対処する。
論文 参考訳(メタデータ) (2025-04-26T15:37:22Z) - VISAGE: Video Synthesis using Action Graphs for Surgery [34.21344214645662]
腹腔鏡下手術における映像生成の新しい課題について紹介する。
提案手法であるVISAGEは,アクションシーングラフのパワーを利用して,腹腔鏡下手術のシーケンシャルな特徴を捉える。
腹腔鏡下手術における高忠実度ビデオ生成について検討した。
論文 参考訳(メタデータ) (2024-10-23T10:28:17Z) - Dissecting Self-Supervised Learning Methods for Surgical Computer Vision [51.370873913181605]
一般のコンピュータビジョンコミュニティでは,自己監視学習(SSL)手法が普及し始めている。
医学や手術など、より複雑で影響力のある領域におけるSSLメソッドの有効性は、限定的かつ未調査のままである。
外科的文脈理解,位相認識,ツール存在検出の2つの基本的なタスクに対して,これらの手法の性能をColec80データセット上で広範囲に解析する。
論文 参考訳(メタデータ) (2022-07-01T14:17:11Z) - Multimodal Semantic Scene Graphs for Holistic Modeling of Surgical
Procedures [70.69948035469467]
カメラビューから3Dグラフを生成するための最新のコンピュータビジョン手法を利用する。
次に,手術手順の象徴的,意味的表現を統一することを目的としたマルチモーダルセマンティックグラフシーン(MSSG)を紹介する。
論文 参考訳(メタデータ) (2021-06-09T14:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。