論文の概要: Gaussian Spatial Priors for Anatomy-Aware Object Detection in Surgical Videos
- arxiv url: http://arxiv.org/abs/2606.15049v1
- Date: Sat, 13 Jun 2026 01:39:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:32.740506
- Title: Gaussian Spatial Priors for Anatomy-Aware Object Detection in Surgical Videos
- Title(参考訳): 手術映像における解剖学的対象検出のためのガウス空間優先法
- Authors: Yunfan Li, Artem Shmelev, Himanshu Gupta,
- Abstract要約: DAB-DETRデコーダの自己アテンションに注入されるコンパクトなパラメトリックバイアスを提案する。
GSPは、DAB-DETRで$+33.5%$(textAP_50$)、YOLOv26で$+53.9%の依存クラス検出を改善する。
- 参考スコア(独自算出の注目度): 4.15652957197628
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting anatomical structures in surgical video is essential for intraoperative safety frameworks such as the Critical View of Myopectineal Orifice (CVMPO) in inguinal hernia repair. While prominent structures like the Cooper's Ligament and Triangle of Doom are reliably detected by standard methods, smaller structures such as the epigastric vessels remain challenging due to their visual ambiguity and intermittent visibility. We observe that the spatial relationship between structures is anatomically constrained, and propose a Gaussian Spatial Prior (GSP) module that encodes this relationship as a compact, parametric bias injected into the self-attention of a DAB-DETR decoder. The prior is computed offline from training annotations as a small set of frozen Gaussian parameters and recomputed at each decoder layer using the iteratively refined reference points. On a dataset of inguinal hernia repair videos with 5-fold cross-validation, GSP improves dependent class detection by $+33.5\%$ ($\text{AP}_{50}$) over DAB-DETR and $+53.9\%$ over YOLOv26, while also improving anchor detection by $+6.0\%$. These gains are statistically significant across all folds ($p=0.012$, paired $t-$test).
- Abstract(参考訳): 手術ビデオにおける解剖学的構造の検出は,内膜ヘルニア修復術におけるCVMPO(Citical View of Myopectineal Orifice)などの術中安全性の枠組みに不可欠である。
クーパーの靭帯やドゥームの三角形のような顕著な構造は、標準的な方法で確実に検出されるが、その視覚的曖昧さと断続的な視認性のために、上胃血管のような小さな構造は難しいままである。
我々は,構造間の空間的関係が解剖学的に制約されていることを観察し,この関係をDAB-DETRデコーダの自己アテンションに注入されたコンパクトなパラメトリックバイアスとして符号化するガウス空間優先(GSP)モジュールを提案する。
前者はトレーニングアノテーションから凍結したガウスパラメータの小さなセットとしてオフラインで計算され、反復的に洗練された参照ポイントを使用して各デコーダ層で再計算される。
5倍のクロスバリデーションを持つ内臓ヘルニア修復ビデオのデータセットでは、GSPはDAB-DETRで$+33.5\%$$$\text{AP}_{50}$)、YOLOv26で$+53.9\%$で依存クラス検出を改善し、さらに$+6.0\%$でアンカー検出を改善している。
これらの利得はすべての折り畳み(p=0.012$, paired $t-$test)で統計的に有意である。
関連論文リスト
- SA-CycleGAN-2.5D: Self-Attention CycleGAN with Tri-Planar Context for Multi-Site MRI Harmonization [3.5109108807229403]
本稿では,Ben-David らによる$HH$-divergence 境界によるドメイン適応フレームワーク SA-CycleGAN-2.5D を提案する。
2D効率と3D一貫性をブリッジすることで,腫瘍の病態を保ったボクセルレベルの高調波画像が得られる。
論文 参考訳(メタデータ) (2026-03-17T23:49:46Z) - BridgeSplat: Bidirectionally Coupled CT and Non-Rigid Gaussian Splatting for Deformable Intraoperative Surgical Navigation [69.14180476971602]
変形可能な手術ナビゲーションのための新しいアプローチであるBridgeSplatを紹介する。
提案手法は3次元ガウスをCTメッシュにリグし,ガウスパラメータとメッシュ変形の合同最適化を可能にする。
シミュレーションにより,BridgeSplatがブタの内臓手術およびヒト肝臓の合成データに与える影響を実証した。
論文 参考訳(メタデータ) (2025-09-23T01:09:36Z) - Topology-Constrained Learning for Efficient Laparoscopic Liver Landmark Detection [46.2391319253146]
肝のランドマークは腹腔鏡下肝手術中に外科医に重要な解剖学的ガイダンスを提供する。
TopoNetは腹腔鏡下肝ランドマーク検出のための新しいトポロジ制約学習フレームワークである。
我々のフレームワークは、スネーク・CNNデュアルパス・エンコーダを用いて、詳細なRGBテクスチャ情報と深さインフォームドトポロジ構造を同時に取得する。
論文 参考訳(メタデータ) (2025-07-01T07:35:36Z) - KaLDeX: Kalman Filter based Linear Deformable Cross Attention for Retina Vessel Segmentation [46.57880203321858]
カルマンフィルタを用いた線形変形型クロスアテンション(LDCA)モジュールを用いた血管セグメンテーションのための新しいネットワーク(KaLDeX)を提案する。
我々のアプローチは、カルマンフィルタ(KF)ベースの線形変形可能な畳み込み(LD)とクロスアテンション(CA)モジュールの2つの重要なコンポーネントに基づいている。
提案手法は,網膜基底画像データセット(DRIVE,CHASE_BD1,STARE)とOCTA-500データセットの3mm,6mmを用いて評価した。
論文 参考訳(メタデータ) (2024-10-28T16:00:42Z) - Thoracic Cartilage Ultrasound-CT Registration using Dense Skeleton Graph [49.11220791279602]
一般的なアトラスから個々の患者への計画された経路を正確にマッピングすることは困難である。
アトラスから現在の設定へ計画されたパスを転送できるように、グラフベースの非厳密な登録を提案する。
論文 参考訳(メタデータ) (2023-07-07T18:57:21Z) - Deep Omni-supervised Learning for Rib Fracture Detection from Chest
Radiology Images [41.62893318123283]
ディープラーニング(DL)に基づくリブ骨折検出は、死亡を予防し、患者の予後を改善する上で重要な役割を担っている。
DLベースのオブジェクト検出モデルは、大量のバウンディングボックスアノテーションを必要とします。
医用データの注釈付けは時間がかかり専門知識が要求されるため、大量の細かい注釈を得られることは極めて不可能である。
我々は,ORF-Netv2という新しいオブジェクト検出ネットワークを提案する。
論文 参考訳(メタデータ) (2023-06-23T05:36:03Z) - A geometry-aware deep network for depth estimation in monocular
endoscopy [17.425158094539462]
提案手法は,異なるデータセットと臨床画像にまたがって広範囲に検証されている。
提案法の平均RMSE値は12.604(T1-L1)、9.930(T2-L2)、13.893(Colon)である。
論文 参考訳(メタデータ) (2023-04-20T11:59:32Z) - Modeling Barrett's Esophagus Progression using Geometric Variational Autoencoders [6.72834963752212]
バレット食道(BE)の早期発見は食道癌を効果的に予防し治療するために重要である。
S-VAEとShape Kendall VAEは,分類精度,再構成損失,生成能力の向上を示した。
論文 参考訳(メタデータ) (2023-03-17T14:08:16Z) - SCPM-Net: An Anchor-free 3D Lung Nodule Detection Network using Sphere
Representation and Center Points Matching [47.79483848496141]
3次元球面表現に基づく中心点マッチング検出ネットワーク(SCPM-Net)を提案する。
アンカーフリーで、nodule/anchorパラメータを手動で設計することなく、nodulesの位置、半径、オフセットを自動的に予測する。
提案するSCPM-Netフレームワークは,既存のアンカーベースおよびアンカーフリーの肺結節検出法と比較して,優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2021-04-12T05:51:29Z) - Esophageal Tumor Segmentation in CT Images using Dilated Dense Attention
Unet (DDAUnet) [3.0929226049096217]
畳み込みニューラルネットワーク(CNN)を用いた食道癌全自動切除法を提案する。
提案するネットワークはDilated Dense Attention Unet (DDAUnet) と呼ばれ、各密ブロックにおける空間的およびチャネル的注意力を活用して、決定的特徴写像と領域に選択的に集中する。
論文 参考訳(メタデータ) (2020-12-06T11:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。