論文の概要: PanORama: Multiview Consistent Panoptic Segmentation in Operating Rooms
- arxiv url: http://arxiv.org/abs/2603.19920v1
- Date: Fri, 20 Mar 2026 13:04:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.143245
- Title: PanORama: Multiview Consistent Panoptic Segmentation in Operating Rooms
- Title(参考訳): Panorama: オペレーティングルームにおけるマルチビュー一貫性パノラマセグメンテーション
- Authors: Tuna Gürbüz, Ege Özsoy, Tony Danjun Wang, Nassir Navab,
- Abstract要約: パノラマ (Panorama) は, 設計上はマルチビューに一貫性のある, 手術室のための最初のパノラマセグメントである。
単一のフォワードパスで、バックボーン内の機能レベルでのクロスビューインタラクションをモデル化することにより、ビューの一貫性は、ポストホックリファインメント(post-hoc refinement)を通じてではなく、直接的に現れる。
Panoramaはキャリブレーションフリーで、カメラパラメータを必要とせず、推論時にどんなマルチビュー構成でもカメラの視点を見えないように一般化する。
- 参考スコア(独自算出の注目度): 39.219645333154794
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Operating rooms (ORs) are cluttered, dynamic, highly occluded environments, where reliable spatial understanding is essential for situational awareness during complex surgical workflows. Achieving spatial understanding for panoptic segmentation from sparse multiview images poses a fundamental challenge, as limited visibility in a subset of views often leads to mispredictions across cameras. To this end, we introduce PanORama, the first panoptic segmentation for the operating room that is multiview-consistent by design. By modeling cross-view interactions at the feature level inside the backbone in a single forward pass, view consistency emerges directly rather than through post-hoc refinement. We evaluate on the MM-OR and 4D-OR datasets, achieving >70% Panoptic Quality (PQ) performance, and outperforming the previous state of the art. Importantly, PanORama is calibration-free, requiring no camera parameters, and generalizes to unseen camera viewpoints within any multiview configuration at inference time. By substantially enhancing multiview segmentation and, consequently, spatial understanding in the OR, we believe our approach opens new opportunities for surgical perception and assistance. Code will be released upon acceptance.
- Abstract(参考訳): 手術室(OR)は、複雑な外科的ワークフローにおける状況認識に、信頼性の高い空間理解が不可欠である、散らかって、動的で、密集した環境である。
スパース・マルチビュー画像からパノプティカル・セグメンテーションの空間的理解を得ることは、ビューのサブセットの視認性に限界があるため、カメラ間での誤予測につながることが多いため、根本的な課題である。
そこで本研究では,多視点対応の手術室用パノラマについて紹介する。
単一のフォワードパスで、バックボーン内の機能レベルでのクロスビューインタラクションをモデル化することにより、ビューの一貫性は、ポストホックリファインメント(post-hoc refinement)を通じてではなく、直接的に現れる。
MM-ORと4D-ORのデータセットを用いて評価し,PQ(Panoptic Quality)の70%以上の性能を達成し,先行技術よりも優れていた。
パノラマはキャリブレーションフリーで、カメラパラメータを必要とせず、推論時にどんなマルチビュー構成でもカメラの視点を見えないように一般化する。
マルチビューセグメンテーションを大幅に強化することにより,ORの空間的理解が深まり,外科的知覚と補助の新たな機会が開けると考えている。
コードは受理時にリリースされる。
関連論文リスト
- More than the Sum: Panorama-Language Models for Adverse Omni-Scenes [63.9800546079941]
既存の視覚言語モデル(VLM)はピンホール画像用に調整され、複数の視野の狭い入力を縫い合わせ、完全な全シーン理解を組み立てる。
本稿では,Panorama-Language Modeling (PLM) パラダイムについて紹介する。
論文 参考訳(メタデータ) (2026-03-10T12:19:50Z) - Panoramic Out-of-Distribution Segmentation for Autonomous Driving [25.32165408678185]
パノラマ・アウト・オブ・ディストリビューション(PanOoS)を導入し,包括的で安全なシーン理解を実現する。
POSはテキスト誘導の即時分布学習によりパノラマ画像の特徴に適応する。
POSは、主要なクローズドセットセグメンテーション機能を実現し、パノラマ理解の開発を進める。
論文 参考訳(メタデータ) (2025-05-06T13:51:26Z) - Scene-Centric Unsupervised Panoptic Segmentation [56.253072379456356]
教師なしのパノプティックセグメンテーションは、手動でアノテートされたデータをトレーニングすることなく、イメージを意味のある領域と異なるオブジェクトインスタンスに分割することを目的としている。
シーン中心の画像を直接トレーニングする、教師なしの初めてのパン光学的手法を提案する。
論文 参考訳(メタデータ) (2025-04-02T17:58:46Z) - MOSAIC: Generating Consistent, Privacy-Preserving Scenes from Multiple Depth Views in Multi-Room Environments [21.060917984023273]
奥行き画像のみから多ルーム屋内環境のプライバシ保存型デジタル双生児を生成するための拡散型アプローチを提案する。
我々のアプローチの中心は、新しいMOSAIC(Multi-view Overlapped Scene Alignment with Implicit Consistency)モデルである。
実験により、MOSAICは複雑なマルチルーム環境の再構築において、画像の忠実度測定における最先端のベースラインよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-03-18T01:50:57Z) - Multi-view Video-Pose Pretraining for Operating Room Surgical Activity Recognition [5.787586057526269]
外科的活動認識は、多視点カメラ記録から活動やフェーズを検出する重要なコンピュータビジョンタスクである。
既存のSARモデルは、細粒度のクリニックの動きや多視点の知識を説明できないことが多い。
本稿では, マルチビュー・プレトレーニング・フレームワークであるMultiview Pretraining for Video-Pose Surgery Activity Recognition PreViPSを提案する。
論文 参考訳(メタデータ) (2025-02-19T17:08:04Z) - Panoramic Panoptic Segmentation: Insights Into Surrounding Parsing for
Mobile Agents via Unsupervised Contrastive Learning [93.6645991946674]
我々はパノラマパノラマパノプティクスのセグメンテーションを最も総合的なシーン理解として紹介する。
完全な周囲の理解は、移動エージェントに最大限の情報を提供する。
本稿では,標準的なピンホール画像のモデルトレーニングを可能にし,学習した特徴を別のドメインに転送するフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-21T20:07:15Z) - Panoramic Panoptic Segmentation: Towards Complete Surrounding
Understanding via Unsupervised Contrastive Learning [97.37544023666833]
我々は,パノラマパオプティックセグメンテーションを最も総合的なシーン理解として導入する。
完全な周囲の理解は、エージェントに最大限の情報を提供する。
標準ピンホール画像のモデルトレーニングを可能にし、学習した機能を異なるドメインに転送するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-01T09:37:27Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。