論文の概要: Privacy-Preserving Operating Room Workflow Analysis using Digital Twins
- arxiv url: http://arxiv.org/abs/2504.12552v2
- Date: Thu, 03 Jul 2025 06:11:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:14.083004
- Title: Privacy-Preserving Operating Room Workflow Analysis using Digital Twins
- Title(参考訳): ディジタルツインを用いた動作室ワークフロー解析のプライバシ保護
- Authors: Alejandra Perez, Han Zhang, Yu-Chun Ku, Lalithkumar Seenivasan, Roger Soberanis, Jose L. Porras, Richard Day, Jeff Jopling, Peter Najjar, Mathias Unberath,
- Abstract要約: 本稿では,プライバシー保護操作室(OR)のビデオ解析とイベント検出のための2段階パイプラインを提案する。
まず、従来のRGBビデオからORのDigital Twinsを生成するために、奥行き推定とセマンティックセグメンテーションに視覚基盤モデルを利用する。
第2に、セグメンテーションマスクと深度マップをORイベント検出のために処理する、融合した2ストリームアプローチであるSafeORモデルを用いる。
- 参考スコア(独自算出の注目度): 38.744671293771695
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The operating room (OR) is a complex environment where optimizing workflows is critical to reduce costs and improve patient outcomes. While computer vision approaches for automatic recognition of perioperative events can identify bottlenecks for OR optimization, privacy concerns limit the use of OR videos for automated event detection. We propose a two-stage pipeline for privacy-preserving OR video analysis and event detection. First, we leverage vision foundation models for depth estimation and semantic segmentation to generate de-identified Digital Twins (DT) of the OR from conventional RGB videos. Second, we employ the SafeOR model, a fused two-stream approach that processes segmentation masks and depth maps for OR event detection. Evaluation on an internal dataset of 38 simulated surgical trials with five event classes shows that our DT-based approach achieves performance on par with -- and sometimes better than -- raw RGB video-based models for OR event detection. Digital Twins enable privacy-preserving OR workflow analysis, facilitating the sharing of de-identified data across institutions and potentially enhancing model generalizability by mitigating domain-specific appearance differences.
- Abstract(参考訳): 手術室(OR)は、ワークフローの最適化がコスト削減と患者の成果改善に不可欠である複雑な環境である。
周術期イベントの自動認識のためのコンピュータビジョンアプローチは、OR最適化のボトルネックを特定することができるが、プライバシー上の懸念は、自動イベント検出のためのORビデオの使用を制限する。
プライバシー保護ORビデオ分析とイベント検出のための2段階パイプラインを提案する。
まず、従来のRGBビデオからORの非識別デジタルツイン(DT)を生成するために、奥行き推定とセマンティックセグメンテーションのための視覚基盤モデルを利用する。
第2に、セグメンテーションマスクと深度マップをORイベント検出のために処理する、融合した2ストリームアプローチであるSafeORモデルを用いる。
5つのイベントクラスによる38のシミュレートされた外科的臨床試験の内部データセットの評価は、私たちのDTベースのアプローチが、ORイベント検出のための生のRGBビデオベースモデルと同等、時には同等のパフォーマンスを実現していることを示している。
Digital Twinsは、プライバシ保護ORワークフロー分析を可能にし、機関間で識別されていないデータの共有を容易にし、ドメイン固有の外観の違いを緩和することで、モデル一般化性を高める可能性がある。
関連論文リスト
- Operating Room Workflow Analysis via Reasoning Segmentation over Digital Twins [7.34430213311229]
手術室 (OR) を解析し, OR効率に関する定量的知見を導出することが病院にとって重要である。
基礎モデルに基づく推論セグメンテーション(RS)は、ORビデオフィードからOR改善の自動分析を可能にする柔軟性を提供する。
ORDiRS(Operation Room Digital twin representation for Reasoning, LLMフリーRSフレームワーク)について述べる。
論文 参考訳(メタデータ) (2025-03-26T23:59:32Z) - SpecDM: Hyperspectral Dataset Synthesis with Pixel-level Semantic Annotations [27.391859339238906]
本稿では,画素レベルのアノテーションを用いたハイパースペクトル画像の合成における生成拡散モデルの可能性について検討する。
私たちの知る限りでは、アノテーションで高次元のHSIを生成するのはこれが初めてです。
我々は、セマンティックセグメンテーションと変化検出の2つの最も広く使われている密集予測タスクを選択し、これらのタスクに適したデータセットを生成する。
論文 参考訳(メタデータ) (2025-02-24T11:13:37Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Unseen Object Instance Segmentation with Fully Test-time RGB-D
Embeddings Adaptation [14.258456366985444]
最近では、大規模な合成データのRGB-D機能を活用し、実世界のシナリオにモデルを適用するのが一般的である。
本稿では,Sim2Realドメイン間の適応プロセスを再強調する。
本稿では,BatchNorm層のパラメータに基づいて,完全テスト時間RGB-D埋め込み適応(FTEA)を行うフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-21T02:35:20Z) - Underwater Object Classification and Detection: first results and open
challenges [1.1549572298362782]
本研究は,水中環境における物体検出の問題点を概観する。
我々は、従来の最先端(SOTA)アルゴリズムの欠点を分析し、定量化する。
論文 参考訳(メタデータ) (2022-01-04T04:54:08Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z) - Target-Aware Object Discovery and Association for Unsupervised Video
Multi-Object Segmentation [79.6596425920849]
本稿では,教師なしビデオマルチオブジェクトセグメンテーションの課題について述べる。
より正確で効率的な時間区分のための新しいアプローチを紹介します。
DAVIS$_17$とYouTube-VISに対する提案手法を評価した結果,セグメント化精度と推論速度の両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-04-10T14:39:44Z) - Efficient Two-Stream Network for Violence Detection Using Separable
Convolutional LSTM [0.0]
Separable Convolutional LSTM(SepConvLSTM)と予め訓練されたMobileNetを活用した効率的な2ストリームディープラーニングアーキテクチャを提案する。
SepConvLSTMは、ConvLSTMの各ゲートの畳み込み操作を深さ方向に分離可能な畳み込みに置き換えて構築されます。
我々のモデルは、大きくて挑戦的なrwf-2000データセットの精度を2%以上上回っている。
論文 参考訳(メタデータ) (2021-02-21T12:01:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。