論文の概要: Self-Supervised Uncalibrated Multi-View Video Anonymization in the Operating Room
- arxiv url: http://arxiv.org/abs/2602.02850v1
- Date: Mon, 02 Feb 2026 21:54:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.107303
- Title: Self-Supervised Uncalibrated Multi-View Video Anonymization in the Operating Room
- Title(参考訳): 手術室における自己監督型非校正型マルチビュービデオ匿名化
- Authors: Keqi Chen, Vinkle Srivastav, Armine Vardazaryan, Cindy Rolland, Didier Mutter, Nicolas Padoy,
- Abstract要約: 全身人物検出と全身ポーズ推定からなる新しい多視点ビデオ匿名化フレームワークを提案する。
我々の中核となる戦略は、時間的・多視点コンテキストを用いて偽陰性を取り出すことにより、単一視点検出器を強化することである。
模擬手術の4D-ORデータセットと実手術のデータセットを用いて実験したところ,97%以上のリコールが達成された。
- 参考スコア(独自算出の注目度): 11.757426920071175
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Privacy preservation is a prerequisite for using video data in Operating Room (OR) research. Effective anonymization relies on the exhaustive localization of every individual; even a single missed detection necessitates extensive manual correction. However, existing approaches face two critical scalability bottlenecks: (1) they usually require manual annotations of each new clinical site for high accuracy; (2) while multi-camera setups have been widely adopted to address single-view ambiguity, camera calibration is typically required whenever cameras are repositioned. To address these problems, we propose a novel self-supervised multi-view video anonymization framework consisting of whole-body person detection and whole-body pose estimation, without annotation or camera calibration. Our core strategy is to enhance the single-view detector by "retrieving" false negatives using temporal and multi-view context, and conducting self-supervised domain adaptation. We first run an off-the-shelf whole-body person detector in each view with a low-score threshold to gather candidate detections. Then, we retrieve the low-score false negatives that exhibit consistency with the high-score detections via tracking and self-supervised uncalibrated multi-view association. These recovered detections serve as pseudo labels to iteratively fine-tune the whole-body detector. Finally, we apply whole-body pose estimation on each detected person, and fine-tune the pose model using its own high-score predictions. Experiments on the 4D-OR dataset of simulated surgeries and our dataset of real surgeries show the effectiveness of our approach achieving over 97% recall. Moreover, we train a real-time whole-body detector using our pseudo labels, achieving comparable performance and highlighting our method's practical applicability. Code is available at https://github.com/CAMMA-public/OR_anonymization.
- Abstract(参考訳): プライバシー保護は、オペレーティング・ルーム(OR)研究でビデオデータを使用するための前提条件である。
効果的な匿名化は、全個人の徹底的な局所化に依存している。
しかし,既存のアプローチでは,(1)新しい臨床現場のマニュアルアノテーションを高い精度で必要とすること,(2)単一視野のあいまいさに対処するためのマルチカメラ設定が広く採用されていること,などの2つの重要なスケーラビリティ上のボトルネックに直面している。
これらの問題に対処するために,アノテーションやカメラキャリブレーションを使わずに,全身の人物検出と全身のポーズ推定からなる,新しい自己監督型多視点ビデオ匿名化フレームワークを提案する。
我々の中核となる戦略は、時間的・多視点的文脈を用いて偽陰性を取り出し、自己教師付きドメイン適応を行うことにより、単一視点検出器を強化することである。
まず、各ビューに低スコアしきい値のオフ・ザ・シェルフ全身人検出装置を走らせ、候補検出を収集する。
そして、追跡と自己教師なしマルチビューアソシエーションにより、ハイスコア検出と整合性を示す低スコア偽陰性を検索する。
これらの回収された検出は、ボディ全体の検出器を反復的に微調整する擬似ラベルとして機能する。
最後に、検出された各人物に全身のポーズ推定を適用し、自作のハイスコア予測を用いてポーズモデルを微調整する。
模擬手術の4D-ORデータセットと実手術のデータセットを用いて実験したところ,97%以上のリコールが達成された。
さらに、擬似ラベルを用いて実時間全体検出装置を訓練し、同等の性能を達成し、本手法の実用性を強調した。
コードはhttps://github.com/CAMMA-public/OR_anonymizationで入手できる。
関連論文リスト
- ExposeAnyone: Personalized Audio-to-Expression Diffusion Models Are Robust Zero-Shot Face Forgery Detectors [58.45131932883374]
ビデオ中のディープフェイクを検出するための完全自己教師型アプローチを提案する。
本モデルでは,拡散再構成誤差を用いて,疑わしい映像とパーソナライズされた被写体との同一性距離を算出する。
本手法は, ボケや圧縮などの汚損に対して極めて堅牢であり, 現実の顔偽造検出への適用性を強調している。
論文 参考訳(メタデータ) (2026-01-05T18:59:54Z) - Privacy Beyond Pixels: Latent Anonymization for Privacy-Preserving Video Understanding [56.369026347458835]
本稿では,ビデオ基盤モデルにおける視覚的プライバシ保護の新たな定式化について紹介する。
入力ピクセルレベルの匿名化に関する現在のプライバシー保護手法では、ユーティリティビデオモデル全体を再トレーニングする必要がある。
軽量な Anonym Adapter Module (AAM) は、一般的なタスクユーティリティを維持しながら、ビデオ機能からプライベート情報を除去する。
論文 参考訳(メタデータ) (2025-11-11T18:56:27Z) - No Identity, no problem: Motion through detection for people tracking [48.708733485434394]
本稿では,検出のみの監視を行いながら,動きの手がかりを利用する手法を提案する。
提案アルゴリズムは,2つの画像間の2次元運動推定とともに,2つの異なるタイミングで熱マップを検出する。
提案手法は,MOT17およびWILDTRACKデータセット上でのマルチターゲット・シングルビュー・マルチターゲット・トラッキングに対して,最先端の結果を提供する。
論文 参考訳(メタデータ) (2024-11-25T15:13:17Z) - Practical Video Object Detection via Feature Selection and Aggregation [18.15061460125668]
ビデオオブジェクト検出(VOD)は、オブジェクトの外観における高いフレーム間変動と、いくつかのフレームにおける多様な劣化を懸念する必要がある。
現代のアグリゲーション法のほとんどは、高い計算コストに苦しむ2段階検出器用に調整されている。
この研究は、特徴選択と集約の非常に単純だが強力な戦略を考案し、限界計算コストでかなりの精度を得る。
論文 参考訳(メタデータ) (2024-07-29T02:12:11Z) - Reducing False Alarms in Video Surveillance by Deep Feature Statistical
Modeling [16.311150636417256]
我々は, 深部特徴の高次元統計的モデリングに基づいて, 弱教師付きa-コントラリオ検証法を開発した。
実験結果から,提案したa-contrarioバリデーションにより,画素レベルとオブジェクトレベルの偽アラームの回数を大幅に削減できることがわかった。
論文 参考訳(メタデータ) (2023-07-09T12:37:17Z) - Enhancing Multi-Camera People Tracking with Anchor-Guided Clustering and
Spatio-Temporal Consistency ID Re-Assignment [22.531044994763487]
本稿では,アンカークラスタリング誘導を用いたマルチカメラによる複数人物追跡手法を提案する。
提案手法は,各個人固有の重要な特徴を特定することによって,トラッキングの精度を向上させることを目的としている。
この手法は, 合成データと実世界のデータの両方を扱う上で, 堅牢性と有効性を示した。
論文 参考訳(メタデータ) (2023-04-19T07:38:15Z) - Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera [83.31666463259849]
2次元LiDARに基づく人検出器のトレーニングラベル(擬似ラベル)を自動生成する手法を提案する。
擬似ラベルで訓練または微調整された自己監視検出器が,手動アノテーションを用いて訓練された検出器を上回っていることを示した。
私達の方法は付加的な分類の努力なしで配置の間に人の探知器を改善する有効な方法です。
論文 参考訳(メタデータ) (2020-12-16T12:10:04Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Self-trained Deep Ordinal Regression for End-to-End Video Anomaly
Detection [114.9714355807607]
ビデオ異常検出に自己学習深層順序回帰を適用することで,既存の手法の2つの重要な限界を克服できることを示す。
我々は,手動で正規/異常データをラベル付けすることなく,共同表現学習と異常スコアリングを可能にする,エンドツーエンドのトレーニング可能なビデオ異常検出手法を考案した。
論文 参考訳(メタデータ) (2020-03-15T08:44:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。