論文の概要: Mitigating Biases in Surgical Operating Rooms with Geometry
- arxiv url: http://arxiv.org/abs/2508.08028v1
- Date: Mon, 11 Aug 2025 14:32:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.142689
- Title: Mitigating Biases in Surgical Operating Rooms with Geometry
- Title(参考訳): 手術室におけるビアーゼの幾何学的変化
- Authors: Tony Danjun Wang, Tobias Czempiel, Nassir Navab, Lennart Bastian,
- Abstract要約: ディープニューラルネットワークは、予測のためにデータセット固有のアーティファクトを活用することで、急激な相関を学習する傾向がある。
外科手術室 (OR) では, スモックやガウンの標準化により, 目印が不明瞭であることが明らかとなった。
この問題を解決するために、人員を3Dポイントクラウドシーケンスとしてエンコードし、外見に基づく共同設立者からアイデンティティ関連形状と動きパターンを遠ざけている。
- 参考スコア(独自算出の注目度): 39.347990924384824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep neural networks are prone to learning spurious correlations, exploiting dataset-specific artifacts rather than meaningful features for prediction. In surgical operating rooms (OR), these manifest through the standardization of smocks and gowns that obscure robust identifying landmarks, introducing model bias for tasks related to modeling OR personnel. Through gradient-based saliency analysis on two public OR datasets, we reveal that CNN models succumb to such shortcuts, fixating on incidental visual cues such as footwear beneath surgical gowns, distinctive eyewear, or other role-specific identifiers. Avoiding such biases is essential for the next generation of intelligent assistance systems in the OR, which should accurately recognize personalized workflow traits, such as surgical skill level or coordination with other staff members. We address this problem by encoding personnel as 3D point cloud sequences, disentangling identity-relevant shape and motion patterns from appearance-based confounders. Our experiments demonstrate that while RGB and geometric methods achieve comparable performance on datasets with apparent simulation artifacts, RGB models suffer a 12% accuracy drop in realistic clinical settings with decreased visual diversity due to standardizations. This performance gap confirms that geometric representations capture more meaningful biometric features, providing an avenue to developing robust methods of modeling humans in the OR.
- Abstract(参考訳): ディープニューラルネットワークは、予測に意味のある機能ではなく、データセット固有のアーティファクトを活用することで、刺激的な相関を学習する傾向がある。
外科手術室 (OR) では, スモックやガウンの標準化により, ランドマークを曖昧に識別し, OR職員のモデリングに関わる作業に対するモデルバイアスを導入した。
2つの公開ORデータセットの勾配に基づく塩分濃度分析により、CNNモデルはそのようなショートカットに順応し、手術用ガウンの下の履物、特徴的な眼鏡、その他の役割特異的識別子などの付随的な視覚的手がかりに固定することを明らかにした。
このようなバイアスを回避することは、外科的スキルレベルや他のスタッフとの調整など、パーソナライズされたワークフローの特徴を正確に認識する、ORの次世代のインテリジェントアシスタントシステムにとって不可欠である。
この問題を解決するために、人員を3Dポイントクラウドシーケンスとしてエンコードし、外見に基づく共同設立者からアイデンティティ関連形状と動きパターンを遠ざけている。
実験により,RGBモデルと幾何学的手法は明らかなシミュレーションアーティファクトを持つデータセットにおいて同等の性能を達成できたが,RGBモデルは現実的な臨床環境において12%の精度低下を経験し,標準化による視覚的多様性の低下が認められた。
この性能ギャップは、幾何学的表現がより有意義な生体的特徴を捉え、ORで人間をモデリングする堅牢な手法を開発するための道筋となることを確認している。
関連論文リスト
- Privacy-Preserving Operating Room Workflow Analysis using Digital Twins [38.744671293771695]
本稿では,プライバシー保護操作室(OR)のビデオ解析とイベント検出のための2段階パイプラインを提案する。
まず、従来のRGBビデオからORのDigital Twinsを生成するために、奥行き推定とセマンティックセグメンテーションに視覚基盤モデルを利用する。
第2に、セグメンテーションマスクと深度マップをORイベント検出のために処理する、融合した2ストリームアプローチであるSafeORモデルを用いる。
論文 参考訳(メタデータ) (2025-04-17T00:46:06Z) - Uncertainty modeling for fine-tuned implicit functions [10.902709236602536]
入射関数は、スパースビューから詳細な物体形状を再構成するコンピュータビジョンにおいて重要な役割を担っている。
暗黙関数における不確実性推定手法であるDropsemblesを導入する。
その結果,Dropsemblesは深層アンサンブルの精度とキャリブレーションレベルを達成するが,計算コストは著しく低いことがわかった。
論文 参考訳(メタデータ) (2024-06-17T20:46:18Z) - Learning Discriminative Representations for Skeleton Based Action
Recognition [49.45405879193866]
本稿では,骨格の識別表現を得るために,補助機能改善ヘッド(FRヘッド)を提案する。
提案したモデルでは,最先端手法による競合結果が得られ,あいまいなサンプルの識別に役立てることができる。
論文 参考訳(メタデータ) (2023-03-07T08:37:48Z) - Improving Deep Facial Phenotyping for Ultra-rare Disorder Verification
Using Model Ensembles [52.77024349608834]
我々は、DCNNを最先端の顔認識手法であるiResNetとArcFaceに置き換える影響を分析する。
提案するアンサンブルモデルにより,目視と目視の両障害に対する最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2022-11-12T23:28:54Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Facial Anatomical Landmark Detection using Regularized Transfer Learning
with Application to Fetal Alcohol Syndrome Recognition [24.27777060287004]
出生前アルコール曝露による胎児アルコール症候群(FAS)は、一連の頭蓋顔面異常を引き起こす可能性がある。
解剖学的ランドマーク検出は,FAS関連顔面異常の検出に重要である。
自然画像における顔のランドマーク検出のために設計された現在のディープラーニングに基づく熱マップ回帰法は、大きなデータセットが利用できることを前提としている。
我々は,大規模な顔認識データセットから学習したネットワークの知識を活用する,新たな正規化トランスファー学習手法を開発した。
論文 参考訳(メタデータ) (2021-09-12T11:05:06Z) - TSGCNet: Discriminative Geometric Feature Learning with Two-Stream
GraphConvolutional Network for 3D Dental Model Segmentation [141.2690520327948]
2流グラフ畳み込みネットワーク(TSGCNet)を提案し、異なる幾何学的特性から多視点情報を学ぶ。
3次元口腔内スキャナーで得られた歯科モデルのリアルタイムデータセットを用いてTSGCNetの評価を行った。
論文 参考訳(メタデータ) (2020-12-26T08:02:56Z) - Classifying Eye-Tracking Data Using Saliency Maps [8.524684315458245]
本稿では,視線追跡データの自動的,定量的分類のための視覚情報に基づく特徴抽出手法を提案する。
サリエンシの振幅、類似度、相違点を対応するアイフィクスマップと比較すると、視覚追跡データを識別するために識別的特徴を生成するために有効に活用される情報の余分な次元が得られる。
論文 参考訳(メタデータ) (2020-10-24T15:18:07Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - "Name that manufacturer". Relating image acquisition bias with task
complexity when training deep learning models: experiments on head CT [0.0]
我々は、データセットにおけるスキャナーメーカーの分布がディープラーニングモデルの全体的なバイアスにどのように貢献するかを分析する。
我々は、CNNが画像スキャナーメーカーを識別し、このバイアスがモデルの性能に大きな影響を与えることを実証した。
論文 参考訳(メタデータ) (2020-08-19T16:05:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。