論文の概要: TouchMap-OR: Multi-View 3D Mapping of Hand-Surface Contacts
- arxiv url: http://arxiv.org/abs/2605.17638v1
- Date: Sun, 17 May 2026 20:09:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.291533
- Title: TouchMap-OR: Multi-View 3D Mapping of Hand-Surface Contacts
- Title(参考訳): TouchMap-OR:手表面接触のマルチビュー3Dマッピング
- Authors: Sophokles Ktistakis, Rui Wang, Bastian Grande, Hugo Sax,
- Abstract要約: TouchMap-ORは、臨床医、手形状、および臨床環境の意味的構造をモデル化し、いつどこで接触が起こるかを予測するビジョンシステムである。
操作室のセマンティック3Dモデルは多視点セグメンテーションと深度融合によって構築される。
TouchMap-ORは0.75のバイナリコンタクトF1を達成し、トラッキングベースのベースラインを上回り、同等のマルチパーソントラッキング精度を維持し、0.96のID属性精度を達成している。
- 参考スコア(独自算出の注目度): 2.4060517856506087
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hand-surface interactions between clinicians, patients, and medical equipment play a central role in pathogen transmission during medical procedures. However, these interactions remain largely unobserved, as current infection-prevention practices rely on manual observation and cannot reconstruct detailed contact histories. In this work we formulate the problem of identity-resolved hand-surface interaction reconstruction in operating rooms and introduce TouchMap-OR, a multi-view RGB-D vision system that models clinicians, articulated hand geometry, and the semantic structure of the clinical environment to infer when and where contacts occur. The system reconstructs globally consistent multi-person 3D skeleton tracks across cameras while estimating articulated MANO hand meshes from RGB observations aligned to depth data. Multi-view hand reconstructions are fused and associated with tracked clinicians to obtain consistent left and right hand trajectories. A semantic 3D model of the operating room is built from multi-view segmentation and depth fusion, enabling reconstructed hand trajectories to be mapped to specific surfaces, including medical equipment, movable objects, and patient body sites. Temporal hand-surface proximity is used to infer contact episodes describing which clinician touched which surface and when. We evaluate TouchMap-OR on recordings from three real anesthesia inductions with manually annotated contact events. TouchMap-OR achieves 0.75 binary contact F1, outperforming tracking-based baselines while maintaining comparable multi-person tracking accuracy and achieving 0.96 identity attribution accuracy.
- Abstract(参考訳): 臨床医、患者、医療機器間の手動相互作用は、医療処置中の病原体伝達において中心的な役割を果たす。
しかし、現在の感染予防の慣行は手動による観察に依存しており、詳細な接触履歴の再構築はできないため、これらの相互作用はほとんど観察されていない。
本研究では,手術室における身元確認による手表面のインタラクション再構築の問題を定式化し,臨床医をモデルとした多視点RGB-D視覚システムであるTouchMap-ORを導入する。
このシステムは、RGB観測から連続したMANOハンドメッシュを深度データに一致させて推定しながら、カメラをまたいだ世界的一貫した多人数の3Dスケルトントラックを再構築する。
多視点手指再建術は,一貫した左右の軌跡を得るために,トラクテッドクリニックと融合し,関連付けられる。
手術室のセグメンテーション3Dモデルは多視点セグメンテーションと深度融合から構築され、再建された手指の軌跡を医療機器、可動物体、患者体部位など特定の表面にマッピングすることができる。
時間的手表面近接は、どの臨床医がどの表面に触れたか、いつ接触したかを示すエピソードを推測するために用いられる。
手動による接触イベントを伴う3つの実際の麻酔導入時の記録についてTouchMap-ORの評価を行った。
TouchMap-ORは0.75のバイナリコンタクトF1を達成し、トラッキングベースのベースラインを上回り、同等のマルチパーソントラッキング精度を維持し、0.96のID属性精度を達成している。
関連論文リスト
- Grasp, Slide, Roll: Comparative Analysis of Contact Modes for Tactile-Based Shape Reconstruction [5.441555196600574]
本稿では,触覚機能付きデキスタラスグリップを用いた物体形状再構成における接触モードの違いがどう影響するかを考察する。
本研究は3つの接触相互作用モード(グリップフリーズ,指の放牧による滑動,手のひらローリング)を比較した。
以上の結果から, 触覚知覚効率の向上は, 形状復元の高速化に寄与し, 34%の物理的相互作用を必要とせず, 再現精度を55%向上させることができた。
論文 参考訳(メタデータ) (2026-02-26T16:53:59Z) - A Multi-View Pipeline and Benchmark Dataset for 3D Hand Pose Estimation in Surgery [1.120882117110929]
外科的文脈における3次元手ポーズ推定のための頑健なパイプラインを提案する。
パイプラインは、信頼できる人物検出、全身ポーズ推定、最先端の2Dハンドキーポイント予測を統合する。
68,000枚以上のフレームと3000枚以上の手書き2Dハンドポーズからなる新しい手術用ベンチマークデータセットを導入する。
論文 参考訳(メタデータ) (2026-01-22T12:48:24Z) - EHWGesture -- A dataset for multimodal understanding of clinical gestures [40.20497299469609]
EHWGestureは、臨床的に関連するジェスチャーを特徴とするジェスチャー理解のためのマルチモーダルビデオデータセットである。
2台の高解像度のRGB-Depthカメラとイベントカメラを使って、25人の健康な被験者から撮影された1,100以上の録音(6時間)が含まれている。
論文 参考訳(メタデータ) (2025-09-09T09:00:03Z) - Towards Dynamic 3D Reconstruction of Hand-Instrument Interaction in Ophthalmic Surgery [38.9015512099686]
本研究は,眼科手術用RGB-D動的3D再構成データセットであるOphNet-3Dを紹介する。
40人の外科医の41のシーケンスと7100万のフレームで構成され、12の手術フェーズ、10の楽器カテゴリ、密集したMANOハンドメッシュ、フル6-DoFの楽器ポーズの詳細なアノテーションを備えている。
OphNet-3Dをベースとして,手動ポーズ推定と手動間相互作用再構成という2つの挑戦的なベンチマークを構築した。
論文 参考訳(メタデータ) (2025-05-23T09:44:02Z) - Learning Explicit Contact for Implicit Reconstruction of Hand-held
Objects from Monocular Images [59.49985837246644]
我々は,手持ちの物体を暗黙的に再構築する上で,明示的な方法で接触をモデル化する方法を示す。
まず,1つの画像から3次元手オブジェクトの接触を直接推定するサブタスクを提案する。
第2部では,ハンドメッシュ面から近傍の3次元空間へ推定された接触状態を拡散する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-31T17:59:26Z) - Next-generation Surgical Navigation: Marker-less Multi-view 6DoF Pose Estimation of Surgical Instruments [64.59698930334012]
静止カメラとヘッドマウントカメラを組み合わせたマルチカメラ・キャプチャー・セットアップを提案する。
第2に,手術用ウェットラボと実際の手術用劇場で撮影された元脊椎手術のマルチビューRGB-Dビデオデータセットを公表した。
第3に,手術器具の6DoFポーズ推定の課題に対して,最先端のシングルビューとマルチビューの3つの手法を評価した。
論文 参考訳(メタデータ) (2023-05-05T13:42:19Z) - Reconfigurable Data Glove for Reconstructing Physical and Virtual Grasps [100.72245315180433]
本研究では,人間の手-物体相互作用の異なるモードを捉えるために,再構成可能なデータグローブの設計を提案する。
グローブは3つのモードで動作し、異なる特徴を持つ様々な下流タスクを実行する。
i)手の動きと関連力を記録し,(ii)VRの操作流速を改善するとともに,(iii)様々なツールの現実的なシミュレーション効果を生み出すことにより,システムの3つのモードを評価する。
論文 参考訳(メタデータ) (2023-01-14T05:35:50Z) - Monocular 3D Reconstruction of Interacting Hands via Collision-Aware
Factorized Refinements [96.40125818594952]
単眼のRGB画像から3Dインタラクションハンドを再構築する試みを初めて行った。
提案手法では, 高精度な3次元ポーズと最小の衝突で3次元ハンドメッシュを生成することができる。
論文 参考訳(メタデータ) (2021-11-01T08:24:10Z) - RGB2Hands: Real-Time Tracking of 3D Hand Interactions from Monocular RGB
Video [76.86512780916827]
本稿では,1台のRGBカメラによる骨格ポーズのモーションキャプチャと手の表面形状をリアルタイムに計測する手法を提案する。
RGBデータの本質的な深さの曖昧さに対処するために,我々は新しいマルチタスクCNNを提案する。
RGBの片手追跡と3D再構築パイプラインの個々のコンポーネントを実験的に検証した。
論文 参考訳(メタデータ) (2021-06-22T12:53:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。