論文の概要: Evaluation of facial landmark localization performance in a surgical setting
- arxiv url: http://arxiv.org/abs/2507.18248v1
- Date: Thu, 24 Jul 2025 09:40:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:43.337078
- Title: Evaluation of facial landmark localization performance in a surgical setting
- Title(参考訳): 外科領域における顔のランドマーク化性能の評価
- Authors: Ines Frajtag, Marko Švaco, Filip Šuligoj,
- Abstract要約: 多くの顔検出アルゴリズムは神経外科、眼科、整形外科に応用されている。
これらのアルゴリズムを使用する際の一般的な課題は、患者を特定、正確に局所化するための様々な照明条件と検出位置の柔軟性である。
提案実験では,手術光と幻覚が一定位置にある状態で自動的に位置を調整するロボットアームを用いて,制御された環境下で顔のランドマークを検出するためのMediaPipeアルゴリズムを試験した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The use of robotics, computer vision, and their applications is becoming increasingly widespread in various fields, including medicine. Many face detection algorithms have found applications in neurosurgery, ophthalmology, and plastic surgery. A common challenge in using these algorithms is variable lighting conditions and the flexibility of detection positions to identify and precisely localize patients. The proposed experiment tests the MediaPipe algorithm for detecting facial landmarks in a controlled setting, using a robotic arm that automatically adjusts positions while the surgical light and the phantom remain in a fixed position. The results of this study demonstrate that the improved accuracy of facial landmark detection under surgical lighting significantly enhances the detection performance at larger yaw and pitch angles. The increase in standard deviation/dispersion occurs due to imprecise detection of selected facial landmarks. This analysis allows for a discussion on the potential integration of the MediaPipe algorithm into medical procedures.
- Abstract(参考訳): ロボット工学、コンピュータビジョン、そしてそれらの応用は、医学を含む様々な分野に広まっている。
多くの顔検出アルゴリズムは神経外科、眼科、整形外科に応用されている。
これらのアルゴリズムを使用する際の一般的な課題は、患者を特定、正確に局所化するための様々な照明条件と検出位置の柔軟性である。
提案実験では,手術光と幻覚が一定位置にある状態で自動的に位置を調整するロボットアームを用いて,制御された環境下で顔のランドマークを検出するためのMediaPipeアルゴリズムを試験した。
本研究は,手術照明下での顔の目印検出精度の向上が,より大きいヨーとピッチ角での検出性能を著しく向上させることを示した。
標準偏差/分散の増大は、選択された顔のランドマークを不正確な検出によって生じる。
この分析は、MediaPipeアルゴリズムを医療処置に統合する可能性についての議論を可能にする。
関連論文リスト
- Stable Tracking of Eye Gaze Direction During Ophthalmic Surgery [6.887111029199582]
本研究は,機械学習と従来のアルゴリズムを組み合わせた,革新的なアイローカライゼーションと追跡手法を提案する。
提案手法は、視線方向推定における平均推定誤差が0.58度、ロボットアームの動きに対する平均制御誤差が2.08度である。
論文 参考訳(メタデータ) (2025-07-01T10:28:40Z) - Benchmarking Laparoscopic Surgical Image Restoration and Beyond [54.28852320829451]
腹腔鏡下手術では、明瞭で高品質な視野が外科医の正確な判断に不可欠である。
持続的な視覚劣化、例えば、エネルギー装置によって発生する煙、熱勾配から光るレンズ、およびレンズ汚染は患者の安全に危険をもたらす。
本稿では,SurgCleanと呼ばれる腹腔鏡下環境を対象とするオープンソースの手術画像復元データセットについて紹介する。
論文 参考訳(メタデータ) (2025-05-25T14:17:56Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - End-to-End assessment of AR-assisted neurosurgery systems [0.5892638927736115]
我々は、AR支援型神経外科システムを評価するための異なる手法を分類し、評価手順を体系化する新しい手法を提案する。
その結果, 物理フィードバックによりホログラム変位による誤差を著しく低減できることがわかった。
ホログラムに対する視覚的フィードバックの欠如は、利用者の3D知覚に大きな影響を与えない。
論文 参考訳(メタデータ) (2023-11-03T13:41:44Z) - Gravity Network for end-to-end small lesion detection [50.38534263407915]
本稿では,医療画像の小さな病変を特異的に検出するワンステージエンド・ツー・エンド検出器を提案する。
小さな病変の正確な局在化は、その外観と、それらが見つかる様々な背景によって困難を呈する。
この新たなアーキテクチャをGravityNetと呼び、新しいアンカーを重力点と呼ぶ。
論文 参考訳(メタデータ) (2023-09-22T14:02:22Z) - Detecting the Sensing Area of A Laparoscopic Probe in Minimally Invasive
Cancer Surgery [6.0097646269887965]
外科腫瘍学では、外科医がリンパ節を同定し、がんを完全に切除することは困難である。
新しいテザリングラパロスコープガンマ検出器を用いて、術前に注入された放射線を局在させる。
ガンマ活動の可視化は、プローブが非イメージングであり、組織表面の活性を視覚的に示さないため、オペレーターに提示することが困難である。
論文 参考訳(メタデータ) (2023-07-07T15:33:49Z) - Next-generation Surgical Navigation: Marker-less Multi-view 6DoF Pose Estimation of Surgical Instruments [64.59698930334012]
静止カメラとヘッドマウントカメラを組み合わせたマルチカメラ・キャプチャー・セットアップを提案する。
第2に,手術用ウェットラボと実際の手術用劇場で撮影された元脊椎手術のマルチビューRGB-Dビデオデータセットを公表した。
第3に,手術器具の6DoFポーズ推定の課題に対して,最先端のシングルビューとマルチビューの3つの手法を評価した。
論文 参考訳(メタデータ) (2023-05-05T13:42:19Z) - A Temporal Learning Approach to Inpainting Endoscopic Specularities and
Its effect on Image Correspondence [13.25903945009516]
本稿では,時間的生成的対位ネットワーク(GAN)を用いて,隠蔽解剖学を特異性の下で描くことを提案する。
これは、胃内視鏡(Hyper-Kvasir)の生検データを用いて、完全に教師なしの方法で達成される。
また,3次元再構成とカメラモーション推定の基盤となるコンピュータビジョンタスクにおける本手法の有効性を評価する。
論文 参考訳(メタデータ) (2022-03-31T13:14:00Z) - Unsupervised deep learning techniques for powdery mildew recognition
based on multispectral imaging [63.62764375279861]
本稿では,キュウリ葉の粉状ミドウを自動的に認識する深層学習手法を提案する。
マルチスペクトルイメージングデータに適用した教師なし深層学習技術に焦点をあてる。
本稿では, オートエンコーダアーキテクチャを用いて, 疾患検出のための2つの手法を提案する。
論文 参考訳(メタデータ) (2021-12-20T13:29:13Z) - Searching for Efficient Architecture for Instrument Segmentation in
Robotic Surgery [58.63306322525082]
ほとんどのアプリケーションは、高解像度の外科画像の正確なリアルタイムセグメンテーションに依存している。
我々は,高解像度画像のリアルタイム推論を行うために調整された,軽量で高効率なディープ残差アーキテクチャを設計する。
論文 参考訳(メタデータ) (2020-07-08T21:38:29Z) - Real-Time Face and Landmark Localization for Eyeblink Detection [1.617280000789628]
顔と目印検出アルゴリズムを慎重に組み合わせて、完全に自動化された視線追跡を実現している。
実験により,1フレームあたり0.533ミリ秒の全体ランタイム応用が明らかになった。
これは、シーケンシャルな実装よりも高速で、1,101$times$である。
論文 参考訳(メタデータ) (2020-06-01T09:46:25Z) - Robust Medical Instrument Segmentation Challenge 2019 [56.148440125599905]
腹腔鏡装置の術中追跡は、しばしばコンピュータとロボットによる介入の必要条件である。
本研究の課題は,30の手術症例から取得した10,040枚の注釈画像からなる外科的データセットに基づいていた。
結果は、初期仮説、すなわち、アルゴリズムの性能がドメインギャップの増大とともに低下することを確認する。
論文 参考訳(メタデータ) (2020-03-23T14:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。