論文の概要: InfantFace: Detecting infant faces in neonatal clinical environments
- arxiv url: http://arxiv.org/abs/2606.20449v1
- Date: Thu, 18 Jun 2026 16:28:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.98649
- Title: InfantFace: Detecting infant faces in neonatal clinical environments
- Title(参考訳): InfantFace:新生児臨床環境における乳児の顔検出
- Authors: Abdullah Bin-Obaid, Maria M. Cobo, Rebeccah Slater, Lionel Tarassenko, Mauricio Villarroel,
- Abstract要約: 新生児臨床環境における幼児の顔検出に適した一段階型YOLOv11mモデルを提案する。
複数の公開データセット(VGGFace2、CelebA、FDDB、WIDER FACE)を組み合わせて、提案モデルのトレーニングと評価を行った。
我々のモデルはAP50の0.87を達成し、3つの最先端の汎用顔検出器の性能を上回った。
- 参考スコア(独自算出の注目度): 1.5484719004172118
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable localisation of the neonatal face is the first step for several video-camera based non-contact assessments such as pain and distress related facial expression analysis, pain scoring, cardiorespiratory signal extraction and cessation of breathing alerts. However, major challenges persist in neonatal clinical environments. Cluttered backgrounds, illumination changes and poor lighting conditions can reduce the accuracy of face detection models. Clinical interventions, monitoring equipment and, in some cases, medical devices can obstruct the face, making visual assessment difficult. We propose a one-stage YOLOv11m-based model tailored for face detection of infants in neonatal clinical environments. We combined multiple publicly available datasets (VGGFace2, CelebA, FDDB, WIDER FACE) to train and evaluate our proposed model. We then fine-tuned our model on a neonatal research dataset involving 228 videos from 114 recording sessions of 113 independent infants. Before fine-tuning, our model achieved an AP50 of 0.87, surpassing the performance of three state-of-the-art general face detectors. Performance improved further to an AP50 of 0.96 after clinical-domain adaptation. Evaluating face detection performance across different datasets remains a challenge due to the lack of publicly available neonatal datasets. Prioritising the creation of such datasets, while upholding appropriate privacy safeguards and ethical standards in their creation and use, would greatly support further progress in this field.
- Abstract(参考訳): 新生児顔面の信頼性の高い局所化は、痛みや苦痛に関連する表情分析、痛みのスコアリング、心呼吸信号抽出、呼吸警告の停止など、いくつかのビデオカメラによる非接触性評価のための第一歩である。
しかし、新生児臨床環境では大きな課題が続いている。
背景の乱れ、照明の変化、照明条件の悪さにより、顔検出モデルの精度が低下する。
臨床介入、監視装置、場合によっては医療機器が顔を妨げる可能性があり、視覚的評価を困難にしている。
新生児臨床環境における幼児の顔検出に適した一段階型YOLOv11mモデルを提案する。
複数の公開データセット(VGGFace2、CelebA、FDDB、WIDER FACE)を組み合わせて、提案モデルのトレーニングと評価を行った。
そして、113人の独立乳児の114回の録画セッションから228の動画を収録した新生児研究データセットでモデルを微調整した。
微調整前、我々のモデルはAP50の0.87を達成し、3つの最先端の汎用顔検出器の性能を上回った。
臨床領域適応後のAP50は0.96に改善した。
さまざまなデータセット間での顔検出性能の評価は、公開された新生児データセットが欠如しているため、依然として課題である。
このようなデータセットの作成を優先する一方で、適切なプライバシ保護とそれらの作成と使用における倫理基準を維持しながら、この分野におけるさらなる進歩を大いに支援する。
関連論文リスト
- Beyond Benchmarks of IUGC: Rethinking Requirements of Deep Learning Methods for Intrapartum Ultrasound Biometry from Fetal Ultrasound Videos [58.71502465551297]
MICCAI 2024と共同でIUGC(Intrapartum Ultrasound Grand Challenge)が打ち上げられた。
IUGCは、標準的な平面分類、胎児の頭頂部生理的セグメンテーション、バイオメトリーを統合した、臨床指向のマルチタスク自動測定フレームワークを導入している。
この課題は、これまでに3つの病院から収集された774のビデオ(68,106フレーム)を含む、最大規模のマルチセンターの超音波ビデオデータセットをリリースしている。
論文 参考訳(メタデータ) (2026-02-13T13:28:22Z) - Overcoming Small Data Limitations in Video-Based Infant Respiration Estimation [7.723650415926449]
400本のビデオ(AIR-400)の注釈付き乳児呼吸データセットを導入し,10名の採用被験者から275本の注釈付き動画を公開コーパスに投稿した。
乳児特異的領域検出と時間的ニューラル処理に基づく乳幼児呼吸推定のための最初の再現可能なパイプラインを開発した。
我々は、包括的実験を通じて、視覚に基づく幼児呼吸推定における最先端の再現可能な最初のベンチマークを確立する。
論文 参考訳(メタデータ) (2025-12-07T15:25:17Z) - OpticalDR: A Deep Optical Imaging Model for Privacy-Protective
Depression Recognition [66.91236298878383]
抑うつ認識(DR)は、特にプライバシー上の懸念の文脈において、大きな課題となる。
我々は,疾患関連特徴を保持しつつ,撮像した顔画像の識別情報を消去する新しいイメージングシステムを設計した。
正確なDRに必要な本態性疾患の特徴を保ちながら、アイデンティティ情報の回復には不可逆である。
論文 参考訳(メタデータ) (2024-02-29T01:20:29Z) - Neonatal Face and Facial Landmark Detection from Video Recordings [2.6091909702028584]
新生児の顔と顔のランドマークの自動検出について検討する。
これは、バイタルサイン推定、痛み評価、睡眠覚醒分類、黄斑検出など、多くのビデオベースの新生児健康アプリケーションにおいて重要な第一歩である。
論文 参考訳(メタデータ) (2023-02-08T21:18:18Z) - Private, fair and accurate: Training large-scale, privacy-preserving AI models in medical imaging [47.99192239793597]
我々は,AIモデルのプライバシ保護トレーニングが,非プライベートトレーニングと比較して精度と公平性に与える影響を評価した。
我々の研究は、実際の臨床データセットの困難な現実的な状況下では、診断深層学習モデルのプライバシー保護トレーニングは、優れた診断精度と公正さで可能であることを示しています。
論文 参考訳(メタデータ) (2023-02-03T09:49:13Z) - Towards early prediction of neurodevelopmental disorders: Computational
model for Face Touch and Self-adaptors in Infants [0.0]
乳児の運動を評価することは、発達障害の発症リスクを理解する鍵となる。
心理学における以前の研究は、赤ちゃんの顔の触覚などの特定の動きやジェスチャーを測定することは、赤ちゃんが自分自身とその文脈をどのように理解しているかを分析するのに不可欠であることを示した。
本研究は,乳幼児の動作やジェスチャーを追跡することによって,映像記録から顔の触覚を検出する,最初の自動アプローチを提案する。
論文 参考訳(メタデータ) (2023-01-07T18:08:43Z) - Intelligent Sight and Sound: A Chronic Cancer Pain Dataset [74.77784420691937]
本稿では,Intelligent Sight and Sound (ISS) 臨床試験の一環として収集された,最初の慢性ガン痛データセットを紹介する。
これまで収集されたデータは29の患者、509のスマートフォンビデオ、189,999のフレーム、そして自己報告された感情と活動の痛みのスコアから成っている。
静的画像とマルチモーダルデータを用いて、自己報告された痛みレベルを予測する。
論文 参考訳(メタデータ) (2022-04-07T22:14:37Z) - Robust Neonatal Face Detection in Real-world Clinical Settings [4.263900348596098]
現在の顔検出アルゴリズムは極めて一般化されており、成人の顔を検出する際に適切な精度を得ることができる。
臨床環境でラベル付き新生児顔を含むプロプライエタリなデータセット上で、最先端の顔検出モデルYou-Only-Look-Onceをトレーニングすることにより、ほぼリアルタイムな新生児顔検出を実現する。
予備的な所見は68.7%の精度を示し、外殻溶液は7.37%の精度で新生児の顔を検出した。
論文 参考訳(メタデータ) (2022-04-01T18:50:47Z) - Deep learning in the ultrasound evaluation of neonatal respiratory
status [11.308283140003676]
肺超音波検査は科学界から関心を集めている。
画像解析とパターン認識のアプローチは、これらのデータに含まれる豊富な情報を十分に活用できることを証明している。
本稿では、近年のディープラーニングネットワークと、大規模かつ挑戦的なマルチセンターデータセット上で実施されているトレーニング戦略について、徹底的に分析する。
論文 参考訳(メタデータ) (2020-10-31T18:57:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。