論文の概要: Neonatal Face and Facial Landmark Detection from Video Recordings
- arxiv url: http://arxiv.org/abs/2302.04341v1
- Date: Wed, 8 Feb 2023 21:18:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-10 17:23:13.781893
- Title: Neonatal Face and Facial Landmark Detection from Video Recordings
- Title(参考訳): ビデオ記録による新生児の顔と顔のランドマーク検出
- Authors: Ethan Grooby, Chiranjibi Sitaula, Soodeh Ahani, Liisa Holsti, Atul
Malhotra, Guy A. Dumont, Faezeh Marzbanrad
- Abstract要約: 新生児の顔と顔のランドマークの自動検出について検討する。
これは、バイタルサイン推定、痛み評価、睡眠覚醒分類、黄斑検出など、多くのビデオベースの新生児健康アプリケーションにおいて重要な第一歩である。
- 参考スコア(独自算出の注目度): 2.6091909702028584
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper explores automated face and facial landmark detection of neonates,
which is an important first step in many video-based neonatal health
applications, such as vital sign estimation, pain assessment, sleep-wake
classification, and jaundice detection. Utilising three publicly available
datasets of neonates in the clinical environment, 366 images (258 subjects) and
89 (66 subjects) were annotated for training and testing, respectively.
Transfer learning was applied to two YOLO-based models, with input training
images augmented with random horizontal flipping, photo-metric colour
distortion, translation and scaling during each training epoch. Additionally,
the re-orientation of input images and fusion of trained deep learning models
was explored. Our proposed model based on YOLOv7Face outperformed existing
methods with a mean average precision of 84.8% for face detection, and a
normalised mean error of 0.072 for facial landmark detection. Overall, this
will assist in the development of fully automated neonatal health assessment
algorithms.
- Abstract(参考訳): 本報告では,新生児の顔と顔の自動的目印検出について検討し,バイタルサイン推定,痛み評価,睡眠覚醒分類,黄砂検出など,多くのビデオベースの新生児健康アプリケーションにおいて重要な第一歩である。
臨床環境における新生児の3つのデータセットを用いて,366画像 (258名) と89 (66名) を訓練および試験用にアノテートした。
移動学習は2つのYOLOモデルに適用され, ランダム水平反転, 光度色歪み, 翻訳, スケーリングを付加した入力訓練画像が得られた。
さらに,入力画像の再配向と,訓練されたディープラーニングモデルの融合について検討した。
提案手法は,顔検出における平均精度84.8%,顔のランドマーク検出における平均誤差0.072で,既存手法よりも優れていた。
全体として、これは完全に自動化された新生児健康評価アルゴリズムの開発に役立つだろう。
関連論文リスト
- Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Towards early prediction of neurodevelopmental disorders: Computational
model for Face Touch and Self-adaptors in Infants [0.0]
乳児の運動を評価することは、発達障害の発症リスクを理解する鍵となる。
心理学における以前の研究は、赤ちゃんの顔の触覚などの特定の動きやジェスチャーを測定することは、赤ちゃんが自分自身とその文脈をどのように理解しているかを分析するのに不可欠であることを示した。
本研究は,乳幼児の動作やジェスチャーを追跡することによって,映像記録から顔の触覚を検出する,最初の自動アプローチを提案する。
論文 参考訳(メタデータ) (2023-01-07T18:08:43Z) - Neurodevelopmental Phenotype Prediction: A State-of-the-Art Deep
Learning Model [0.0]
我々は,新生児の皮質表面データを解析するためにディープニューラルネットワークを適用した。
我々の目標は、神経発達のバイオマーカーを特定し、これらのバイオマーカーに基づいて出生時の妊娠年齢を予測することである。
論文 参考訳(メタデータ) (2022-11-16T11:15:23Z) - Few-Shot Meta Learning for Recognizing Facial Phenotypes of Genetic
Disorders [55.41644538483948]
分類の自動化と類似性検索は、医師が可能な限り早期に遺伝状態の診断を行うための意思決定を支援する。
従来の研究は分類問題としてこの問題に対処し、深層学習法を用いてきた。
本研究では,健常人の大規模なコーパスで訓練した顔認識モデルを用いて,顔の表情認識に移行した。
論文 参考訳(メタデータ) (2022-10-23T11:52:57Z) - Robust Neonatal Face Detection in Real-world Clinical Settings [4.263900348596098]
現在の顔検出アルゴリズムは極めて一般化されており、成人の顔を検出する際に適切な精度を得ることができる。
臨床環境でラベル付き新生児顔を含むプロプライエタリなデータセット上で、最先端の顔検出モデルYou-Only-Look-Onceをトレーニングすることにより、ほぼリアルタイムな新生児顔検出を実現する。
予備的な所見は68.7%の精度を示し、外殻溶液は7.37%の精度で新生児の顔を検出した。
論文 参考訳(メタデータ) (2022-04-01T18:50:47Z) - FP-Age: Leveraging Face Parsing Attention for Facial Age Estimation in
the Wild [50.8865921538953]
年齢推定に顔のセマンティクスを明示的に組み込む手法を提案する。
我々は,顔解析に基づくネットワークを設計し,異なるスケールで意味情報を学習する。
提案手法は,既存の年齢推定手法を常に上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-21T14:31:32Z) - Wide & Deep neural network model for patch aggregation in CNN-based
prostate cancer detection systems [51.19354417900591]
前立腺癌(PCa)は、2020年に約141万件の新規感染者と約37万5000人の死者を出した男性の死因の1つである。
自動診断を行うには、まず前立腺組織サンプルをギガピクセル分解能全スライド画像にデジタイズする。
パッチと呼ばれる小さなサブイメージが抽出され、予測され、パッチレベルの分類が得られる。
論文 参考訳(メタデータ) (2021-05-20T18:13:58Z) - Deep learning in the ultrasound evaluation of neonatal respiratory
status [11.308283140003676]
肺超音波検査は科学界から関心を集めている。
画像解析とパターン認識のアプローチは、これらのデータに含まれる豊富な情報を十分に活用できることを証明している。
本稿では、近年のディープラーニングネットワークと、大規模かつ挑戦的なマルチセンターデータセット上で実施されているトレーニング戦略について、徹底的に分析する。
論文 参考訳(メタデータ) (2020-10-31T18:57:55Z) - Human Recognition Using Face in Computed Tomography [26.435782518817295]
本稿では、ROI抽出のための3次元顔のランドマークを最初に検出し、自動認識に使用する2次元深度画像を生成する自動処理パイプラインを提案する。
提案手法は,92.53%の1:56同定精度と96.12%の1:1検証精度を達成し,他の競合手法よりも優れていた。
論文 参考訳(メタデータ) (2020-05-28T18:59:59Z) - Y-Net for Chest X-Ray Preprocessing: Simultaneous Classification of
Geometry and Segmentation of Annotations [70.0118756144807]
この研究は、機械学習アルゴリズムに胸部X線入力のための一般的な前処理ステップを導入する。
VGG11エンコーダをベースとした改良Y-Netアーキテクチャを用いて,ラジオグラフィの幾何学的配向とセグメンテーションを同時に学習する。
対照画像の27.0%,34.9%に対し,95.8%,96.2%のアノテーションマスクが認められた。
論文 参考訳(メタデータ) (2020-05-08T02:16:17Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。