論文の概要: Semi-supervised Body Parsing and Pose Estimation for Enhancing Infant
General Movement Assessment
- arxiv url: http://arxiv.org/abs/2210.08054v1
- Date: Fri, 14 Oct 2022 18:46:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 18:51:57.486307
- Title: Semi-supervised Body Parsing and Pose Estimation for Enhancing Infant
General Movement Assessment
- Title(参考訳): 幼児運動評価のための半教師付きボディパーシングと姿勢推定
- Authors: Haomiao Ni, Yuan Xue, Liya Ma, Qian Zhang, Xiaoye Li, Xiaolei Huang
- Abstract要約: 乳児運動ビデオ(IMV)の一般運動評価(GMA)は、乳幼児の脳性麻痺(CP)の早期発見に有効な方法である。
本稿では、画像シーケンス認識のためのエンドツーエンドのトレーニング可能なニューラルネットワークが、GMAの優れた結果を得るために適用可能であることを実証する。
本研究では,SiamParseNet(SPN)と呼ばれる半教師付きモデルを提案する。
- 参考スコア(独自算出の注目度): 11.33138866472943
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: General movement assessment (GMA) of infant movement videos (IMVs) is an
effective method for early detection of cerebral palsy (CP) in infants. We
demonstrate in this paper that end-to-end trainable neural networks for image
sequence recognition can be applied to achieve good results in GMA, and more
importantly, augmenting raw video with infant body parsing and pose estimation
information can significantly improve performance. To solve the problem of
efficiently utilizing partially labeled IMVs for body parsing, we propose a
semi-supervised model, termed SiamParseNet (SPN), which consists of two
branches, one for intra-frame body parts segmentation and another for
inter-frame label propagation. During training, the two branches are jointly
trained by alternating between using input pairs of only labeled frames and
input of both labeled and unlabeled frames. We also investigate training data
augmentation by proposing a factorized video generative adversarial network
(FVGAN) to synthesize novel labeled frames for training. When testing, we
employ a multi-source inference mechanism, where the final result for a test
frame is either obtained via the segmentation branch or via propagation from a
nearby key frame. We conduct extensive experiments for body parsing using SPN
on two infant movement video datasets, where SPN coupled with FVGAN achieves
state-of-the-art performance. We further demonstrate that SPN can be easily
adapted to the infant pose estimation task with superior performance. Last but
not least, we explore the clinical application of our method for GMA. We
collected a new clinical IMV dataset with GMA annotations, and our experiments
show that SPN models for body parsing and pose estimation trained on the first
two datasets generalize well to the new clinical dataset and their results can
significantly boost the CRNN-based GMA prediction performance.
- Abstract(参考訳): 乳児運動ビデオ(IMV)の一般運動評価(GMA)は、乳幼児の脳性麻痺(CP)の早期発見に有効な方法である。
本稿では、画像シーケンス認識のためのエンドツーエンドのトレーニング可能なニューラルネットワークを応用して、GMAの優れた結果が得られることを実証し、さらに、幼児の身体解析とポーズ推定情報による生動画の増強により、パフォーマンスが著しく向上することを示した。
半教師付きモデル siamparsenet (spn) を,フレーム内ボディ部分のセグメンテーションとフレーム間ラベル伝搬の2つの枝からなる半教師付きモデルとして提案する。
トレーニング中、2つのブランチは、ラベル付きフレームのみの入力ペアとラベル付きフレームとラベルなしフレームの両方の入力との交互にトレーニングされる。
また、FVGAN(Factized Video Generative Adversarial Network)を用いて、新しいラベル付きフレームを合成し、トレーニングデータの強化も検討した。
テストでは、マルチソース推論機構を採用し、テストフレームの最終結果がセグメンテーションブランチまたは近くのキーフレームからの伝搬を介して取得されます。
本研究では,SPNとFVGANを併用した2つの幼児運動ビデオデータセット上で,SPNを用いた身体解析実験を行った。
さらに,SPNは幼児のポーズ推定作業に容易に適応できることを示す。
最後に,GMA法の臨床応用について検討する。
我々はGMAアノテーションを用いた新しい臨床IMVデータセットを収集し、最初の2つのデータセットで訓練された身体解析とポーズ推定のためのSPNモデルが新しい臨床データセットによく適合し、その結果がCRNNベースのGMA予測性能を大幅に向上することを示した。
関連論文リスト
- Intrapartum Ultrasound Image Segmentation of Pubic Symphysis and Fetal Head Using Dual Student-Teacher Framework with CNN-ViT Collaborative Learning [1.5233179662962222]
pubic symphysis and fetal head (PSFH) の分節は、労働の進行をモニターし、潜在的に引き起こされる合併症を特定するための重要なステップである。
従来の半教師付き学習アプローチは、主に畳み込みニューラルネットワーク(CNN)に基づく統合ネットワークモデルを利用する。
CNN と Transformer を組み合わせた新しいフレームワークである Dual-Student and Teacher Combining CNN (DSTCT) を導入する。
論文 参考訳(メタデータ) (2024-09-11T00:57:31Z) - Measuring proximity to standard planes during fetal brain ultrasound scanning [8.328549443700858]
本稿では,超音波(US)平面を臨床利用に近づけるための新しいパイプラインを提案する。
ラベル付きSPとラベルなしUSボリュームスライスの両方を利用した半教師付きセグメンテーションモデルを提案する。
本モデルでは, 胎児の脳画像に対して, 信頼性の高いセグメンテーションを可能にする。
論文 参考訳(メタデータ) (2024-04-10T16:04:21Z) - Predicting Infant Brain Connectivity with Federated Multi-Trajectory
GNNs using Scarce Data [54.55126643084341]
既存のディープラーニングソリューションには,3つの大きな制限がある。
我々はフェデレートグラフベースの多軌道進化ネットワークであるFedGmTE-Net++を紹介する。
フェデレーションの力を利用して、限られたデータセットを持つ多種多様な病院の地域学習を集約する。
論文 参考訳(メタデータ) (2024-01-01T10:20:01Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z) - Unsupervised Domain Adaptation Learning for Hierarchical Infant Pose
Recognition with Synthetic Data [28.729049747477085]
幼児の画像を入力とし、粗いポーズラベルと細かなポーズラベルを予測するCNNベースのモデルを提案する。
実験の結果,提案手法は,合成および実世界のデータセットの分布を著しく整合させることができることがわかった。
論文 参考訳(メタデータ) (2022-05-04T04:59:26Z) - Joint-bone Fusion Graph Convolutional Network for Semi-supervised
Skeleton Action Recognition [65.78703941973183]
本稿では,CD-JBF-GCNをエンコーダとし,ポーズ予測ヘッドをデコーダとして使用する新しい相関駆動型ジョイントボーン・フュージョングラフ畳み込みネットワークを提案する。
具体的には、CD-JBF-GCは、関節ストリームと骨ストリームの間の運動伝達を探索することができる。
自己教師型トレーニング段階におけるポーズ予測に基づくオートエンコーダにより、未ラベルデータから動作表現を学習することができる。
論文 参考訳(メタデータ) (2022-02-08T16:03:15Z) - Cascaded Robust Learning at Imperfect Labels for Chest X-ray
Segmentation [61.09321488002978]
不完全アノテーションを用いた胸部X線分割のための新しいカスケードロバスト学習フレームワークを提案する。
モデルは3つの独立したネットワークから成り,ピアネットワークから有用な情報を効果的に学習できる。
提案手法は,従来の手法と比較して,セグメント化タスクの精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-04-05T15:50:16Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z) - Brain Stroke Lesion Segmentation Using Consistent Perception Generative
Adversarial Network [22.444373004248217]
半教師型脳卒中病変分類において, CPGAN(Consistent Perception Generative Adversarial Network)を提案する。
類似接続モジュール (SCM) は、マルチスケール機能の情報をキャプチャするように設計されている。
識別者が有意義な特徴表現を学習するように促すために、補助ネットワークを構築する。
論文 参考訳(メタデータ) (2020-08-30T07:42:47Z) - SiamParseNet: Joint Body Parsing and Label Propagation in Infant
Movement Videos [12.99371655893686]
乳児運動ビデオ(IMV)の一般運動評価(GMA)は、乳幼児の脳性麻痺(CP)の早期発見に有効な方法である。
半教師付きボディパーシングモデルSiamParseNet(SPN)を提案する。
論文 参考訳(メタデータ) (2020-07-16T21:14:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。