論文の概要: Challenges in Video-Based Infant Action Recognition: A Critical
Examination of the State of the Art
- arxiv url: http://arxiv.org/abs/2311.12300v1
- Date: Tue, 21 Nov 2023 02:36:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 02:19:31.592490
- Title: Challenges in Video-Based Infant Action Recognition: A Critical
Examination of the State of the Art
- Title(参考訳): 映像に基づく幼児の行動認識の課題 : 芸術的状態に対する批判的考察
- Authors: Elaheh Hatamimajoumerd, Pooria Daneshvar Kakhaki, Xiaofei Huang,
Lingfei Luan, Somaieh Amraee, Sarah Ostadabbas
- Abstract要約: InfActPrimitive’という,5つの重要な幼児マイルストーンアクションカテゴリを含む,画期的なデータセットを紹介します。
近縁骨格に基づく行動認識モデルを用いた広範囲な比較分析を行う。
以上の結果から,PoseC3Dモデルでは約71%の精度で高い精度を達成できたが,残りのモデルでは乳幼児行動の動態を正確に把握することが困難であった。
- 参考スコア(独自算出の注目度): 9.327466428403916
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automated human action recognition, a burgeoning field within computer
vision, boasts diverse applications spanning surveillance, security,
human-computer interaction, tele-health, and sports analysis. Precise action
recognition in infants serves a multitude of pivotal purposes, encompassing
safety monitoring, developmental milestone tracking, early intervention for
developmental delays, fostering parent-infant bonds, advancing computer-aided
diagnostics, and contributing to the scientific comprehension of child
development. This paper delves into the intricacies of infant action
recognition, a domain that has remained relatively uncharted despite the
accomplishments in adult action recognition. In this study, we introduce a
groundbreaking dataset called ``InfActPrimitive'', encompassing five
significant infant milestone action categories, and we incorporate specialized
preprocessing for infant data. We conducted an extensive comparative analysis
employing cutting-edge skeleton-based action recognition models using this
dataset. Our findings reveal that, although the PoseC3D model achieves the
highest accuracy at approximately 71%, the remaining models struggle to
accurately capture the dynamics of infant actions. This highlights a
substantial knowledge gap between infant and adult action recognition domains
and the urgent need for data-efficient pipeline models.
- Abstract(参考訳): コンピュータービジョンの急成長する分野である自動人間の行動認識は、監視、セキュリティ、人間とコンピュータのインタラクション、遠隔医療、スポーツ分析といった様々な応用を誇っている。
幼児における精密な行動認識は、安全監視、発達のマイルストーン追跡、発達遅延の早期介入、親子結合の育成、コンピュータ支援診断の進歩、子育ての科学的理解への貢献など、多くの重要な目的を果たす。
本論文は,成人の行動認識の達成にもかかわらず,比較的未獲得の領域である幼児行動認識の複雑さを考察する。
本研究では,5つの重要なマイルストーンアクションカテゴリを包含する‘infactprimitive’という画期的なデータセットを導入し,幼児データに特殊前処理を組み込む。
このデータセットを用いたエッジスケルトンに基づく行動認識モデルを用いて,広範な比較分析を行った。
以上の結果から,ponsoc3dモデルは約71%の精度で高い精度を発揮できたが,残りのモデルでは幼児の行動のダイナミクスを正確に捉えることが困難であった。
これは、幼児と成人の行動認識ドメイン間の知識ギャップと、データ効率のよいパイプラインモデルに対する緊急の必要性を強調している。
関連論文リスト
- ToddlerAct: A Toddler Action Recognition Dataset for Gross Motor Development Assessment [26.16139407666899]
ToddlerActは幼児の運動行動認識データセットである。
本稿では,データ収集プロセス,アノテーション方法論,データセットの特徴について述べる。
本研究は,幼児期における運動機能発達の正確性を評価するための領域特異的データセットの重要性を明らかにするものである。
論文 参考訳(メタデータ) (2024-08-31T04:31:46Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Modeling 3D Infant Kinetics Using Adaptive Graph Convolutional Networks [2.2279946664123664]
自発運動、運動学(orkinetics)は、今後の神経発達の強力なサロゲート指標を提供する。
そこで本研究では,個々の運動パターンのデータ駆動評価に基づいて,乳幼児の成熟を予測するための代替手法を提案する。
論文 参考訳(メタデータ) (2024-02-22T09:34:48Z) - Dynamic Gaussian Splatting from Markerless Motion Capture can
Reconstruct Infants Movements [2.44755919161855]
本研究は,多様な臨床集団に適用可能な高度な運動分析ツールの道を開くものである。
マーカーレスモーションキャプチャーデータに対する動的ガウススプラッティングの適用について検討した。
以上の結果から,この手法が乳幼児の情景を表現し,乳幼児の動きを追跡できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-10-30T11:09:39Z) - NeuroExplainer: Fine-Grained Attention Decoding to Uncover Cortical
Development Patterns of Preterm Infants [73.85768093666582]
我々はNeuroExplainerと呼ばれる説明可能な幾何学的深層ネットワークを提案する。
NeuroExplainerは、早産に伴う幼児の皮質発達パターンの解明に使用される。
論文 参考訳(メタデータ) (2023-01-01T12:48:12Z) - Language-Assisted Deep Learning for Autistic Behaviors Recognition [13.200025637384897]
本稿では,視覚に基づく問題行動認識システムにおいて,従来の手法よりも高い精度で性能を向上できることを示す。
問題行動の種類毎に「自由利用」言語記述を取り入れた2分岐マルチモーダルディープラーニングフレームワークを提案する。
実験結果から,言語指導を付加することで,自閉症の行動認識タスクに明らかなパフォーマンス向上がもたらされることが示された。
論文 参考訳(メタデータ) (2022-11-17T02:58:55Z) - Vision-Based Activity Recognition in Children with Autism-Related
Behaviors [15.915410623440874]
臨床医や親が子どもの行動を分析するのに役立つ地域型コンピュータビジョンシステムの効果を実証する。
データは、ビデオ中の対象の子供を検出し、背景雑音の影響を低減することで前処理される。
時間的畳み込みモデルの有効性から,ビデオフレームから動作特徴を抽出できる軽量モデルと従来モデルの両方を提案する。
論文 参考訳(メタデータ) (2022-08-08T15:12:27Z) - Overcoming the Domain Gap in Neural Action Representations [60.47807856873544]
3Dポーズデータは、手動で介入することなく、マルチビュービデオシーケンスから確実に抽出できる。
本稿では,ニューラルアクション表現の符号化を,ニューラルアクションと行動拡張のセットと共に導くために使用することを提案する。
ドメインギャップを減らすために、トレーニングの間、同様の行動をしているように見える動物間で神経と行動のデータを取り替える。
論文 参考訳(メタデータ) (2021-12-02T12:45:46Z) - Overcoming the Domain Gap in Contrastive Learning of Neural Action
Representations [60.47807856873544]
神経科学の基本的な目標は、神経活動と行動の関係を理解することである。
我々は,ハエが自然に生み出す行動からなる新しいマルチモーダルデータセットを作成した。
このデータセットと新しい拡張セットは、神経科学における自己教師あり学習手法の適用を加速することを約束します。
論文 参考訳(メタデータ) (2021-11-29T15:27:51Z) - Affect Analysis in-the-wild: Valence-Arousal, Expressions, Action Units
and a Unified Framework [83.21732533130846]
Aff-Wild と Aff-Wild2 の2つである。
これは、これらのデータベースで訓練された深層ニューラルネットワークの2つのクラスの設計を示す。
インパクト認識を共同で学び、効果的に一般化し、実行することができる新しいマルチタスクおよび全体主義のフレームワークが提示されます。
論文 参考訳(メタデータ) (2021-03-29T17:36:20Z) - A Developmental Neuro-Robotics Approach for Boosting the Recognition of
Handwritten Digits [91.3755431537592]
近年のエビデンスでは、子どもの体現戦略をシミュレーションすることで、マシンインテリジェンスも改善できることが示されている。
本稿では,発達神経ロボティクスの文脈における畳み込みニューラルネットワークモデルへの具体的戦略の適用について検討する。
論文 参考訳(メタデータ) (2020-03-23T14:55:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。