論文の概要: Deep Inertial Pose: A deep learning approach for human pose estimation
- arxiv url: http://arxiv.org/abs/2506.06850v1
- Date: Sat, 07 Jun 2025 16:12:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.526819
- Title: Deep Inertial Pose: A deep learning approach for human pose estimation
- Title(参考訳): Deep Inertial Pose:人間のポーズ推定のためのディープラーニングアプローチ
- Authors: Sara M. Cerqueira, Manuel Palermo, Cristina P. Santos,
- Abstract要約: 最も効率的な方法は、Muntw Awindaデータを用いて第4次角度誤差7.96を達成したハイブリッドLSTM-Madgwickの分離である。
この研究は、ニューラルネットワークが人間のポーズを推定するために訓練できることを示し、その結果は最先端のフュージョンフィルタに匹敵する。
- 参考スコア(独自算出の注目度): 4.620800002256081
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Inertial-based Motion capture system has been attracting growing attention due to its wearability and unsconstrained use. However, accurate human joint estimation demands several complex and expertise demanding steps, which leads to expensive software such as the state-of-the-art MVN Awinda from Xsens Technologies. This work aims to study the use of Neural Networks to abstract the complex biomechanical models and analytical mathematics required for pose estimation. Thus, it presents a comparison of different Neural Network architectures and methodologies to understand how accurately these methods can estimate human pose, using both low cost(MPU9250) and high end (Mtw Awinda) Magnetic, Angular Rate, and Gravity (MARG) sensors. The most efficient method was the Hybrid LSTM-Madgwick detached, which achieved an Quaternion Angle distance error of 7.96, using Mtw Awinda data. Also, an ablation study was conducted to study the impact of data augmentation, output representation, window size, loss function and magnetometer data on the pose estimation error. This work indicates that Neural Networks can be trained to estimate human pose, with results comparable to the state-of-the-art fusion filters.
- Abstract(参考訳): 慣性ベースのモーションキャプチャシステムは、着用性や制約のない使用により、注目を集めている。
しかし、正確な人間の関節推定にはいくつかの複雑な専門知識が必要であり、これはXsens Technologiesの最先端MVN Awindaのような高価なソフトウェアに繋がる。
本研究の目的は、ポーズ推定に必要な複雑な生体力学モデルと解析数学を抽象化するためのニューラルネットワークの利用を研究することである。
このようにして、低コスト(MPU9250)とハイエンド(Mtw Awinda)磁気センサ、Angularレート、重力(MARG)センサーの両方を用いて、これらの手法がいかに正確に人間のポーズを推定できるかを理解するために、異なるニューラルネットワークアーキテクチャと手法の比較を示す。
最も効率的な方法は、Muntw Awindaデータを用いて第4次角度誤差7.96を達成したハイブリッドLSTM-Madgwickの分離である。
また,データ増大,出力表現,ウィンドウサイズ,損失関数,磁力計データの影響について検討した。
この研究は、ニューラルネットワークが人間のポーズを推定するために訓練できることを示し、その結果は最先端のフュージョンフィルタに匹敵する。
関連論文リスト
- Comparison of gait phase detection using traditional machine learning
and deep learning techniques [3.11526333124308]
本研究では,人間歩行のための低レベルEMGデータに基づく機械学習(ML)モデルを提案する。
その結果,従来のMLモデルでは75%,ディープラーニング(DL)モデルでは79%の精度が得られた。
論文 参考訳(メタデータ) (2024-03-07T10:05:09Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Layer-wise Linear Mode Connectivity [52.6945036534469]
ニューラルネットワークパラメータの平均化は、2つの独立したモデルの知識の直感的な方法である。
フェデレートラーニングにおいて最も顕著に用いられている。
私たちは、単一グループやグループを平均化するモデルの性能を分析します。
論文 参考訳(メタデータ) (2023-07-13T09:39:10Z) - Fast Exploration of the Impact of Precision Reduction on Spiking Neural
Networks [63.614519238823206]
ターゲットハードウェアがコンピューティングの端に達すると、スパイキングニューラルネットワーク(SNN)が実用的な選択となる。
我々は、近似誤差を伝播するそのようなモデルの能力を生かした探索手法を開発するために、インターヴァル算術(IA)モデルを用いる。
論文 参考訳(メタデータ) (2022-11-22T15:08:05Z) - Neural Moving Horizon Estimation for Robust Flight Control [6.023276947115864]
外乱の予測と反応は、四角形機の堅牢な飛行制御に不可欠である。
ニューラルネットワークによってモデル化されたMHEパラメータを自動的に調整できるニューロ移動地平線推定器(NeuroMHE)を提案する。
NeuroMHEは出力推定誤差を最大49.4%削減した最先端の推定器より優れている。
論文 参考訳(メタデータ) (2022-06-21T13:43:24Z) - Multi-fidelity Hierarchical Neural Processes [79.0284780825048]
多要素代理モデリングは、異なるシミュレーション出力を融合させることで計算コストを削減する。
本稿では,多階層型階層型ニューラルネットワーク(MF-HNP)を提案する。
疫学および気候モデリングタスクにおけるMF-HNPの評価を行い、精度と不確実性評価の観点から競合性能を達成した。
論文 参考訳(メタデータ) (2022-06-10T04:54:13Z) - Interfacing Finite Elements with Deep Neural Operators for Fast
Multiscale Modeling of Mechanics Problems [4.280301926296439]
本研究では,機械学習を用いたマルチスケールモデリングのアイデアを探求し,高コストソルバの効率的なサロゲートとしてニューラル演算子DeepONetを用いる。
DeepONetは、きめ細かい解法から取得したデータを使って、基礎とおそらく未知のスケールのダイナミクスを学習してオフラインでトレーニングされている。
精度とスピードアップを評価するための様々なベンチマークを提示し、特に時間依存問題に対する結合アルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-25T20:46:08Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z) - Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。
このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できる
このモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文 参考訳(メタデータ) (2020-03-13T13:11:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。