論文の概要: Evaluating the Performance of Deep Learning Models in Whole-body Dynamic 3D Posture Prediction During Load-reaching Activities
- arxiv url: http://arxiv.org/abs/2511.20615v1
- Date: Tue, 25 Nov 2025 18:40:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.622017
- Title: Evaluating the Performance of Deep Learning Models in Whole-body Dynamic 3D Posture Prediction During Load-reaching Activities
- Title(参考訳): 全体動的3次元姿勢予測における負荷保持時のディープラーニングモデルの性能評価
- Authors: Seyede Niloofar Hosseini, Ali Mojibi, Mahdi Mohseni, Navid Arjmand, Alireza Taheri,
- Abstract要約: 2つの時系列モデルは、双方向長短期メモリ(BLSTM)とトランスフォーマーアーキテクチャを用いて訓練された。
その結果, 新しいコスト関数により, アームモデルと脚モデルでそれぞれ約8%, 21%の予測誤差が減少した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This study aimed to explore the application of deep neural networks for whole-body human posture prediction during dynamic load-reaching activities. Two time-series models were trained using bidirectional long short-term memory (BLSTM) and transformer architectures. The dataset consisted of 3D full-body plug-in gait dynamic coordinates from 20 normal-weight healthy male individuals each performing 204 load-reaching tasks from different load positions while adapting various lifting and handling techniques. The model inputs consisted of the 3D position of the hand-load position, lifting (stoop, full-squat and semi-squat) and handling (one- and two-handed) techniques, body weight and height, and the 3D coordinate data of the body posture from the first 25% of the task duration. These inputs were used by the models to predict body coordinates during the remaining 75% of the task period. Moreover, a novel method was proposed to improve the accuracy of the previous and present posture prediction networks by enforcing constant body segment lengths through the optimization of a new cost function. The results indicated that the new cost function decreased the prediction error of the models by approximately 8% and 21% for the arm and leg models, respectively. We indicated that utilizing the transformer architecture, with a root-mean-square-error of 47.0 mm, exhibited ~58% more accurate long-term performance than the BLSTM-based model. This study merits the use of neural networks that capture time series dependencies in 3D motion frames, providing a unique approach for understanding and predict motion dynamics during manual material handling activities.
- Abstract(参考訳): 本研究は,動的負荷緩和活動における人体姿勢予測へのディープニューラルネットワークの適用について検討することを目的とした。
2つの時系列モデルは、双方向長短期メモリ(BLSTM)とトランスフォーマーアーキテクチャを用いて訓練された。
このデータセットは、正常な健常男性20名の3次元プラグイン歩行動態座標からなり、それぞれ異なる負荷位置から204の負荷軽減タスクを実行し、様々なリフトとハンドリング技術を適用した。
モデル入力は, ハンドロード位置の3D位置, リフト(ストゥープ, フルスクワット, セミスクワット)およびハンドリング(片手, 片手)技術, 体重と身長, 作業時間の25%から体姿勢の3D座標データから構成した。
これらの入力は、タスク期間の残りの75%の間、身体の座標を予測するためにモデルによって使用された。
また,新しいコスト関数の最適化により,一定部分の長さを一定にすることで,前と現在の姿勢予測ネットワークの精度を向上させる手法が提案された。
その結果, 新しいコスト関数により, アームモデルと脚モデルでそれぞれ約8%, 21%の予測誤差が減少した。
BLSTMモデルより58%ほど精度が向上し, ルート平均2乗誤差が47.0mmであるトランスフォーマーアーキテクチャが有効であることが示唆された。
本研究は,3次元運動フレームにおける時系列依存性を捉えるニューラルネットワークの利用に有用であり,手動材料ハンドリング活動における運動力学の理解と予測にユニークなアプローチを提供する。
関連論文リスト
- PriorFormer: A Transformer for Real-time Monocular 3D Human Pose Estimation with Versatile Geometric Priors [1.4932318540666545]
本稿では,人間の2次元関節位置の短い列を1台のカメラで3次元ポーズにマッピングする軽量トランスフォーマーベースリフト機を提案する。
提案モデルでは,セグメント長やカメラ内在性などの入力幾何学的先行を考慮し,キャリブレーションとアンキャリブレーションの両方で動作させるように設計されている。
論文 参考訳(メタデータ) (2025-08-21T08:16:14Z) - Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation [32.30055363306321]
本研究では、異なる人間のポーズや形状に関連したタスクやデータセットをシームレスに統一するパラダイムを提案する。
我々の定式化は、人間の容積の任意の点を問合せし、推定位置を3Dで取得することに集中している。
論文 参考訳(メタデータ) (2024-07-10T10:44:18Z) - Unsupervised 3D Pose Estimation with Non-Rigid Structure-from-Motion
Modeling [83.76377808476039]
本研究では,人間のポーズの変形をモデル化し,それに伴う拡散に基づく動きを事前に設計する手法を提案する。
動作中の3次元人間の骨格を復元する作業は3次元基準骨格の推定に分割する。
混合時空間NASfMformerを用いて、各フレームの3次元基準骨格と骨格変形を2次元観測シーケンスから同時に推定する。
論文 参考訳(メタデータ) (2023-08-18T16:41:57Z) - EVOPOSE: A Recursive Transformer For 3D Human Pose Estimation With
Kinematic Structure Priors [72.33767389878473]
本研究では,3次元ポーズ推定を効果的に行うために,トランスフォーマーを用いたモデルEvoPoseを提案する。
構造的優先表現(Structure Priors Representation, SPR)モジュールは、人体パターンの豊富な構造的特徴として、人間の先行を表現している。
推定結果を利用して3Dポーズ出力にRecursive Refinement(RR)モジュールを印加し、同時に人間を注入する。
論文 参考訳(メタデータ) (2023-06-16T04:09:16Z) - Robust Category-Level 3D Pose Estimation from Synthetic Data [17.247607850702558]
CADモデルから生成されたオブジェクトポーズ推定のための新しい合成データセットであるSyntheticP3Dを紹介する。
逆レンダリングによるポーズ推定を行うニューラルネットワークモデルをトレーニングするための新しいアプローチ(CC3D)を提案する。
論文 参考訳(メタデータ) (2023-05-25T14:56:03Z) - Multiscale Spatio-Temporal Graph Neural Networks for 3D Skeleton-Based
Motion Prediction [92.16318571149553]
本稿では,次世代の3次元骨格型人間のポーズを予測するため,マルチスケール・テンポラルグラフニューラルネットワーク(MST-GNN)を提案する。
MST-GNNは、短期および長期の動作予測において最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-08-25T14:05:37Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - LiftFormer: 3D Human Pose Estimation using attention models [0.0]
本稿では,映像中の人間のポーズの順序付けに注意機構を活用することで,より正確な3次元予測を実現するためのモデルを提案する。
本手法は,Human3.6Mにおける2次元キーポイント予測器の0.3 mm (44.8 MPJPE, 0.7%改善) と2mm (MPJPE: 31.9, 8.4%改善) の2次元真理入力の双方を用いた場合,文献の先行結果よりも一貫して優れていた。
我々の3Dリフトモデルの精度は、他のエンドツーエンドまたはSMPLアプローチよりも高く、多くのマルチビュー手法に匹敵する。
論文 参考訳(メタデータ) (2020-09-01T11:05:45Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z) - Anatomy-aware 3D Human Pose Estimation with Bone-based Pose
Decomposition [92.99291528676021]
3次元関節位置を直接回帰するのではなく,骨方向予測と骨長予測に分解する。
私たちのモチベーションは、人間の骨格の骨の長さが時間とともに一定であることにあります。
我々の完全なモデルは、Human3.6MとMPI-INF-3DHPデータセットにおいて、以前の最高の結果よりも優れています。
論文 参考訳(メタデータ) (2020-02-24T15:49:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。