論文の概要: Supervised learning for improving the accuracy of robot-mounted 3D
camera applied to human gait analysis
- arxiv url: http://arxiv.org/abs/2207.01002v1
- Date: Sun, 3 Jul 2022 10:35:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 10:42:49.299909
- Title: Supervised learning for improving the accuracy of robot-mounted 3D
camera applied to human gait analysis
- Title(参考訳): 歩行解析に応用したロボット搭載3Dカメラの精度向上のための教師付き学習
- Authors: Diego Guffanti, Alberto Brunete, Miguel Hernando, David \'Alvarez,
Javier Rueda, Enrique Navarro
- Abstract要約: 歩行分析における3Dカメラの使用は、過去に実証された低い精度のため、非常に疑問視されている。
3Dカメラは、より長い歩行距離を得るために移動ロボットに搭載された。
本研究は,カメラの生推定を後処理することで,運動歩行信号と歩行記述子の検出の改善を示す。
- 参考スコア(独自算出の注目度): 0.31171750528972203
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The use of 3D cameras for gait analysis has been highly questioned due to the
low accuracy they have demonstrated in the past. The objective of the study
presented in this paper is to improve the accuracy of the estimations made by
robot-mounted 3D cameras in human gait analysis by applying a supervised
learning stage. The 3D camera was mounted in a mobile robot to obtain a longer
walking distance. This study shows an improvement in detection of kinematic
gait signals and gait descriptors by post-processing the raw estimations of the
camera using artificial neural networks trained with the data obtained from a
certified Vicon system. To achieve this, 37 healthy participants were recruited
and data of 207 gait sequences were collected using an Orbbec Astra 3D camera.
There are two basic possible approaches for training: using kinematic gait
signals and using gait descriptors. The former seeks to improve the waveforms
of kinematic gait signals by reducing the error and increasing the correlation
with respect to the Vicon system. The second is a more direct approach,
focusing on training the artificial neural networks using gait descriptors
directly. The accuracy of the 3D camera was measured before and after training.
In both training approaches, an improvement was observed. Kinematic gait
signals showed lower errors and higher correlations with respect to the ground
truth. The accuracy of the system to detect gait descriptors also showed a
substantial improvement, mostly for kinematic descriptors rather than
spatio-temporal. When comparing both training approaches, it was not possible
to define which was the absolute best. Therefore, we believe that the selection
of the training approach will depend on the purpose of the study to be
conducted. This study reveals the great potential of 3D cameras and encourages
the research community to continue exploring their use in gait analysis.
- Abstract(参考訳): 歩行分析における3Dカメラの使用は、過去に実証された低い精度のため、非常に疑問視されている。
本研究の目的は,ロボット搭載3Dカメラによる歩行解析における推定精度を,教師付き学習段階を適用して向上させることである。
3dカメラは、より長い歩行距離を得るために移動ロボットに搭載された。
本研究では,ビコンシステムから得られたデータを用いてトレーニングした人工ニューラルネットワークを用いて,カメラの生推定を後処理することにより,運動歩行信号と歩行記述子の検出の改善を示す。
これを実現するため,37名の健常者が採用され,orbbec astra 3dカメラを用いて207種類の歩行シーケンスのデータを収集した。
トレーニングには2つの基本的なアプローチがある。
前者は, 誤差を低減し, ビコン系との相関を増大させることにより, 運動歩行信号の波形改善を図る。
2つ目はより直接的なアプローチで、歩行記述子を使ってニューラルネットワークをトレーニングすることに焦点を当てている。
3dカメラの精度はトレーニング前後で測定した。
どちらの訓練アプローチも改善が見られた。
キネマティックな歩行信号は, 誤差が低く, 基礎的真理に対する相関が高かった。
歩行ディスクリプタを検出するシステムの精度も、時空間ではなく運動ディスクリプタに対して大幅に向上した。
両方のトレーニングアプローチを比較する場合、どちらが最善かを定義することはできませんでした。
したがって,学習アプローチの選択は,実施すべき研究の目的に左右されると信じている。
本研究は,3Dカメラの大きな可能性を明らかにし,歩行分析における使用の継続を研究コミュニティに奨励するものである。
関連論文リスト
- CameraHMR: Aligning People with Perspective [54.05758012879385]
モノクロ画像からの正確な3次元ポーズと形状推定の課題に対処する。
既存のトレーニングデータセットには、擬似基底真理(pGT)を持つ実画像が含まれている。
pGTの精度を向上させる2つの貢献をしている。
論文 参考訳(メタデータ) (2024-11-12T19:12:12Z) - Motion Degeneracy in Self-supervised Learning of Elevation Angle
Estimation for 2D Forward-Looking Sonar [4.683630397028384]
本研究は, 合成画像を用いた事前学習を行なわずに, 高度角推定の安定な自己教師付き学習を実現することを目的とする。
まず,主監督信号に関連する2次元前方ソナーの運動場を解析する。
論文 参考訳(メタデータ) (2023-07-30T08:06:11Z) - Towards Single Camera Human 3D-Kinematics [15.559206592078425]
深層ニューラルネットワークを用いたビデオから直接3次元人体動推定D3KEを提案する。
実験により,提案したエンドツーエンドトレーニングは頑健であり,2次元および3次元マーカーレスモーションキャプチャに基づく運動推定パイプラインよりも優れていた。
論文 参考訳(メタデータ) (2023-01-13T08:44:09Z) - An Empirical Study of Pseudo-Labeling for Image-based 3D Object
Detection [72.30883544352918]
異なる条件下で,擬似ラベルがベースラインモデルに対して効果的に監視できるかどうかを検討する。
ベルとホイッスルを使わずにKITTI-3Dテストセットの適度なレベルを20.23 APで達成し、ベースラインモデルを6.03 APで改善した。
この研究が、半教師付き環境下で画像に基づく3D検出コミュニティに洞察を与えてくれることを願っている。
論文 参考訳(メタデータ) (2022-08-15T12:17:46Z) - Neural Scene Representation for Locomotion on Structured Terrain [56.48607865960868]
本研究では,都市環境を横断する移動ロボットの局所的な地形を再構築する学習手法を提案する。
搭載されたカメラとロボットの軌道からの深度測定のストリームを用いて、ロボットの近傍の地形を推定する。
ノイズ測定とカメラ配置の盲点からの大量の欠落データにもかかわらず,シーンを忠実に再構築する3次元再構成モデルを提案する。
論文 参考訳(メタデータ) (2022-06-16T10:45:17Z) - Real-Time Human Pose Estimation on a Smart Walker using Convolutional
Neural Networks [4.076099054649463]
スマートウォーカのコンテキストにおける患者モニタリングとデータ駆動型ヒューマン・イン・ザ・ループ制御に対する新しいアプローチを提案する。
完全かつコンパクトなボディ表現を、リアルタイムおよび安価なセンサーから抽出することができる。
有望な結果にもかかわらず、現実のシナリオにおけるリハビリテーションツールとしてのパフォーマンスを評価するために、障害のあるユーザにより多くのデータを収集する必要がある。
論文 参考訳(メタデータ) (2021-06-28T14:11:48Z) - Learning the Update Operator for 2D/3D Image Registration [10.720342813316531]
術前ボリュームは2D/3D画像登録を用いて2D画像の上にオーバーレイすることができる。
深層学習に基づく2D/3D登録法は,計算効率とロバスト性を向上させることによって有望な結果を示した。
更新ステップ予測における登録精度は,既知演算子を持たない学習と比較して1.8倍向上した。
論文 参考訳(メタデータ) (2021-02-04T19:52:59Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z) - Lightweight 3D Human Pose Estimation Network Training Using
Teacher-Student Learning [15.321557614896268]
MoVNectは軽量なディープニューラルネットワークで、単一のRGBカメラを使用して3D人間のポーズをキャプチャする。
本研究では,教師の学習方法に基づく知識蒸留を3次元ポーズ推定に適用する。
モバイルで動作する3Dアバターアプリケーションをリアルタイムに実装し,ネットワークが高精度かつ高速な推論時間を実現することを示す。
論文 参考訳(メタデータ) (2020-01-15T01:31:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。