論文の概要: IMUOptimize: A Data-Driven Approach to Optimal IMU Placement for Human
Pose Estimation with Transformer Architecture
- arxiv url: http://arxiv.org/abs/2402.08923v2
- Date: Fri, 16 Feb 2024 22:06:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 00:40:18.043057
- Title: IMUOptimize: A Data-Driven Approach to Optimal IMU Placement for Human
Pose Estimation with Transformer Architecture
- Title(参考訳): IMUOptimize:トランスフォーマーアーキテクチャを用いた人文推定のための最適IMU配置のためのデータ駆動アプローチ
- Authors: Varun Ramani and Hossein Khayami and Yang Bai and Nakul Garg and
Nirupam Roy
- Abstract要約: 本稿では,DIP-IMU,IMUPoser,TransPoseといった従来の研究から逸脱したIMUデータを用いた人間のポーズ予測手法を提案する。
我々は、最適なIMU配置のためのデータ駆動戦略と時系列解析のためのトランスフォーマーベースのモデルアーキテクチャの2つの主要な革新を紹介した。
- 参考スコア(独自算出の注目度): 6.057930425739378
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel approach for predicting human poses using IMU
data, diverging from previous studies such as DIP-IMU, IMUPoser, and TransPose,
which use up to 6 IMUs in conjunction with bidirectional RNNs. We introduce two
main innovations: a data-driven strategy for optimal IMU placement and a
transformer-based model architecture for time series analysis. Our findings
indicate that our approach not only outperforms traditional 6 IMU-based biRNN
models but also that the transformer architecture significantly enhances pose
reconstruction from data obtained from 24 IMU locations, with equivalent
performance to biRNNs when using only 6 IMUs. The enhanced accuracy provided by
our optimally chosen locations, when coupled with the parallelizability and
performance of transformers, provides significant improvements to the field of
IMU-based pose estimation.
- Abstract(参考訳): 本稿では、DIP-IMU、IMUPoser、TransPoseといった従来の研究と異なり、双方向RNNと組み合わせて最大6個のIMUを用いて、人間のポーズを予測する新しいアプローチを提案する。
我々は、最適なIMU配置のためのデータ駆動戦略と時系列解析のためのトランスフォーマーベースのモデルアーキテクチャの2つの主要な革新を紹介した。
提案手法は従来の6 IMUベースのbiRNNモデルよりも優れているだけでなく、トランスフォーマーアーキテクチャは24 IMUロケーションから得られたデータからのポーズ再構成を著しく向上し、6 IMUのみを使用する場合のbiRNNに匹敵する性能を示した。
変換器の並列化性や性能と組み合わせることで,最適選択位置の精度が向上し,IMUに基づくポーズ推定の分野に大きな改善がもたらされた。
関連論文リスト
- POMONAG: Pareto-Optimal Many-Objective Neural Architecture Generator [4.09225917049674]
Transferable NASが登場し、データセット依存からタスク依存への探索プロセスを一般化した。
本稿では多目的拡散プロセスを通じて拡散NAGを拡張するPOMONAGを紹介する。
結果は、NAS201とMobileNetV3の2つの検索スペースで検証され、15の画像分類データセットで評価された。
論文 参考訳(メタデータ) (2024-09-30T16:05:29Z) - SDPose: Tokenized Pose Estimation via Circulation-Guide Self-Distillation [53.675725490807615]
SDPoseは小型変圧器モデルの性能向上のための新しい自己蒸留法である。
SDPose-Tは4.4Mパラメータと1.8 GFLOPを持つ69.7%のmAPを取得し、SDPose-S-V2はMSCOCO検証データセット上で73.5%のmAPを取得する。
論文 参考訳(メタデータ) (2024-04-04T15:23:14Z) - SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation [83.18930314027254]
表現的人間のポーズと形状推定(EHPS)は、身体、手、顔の動きを多数の応用で統合する。
本研究では,VT-Huge をバックボーンとする第1次一般基礎モデル (SMPLer-X) に向けた EHPS のスケールアップについて検討する。
ビッグデータと大規模モデルにより、SMPLer-Xは、さまざまなテストベンチマークにまたがる強力なパフォーマンスと、目に見えない環境への優れた転送性を示す。
論文 参考訳(メタデータ) (2023-09-29T17:58:06Z) - Enhancing Multi-Objective Optimization through Machine Learning-Supported Multiphysics Simulation [1.6685829157403116]
本稿では,訓練,自己最適化,自己組織的代理モデルのための方法論的枠組みを提案する。
シュロゲートモデルを比較的少量のデータで訓練し、基礎となるシミュレーションを正確に近似できることを示す。
論文 参考訳(メタデータ) (2023-09-22T20:52:50Z) - Bidirectional Looking with A Novel Double Exponential Moving Average to
Adaptive and Non-adaptive Momentum Optimizers [109.52244418498974]
我々は,新しいtextscAdmeta(textbfADouble指数textbfMov averagtextbfE textbfAdaptiveおよび非適応運動量)フレームワークを提案する。
我々は、textscAdmetaR と textscAdmetaS の2つの実装を提供し、前者は RAdam を、後者は SGDM をベースとしています。
論文 参考訳(メタデータ) (2023-07-02T18:16:06Z) - Full Stack Optimization of Transformer Inference: a Survey [58.55475772110702]
トランスフォーマーモデルは広範囲のアプリケーションにまたがって優れた精度を実現する。
最近のTransformerモデルの推測に必要な計算量と帯域幅は、かなり増加しています。
Transformerモデルをより効率的にすることに注力している。
論文 参考訳(メタデータ) (2023-02-27T18:18:13Z) - Rethinking IoU-based Optimization for Single-stage 3D Object Detection [103.83141677242871]
本稿では回転分離型IoU(RDIoU)法を提案する。
我々のRDIoUは、回転変数を独立項として分離することで、回帰パラメータの複雑な相互作用を単純化する。
論文 参考訳(メタデータ) (2022-07-19T15:35:23Z) - Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2022-07-04T16:35:58Z) - Dimensionality Expansion of Load Monitoring Time Series and Transfer
Learning for EMS [0.7133136338850781]
エネルギー管理システムは、アプライアンスを監視し管理するために(非)侵入負荷監視(N)ILMに依存している。
本稿では,時系列の次元展開と移動学習に基づくEMS構築における負荷監視手法を提案する。
論文 参考訳(メタデータ) (2022-04-06T13:13:24Z) - SIMDive: Approximate SIMD Soft Multiplier-Divider for FPGAs with Tunable
Accuracy [3.4154033825543055]
本稿では,新しい乗算器とチューナブルな分割器に基づくSIMDアーキテクチャを初めて提示する。
提案したハイブリッドアーキテクチャはMitchellのアルゴリズムを実装し、8ビットから32ビットの精度変数をサポートする。
論文 参考訳(メタデータ) (2020-11-02T17:40:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。