論文の概要: IMUPoser: Full-Body Pose Estimation using IMUs in Phones, Watches, and
Earbuds
- arxiv url: http://arxiv.org/abs/2304.12518v1
- Date: Tue, 25 Apr 2023 02:13:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 22:17:18.412216
- Title: IMUPoser: Full-Body Pose Estimation using IMUs in Phones, Watches, and
Earbuds
- Title(参考訳): IMUPoser:電話・時計・イヤホンにおけるIMUを用いたフルボディポーズ推定
- Authors: Vimal Mollyn, Riku Arakawa, Mayank Goel, Chris Harrison, Karan Ahuja
- Abstract要約: 我々は、多くのユーザーが所有しているデバイスで既にIMUを用いて身体のポーズを推定できる可能性を探る。
私たちのパイプラインは、利用可能なIMUデータのサブセットを受け取ります。
- 参考スコア(独自算出の注目度): 41.8359507387665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tracking body pose on-the-go could have powerful uses in fitness, mobile
gaming, context-aware virtual assistants, and rehabilitation. However, users
are unlikely to buy and wear special suits or sensor arrays to achieve this
end. Instead, in this work, we explore the feasibility of estimating body pose
using IMUs already in devices that many users own -- namely smartphones,
smartwatches, and earbuds. This approach has several challenges, including
noisy data from low-cost commodity IMUs, and the fact that the number of
instrumentation points on a users body is both sparse and in flux. Our pipeline
receives whatever subset of IMU data is available, potentially from just a
single device, and produces a best-guess pose. To evaluate our model, we
created the IMUPoser Dataset, collected from 10 participants wearing or holding
off-the-shelf consumer devices and across a variety of activity contexts. We
provide a comprehensive evaluation of our system, benchmarking it on both our
own and existing IMU datasets.
- Abstract(参考訳): 体の動きの追跡は、フィットネス、モバイルゲーム、コンテキスト対応バーチャルアシスタント、リハビリに強力な用途を持つ可能性がある。
しかし、ユーザーはこの目的を達成するために特別なスーツやセンサーアレイを装着する可能性は低い。
代わりに、多くのユーザーが所有しているスマートフォン、スマートウォッチ、イヤホンなどのデバイスで既にIMUを使って身体のポーズを推定できる可能性を探る。
このアプローチには、低価格のコモディティimusからのノイズデータや、ユーザ本体の計測点数がばらばらで流動的であることなど、いくつかの課題がある。
私たちのパイプラインは、利用可能なIMUデータのサブセットを受け取ります。
このモデルを評価するために、我々は、さまざまなアクティビティコンテキストにわたって、市販の消費者デバイスを装着または保持する10人の参加者から収集したimmposerデータセットを作成した。
IMUデータセットと既存のデータセットの両方でベンチマークを行い、システムの包括的な評価を行う。
関連論文リスト
- PRIMUS: Pretraining IMU Encoders with Multimodal Self-Supervision [7.896850422430362]
パーソナルデバイスに埋め込まれた慣性測定ユニット(IMU)は、健康と健康に大きな応用を可能にしている。
ラベル付きIMUデータは少ないが、ラベル付きまたは弱いラベル付きIMUデータを収集して人間の動きをモデル化することができる。
ビデオやテキストのモダリティに対して、"pretrain and adapt"アプローチでは、ラベル付きまたは弱いラベル付きデータを大量に使用して、事前トレーニングを行い、強力な特徴抽出器を構築し、その後、限定ラベル付きデータを使用して特定のタスクに適応する。
このアプローチはIMUドメインでは,(1)事前学習手法がIMUの文脈であまり理解されていないこと,の2つの理由から広く採用されていない。
論文 参考訳(メタデータ) (2024-11-22T18:46:30Z) - Suite-IN: Aggregating Motion Features from Apple Suite for Robust Inertial Navigation [10.634236058278722]
異なる身体部位のセンサーが捉えた動きデータには、局所的な動き情報とグローバルな動き情報の両方が含まれている。
慣性ナビゲーションのためのApple Suiteからの動作データを集約するマルチデバイスディープラーニングフレームワーク Suite-INを提案する。
論文 参考訳(メタデータ) (2024-11-12T14:23:52Z) - EMHI: A Multimodal Egocentric Human Motion Dataset with HMD and Body-Worn IMUs [17.864281586189392]
ウェアラブルセンサを用いた人間中心のポーズ推定(HPE)はVR/ARアプリケーションに不可欠である。
ほとんどの手法は、エゴセントリック・ビュー・イメージまたはスパース慣性測定ユニット(IMU)信号にのみ依存する。
マルチモーダルなtextbfEgocentric human textbfMotion データセットである textbfHead-Mounted Display (HMD) と body-worn textbfIMU を提案する。
論文 参考訳(メタデータ) (2024-08-30T10:12:13Z) - Masked Video and Body-worn IMU Autoencoder for Egocentric Action Recognition [24.217068565936117]
本稿では,身近なIMUの動作データをエゴセントリックなビデオと統合する行動認識手法を提案する。
体全体に配置された複数のIMUデバイスの複雑な関係をモデル化するために、複数のIMUデバイスにおける協調力学を利用する。
実験により,提案手法は複数の公開データセット上で最先端の性能を実現することができることが示された。
論文 参考訳(メタデータ) (2024-07-09T07:53:16Z) - AMEX: Android Multi-annotation Expo Dataset for Mobile GUI Agents [50.39555842254652]
我々は,モバイルシナリオにおけるAIエージェントの研究を進めるために,Android Multi-Annotation EXpo (AMEX)を紹介した。
AMEXは110のモバイルアプリケーションから104K以上の高解像度のスクリーンショットで構成されており、複数のレベルでアノテートされている。
AMEXには、GUIインタラクティブな要素接地、GUIスクリーンと要素機能記述、複雑な自然言語命令の3段階のアノテーションが含まれている。
論文 参考訳(メタデータ) (2024-07-03T17:59:58Z) - MobileAIBench: Benchmarking LLMs and LMMs for On-Device Use Cases [81.70591346986582]
モバイル端末上でのLarge Language Models(LLM)とLarge Multimodal Models(LMM)を評価するためのベンチマークフレームワークであるMobileAIBenchを紹介する。
MobileAIBenchは、さまざまなサイズ、量子化レベル、タスクにわたるモデルを評価し、実際のデバイス上でのレイテンシとリソース消費を測定する。
論文 参考訳(メタデータ) (2024-06-12T22:58:12Z) - 3D Human Pose Perception from Egocentric Stereo Videos [67.9563319914377]
我々は,エゴセントリックな立体3次元ポーズ推定を改善するためのトランスフォーマーベースの新しいフレームワークを提案する。
本手法は, しゃがんだり座ったりといった困難なシナリオにおいても, 人間のポーズを正確に推定することができる。
私たちはUnrealEgo2、UnrealEgo-RW、およびトレーニングされたモデルをプロジェクトページでリリースします。
論文 参考訳(メタデータ) (2023-12-30T21:21:54Z) - SparsePoser: Real-time Full-body Motion Reconstruction from Sparse Data [1.494051815405093]
SparsePoserは、スパースデータから全身のポーズを再構築するための、新しいディープラーニングベースのソリューションである。
このシステムには、高品質な連続した人間のポーズを合成する畳み込み型オートエンコーダが組み込まれている。
本手法は,IMUセンサや6-DoFトラッキングデバイスを用いた最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-03T18:48:01Z) - Transformer Inertial Poser: Attention-based Real-time Human Motion
Reconstruction from Sparse IMUs [79.72586714047199]
本研究では,6つのIMUセンサからリアルタイムに全体動作を再構築する,注意に基づく深層学習手法を提案する。
提案手法は, 実装が簡単で, 小型でありながら, 定量的かつ質的に新しい結果が得られる。
論文 参考訳(メタデータ) (2022-03-29T16:24:52Z) - SensiX: A Platform for Collaborative Machine Learning on the Edge [69.1412199244903]
センサデータとセンサモデルの間に留まるパーソナルエッジプラットフォームであるSensiXを紹介する。
動作および音声に基づくマルチデバイスセンシングシステムの開発において,その有効性を示す。
評価の結果,SensiXは3mWのオーバヘッドを犠牲にして,全体の精度が7~13%向上し,環境のダイナミクスが最大30%向上することがわかった。
論文 参考訳(メタデータ) (2020-12-04T23:06:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。