論文の概要: Towards Generalizable Human Activity Recognition: A Survey
- arxiv url: http://arxiv.org/abs/2508.12213v1
- Date: Sun, 17 Aug 2025 03:04:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.617334
- Title: Towards Generalizable Human Activity Recognition: A Survey
- Title(参考訳): 包括的人間活動認識を目指して : アンケート調査より
- Authors: Yize Cai, Baoshen Guo, Flora Salim, Zhiqing Hong,
- Abstract要約: IMUに基づくHuman Activity Recognition (HAR)は近年,学界と産業の双方から注目を集めている。
HARのパフォーマンスは特定のシナリオで大幅に改善されているが、その一般化機能は、現実世界で広く採用される上で重要な障壁であり続けている。
本稿では、IMUベースの一般化可能なHARの急速に発展する分野を探求し、229の論文と25の公開データセットをレビューする。
- 参考スコア(独自算出の注目度): 4.08377734173712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a critical component of Wearable AI, IMU-based Human Activity Recognition (HAR) has attracted increasing attention from both academia and industry in recent years. Although HAR performance has improved considerably in specific scenarios, its generalization capability remains a key barrier to widespread real-world adoption. For example, domain shifts caused by variations in users, sensor positions, or environments can significantly decrease the performance in practice. As a result, in this survey, we explore the rapidly evolving field of IMU-based generalizable HAR, reviewing 229 research papers alongside 25 publicly available datasets to provide a broad and insightful overview. We first present the background and overall framework of IMU-based HAR tasks, as well as the generalization-oriented training settings. Then, we categorize representative methodologies from two perspectives: (i) model-centric approaches, including pre-training method, end-to-end method, and large language model (LLM)-based learning method; and (ii) data-centric approaches, including multi-modal learning and data augmentation techniques. In addition, we summarize widely used datasets in this field, as well as relevant tools and benchmarks. Building on these methodological advances, the broad applicability of IMU-based HAR is also reviewed and discussed. Finally, we discuss persistent challenges (e.g., data scarcity, efficient training, and reliable evaluation) and also outline future directions for HAR, including the adoption of foundation and large language models, physics-informed and context-aware reasoning, generative modeling, and resource-efficient training and inference. The complete list of this survey is available at https://github.com/rh20624/Awesome-IMU-Sensing, which will be updated continuously.
- Abstract(参考訳): ウェアラブルAIの重要コンポーネントとして、IMUをベースとしたHuman Activity Recognition(HAR)は、近年、学術と産業の両方から注目を集めている。
HARのパフォーマンスは特定のシナリオで大幅に改善されているが、その一般化機能は、現実世界で広く採用される上で重要な障壁であり続けている。
例えば、ユーザやセンサ位置、環境の変化によって引き起こされるドメインシフトは、実際のパフォーマンスを著しく低下させる可能性がある。
その結果、IMUベースの一般化可能なHARの急速に発展する分野を探求し、229の論文と25の公開データセットをレビューし、広範かつ洞察に富んだ概要を提供する。
まず、IMUベースのHARタスクの背景および全体的なフレームワークと、一般化指向のトレーニング設定を示す。
次に、代表的な方法論を2つの観点から分類する。
(i)事前学習法、エンドツーエンド法、大規模言語モデル(LLM)に基づく学習法を含むモデル中心のアプローチ
(ii)マルチモーダル学習やデータ拡張技術を含むデータ中心のアプローチ。
さらに、この分野で広く使われているデータセットと、関連するツールやベンチマークをまとめた。
これらの方法論的進歩に基づき、IMUベースのHARの適用性についても概説し、議論した。
最後に、永続的な課題(データの不足、効率的なトレーニング、信頼性評価など)について議論するとともに、基礎言語モデルや大規模言語モデルの導入、物理情報や文脈を考慮した推論、生成モデリング、資源効率の高いトレーニングと推論など、HARの今後の方向性について概説する。
この調査の全リストはhttps://github.com/rh20624/Awesome-IMU-Sensingで公開されている。
関連論文リスト
- Deepfake Detection that Generalizes Across Benchmarks [63.29485283822232]
この研究は、事前訓練されたCLIPビジョンエンコーダのパラメータ効率適応により、ロバストな一般化が達成可能であることを示す。
2019年から2025年にかけて,13のベンチマークデータセットについて広範な評価を行った。
提案手法は、平均的クロスデータセットAUROCにおける、より複雑な、最新のアプローチよりも優れた、最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-08-08T12:03:56Z) - Improving Out-of-distribution Human Activity Recognition via IMU-Video Cross-modal Representation Learning [3.177649348456073]
ウェアラブル慣性センサーに基づくヒューマンアクティビティ認識(HAR)は,遠隔健康モニタリングにおいて重要な役割を担っている。
我々は,大規模未ラベルIMUビデオデータから表現を学習するための,クロスモーダルな自己教師型事前学習手法を提案する。
以上の結果から,提案手法は現状のIMU-ビデオ事前訓練手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-07-17T18:47:46Z) - Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - Standardizing Your Training Process for Human Activity Recognition
Models: A Comprehensive Review in the Tunable Factors [4.199844472131922]
ウェアラブルヒューマンアクティビティ認識(WHAR)分野における現代ディープラーニング研究の総括的レビューを行う。
この結果から,モデルトレーニングプロトコルが提供する詳細が欠如していることが示唆された。
分析から得られた知見をもとに,WHARモデルに適合した新たな統合トレーニング手順を定義する。
論文 参考訳(メタデータ) (2024-01-10T17:45:28Z) - Temporal Action Localization for Inertial-based Human Activity Recognition [9.948823510429902]
ビデオベースのヒューマンアクティビティ認識(TAL)は、任意の長さのタイムラインでアクティビティセグメントをローカライズするセグメントベースの予測アプローチに従っている。
本論文は、オフラインとニアオンラインのHAR(Human Activity Recognition)における最先端のTALモデルの適用性を体系的に示す最初のものである。
時系列全体を解析することにより、TALモデルはよりコヒーレントなセグメントを生成し、全てのデータセットに対して高いNULLクラス精度を実現することができることを示す。
論文 参考訳(メタデータ) (2023-11-27T13:55:21Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Invariant Feature Learning for Sensor-based Human Activity Recognition [11.334750079923428]
被験者やデバイス間で共有される共通情報を抽出する不変特徴学習フレームワーク(IFLF)を提案する。
実験により、IFLFは、一般的なオープンデータセットと社内データセットをまたいだ主題とデバイスディバージョンの両方を扱うのに効果的であることが示された。
論文 参考訳(メタデータ) (2020-12-14T21:56:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。