論文の概要: Towards Generalizable Human Activity Recognition: A Survey
- arxiv url: http://arxiv.org/abs/2508.12213v1
- Date: Sun, 17 Aug 2025 03:04:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.617334
- Title: Towards Generalizable Human Activity Recognition: A Survey
- Title(参考訳): 包括的人間活動認識を目指して : アンケート調査より
- Authors: Yize Cai, Baoshen Guo, Flora Salim, Zhiqing Hong,
- Abstract要約: IMUに基づくHuman Activity Recognition (HAR)は近年,学界と産業の双方から注目を集めている。
HARのパフォーマンスは特定のシナリオで大幅に改善されているが、その一般化機能は、現実世界で広く採用される上で重要な障壁であり続けている。
本稿では、IMUベースの一般化可能なHARの急速に発展する分野を探求し、229の論文と25の公開データセットをレビューする。
- 参考スコア(独自算出の注目度): 4.08377734173712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a critical component of Wearable AI, IMU-based Human Activity Recognition (HAR) has attracted increasing attention from both academia and industry in recent years. Although HAR performance has improved considerably in specific scenarios, its generalization capability remains a key barrier to widespread real-world adoption. For example, domain shifts caused by variations in users, sensor positions, or environments can significantly decrease the performance in practice. As a result, in this survey, we explore the rapidly evolving field of IMU-based generalizable HAR, reviewing 229 research papers alongside 25 publicly available datasets to provide a broad and insightful overview. We first present the background and overall framework of IMU-based HAR tasks, as well as the generalization-oriented training settings. Then, we categorize representative methodologies from two perspectives: (i) model-centric approaches, including pre-training method, end-to-end method, and large language model (LLM)-based learning method; and (ii) data-centric approaches, including multi-modal learning and data augmentation techniques. In addition, we summarize widely used datasets in this field, as well as relevant tools and benchmarks. Building on these methodological advances, the broad applicability of IMU-based HAR is also reviewed and discussed. Finally, we discuss persistent challenges (e.g., data scarcity, efficient training, and reliable evaluation) and also outline future directions for HAR, including the adoption of foundation and large language models, physics-informed and context-aware reasoning, generative modeling, and resource-efficient training and inference. The complete list of this survey is available at https://github.com/rh20624/Awesome-IMU-Sensing, which will be updated continuously.
- Abstract(参考訳): ウェアラブルAIの重要コンポーネントとして、IMUをベースとしたHuman Activity Recognition(HAR)は、近年、学術と産業の両方から注目を集めている。
HARのパフォーマンスは特定のシナリオで大幅に改善されているが、その一般化機能は、現実世界で広く採用される上で重要な障壁であり続けている。
例えば、ユーザやセンサ位置、環境の変化によって引き起こされるドメインシフトは、実際のパフォーマンスを著しく低下させる可能性がある。
その結果、IMUベースの一般化可能なHARの急速に発展する分野を探求し、229の論文と25の公開データセットをレビューし、広範かつ洞察に富んだ概要を提供する。
まず、IMUベースのHARタスクの背景および全体的なフレームワークと、一般化指向のトレーニング設定を示す。
次に、代表的な方法論を2つの観点から分類する。
(i)事前学習法、エンドツーエンド法、大規模言語モデル(LLM)に基づく学習法を含むモデル中心のアプローチ
(ii)マルチモーダル学習やデータ拡張技術を含むデータ中心のアプローチ。
さらに、この分野で広く使われているデータセットと、関連するツールやベンチマークをまとめた。
これらの方法論的進歩に基づき、IMUベースのHARの適用性についても概説し、議論した。
最後に、永続的な課題(データの不足、効率的なトレーニング、信頼性評価など)について議論するとともに、基礎言語モデルや大規模言語モデルの導入、物理情報や文脈を考慮した推論、生成モデリング、資源効率の高いトレーニングと推論など、HARの今後の方向性について概説する。
この調査の全リストはhttps://github.com/rh20624/Awesome-IMU-Sensingで公開されている。
関連論文リスト
- On-device Large Multi-modal Agent for Human Activity Recognition [1.9342524451932614]
HAR(Human Activity Recognition)は、医療からスマート環境に至るまで、研究の活発な領域である。
近年のLarge Language Models (LLMs) の進歩は、HARにおけるその能力を活用する新たな可能性を開いた。
本稿では,HARのための大規模マルチモーダルエージェントを提案する。
論文 参考訳(メタデータ) (2025-12-17T22:05:05Z) - Deepfake Detection that Generalizes Across Benchmarks [63.29485283822232]
この研究は、事前訓練されたCLIPビジョンエンコーダのパラメータ効率適応により、ロバストな一般化が達成可能であることを示す。
2019年から2025年にかけて,13のベンチマークデータセットについて広範な評価を行った。
提案手法は、平均的クロスデータセットAUROCにおける、より複雑な、最新のアプローチよりも優れた、最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-08-08T12:03:56Z) - Improving Out-of-distribution Human Activity Recognition via IMU-Video Cross-modal Representation Learning [3.177649348456073]
ウェアラブル慣性センサーに基づくヒューマンアクティビティ認識(HAR)は,遠隔健康モニタリングにおいて重要な役割を担っている。
我々は,大規模未ラベルIMUビデオデータから表現を学習するための,クロスモーダルな自己教師型事前学習手法を提案する。
以上の結果から,提案手法は現状のIMU-ビデオ事前訓練手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-07-17T18:47:46Z) - Towards Modality Generalization: A Benchmark and Prospective Analysis [68.20973671493203]
本稿では,モダリティ・ジェネリゼーション(MG)について述べる。
マルチモーダルアルゴリズムを特徴とする包括的ベンチマークを提案し,一般化に着目した既存手法を適用した。
私たちの研究は、堅牢で適応可能なマルチモーダルモデルを進化させる基盤を提供し、現実的なシナリオで目に見えないモダリティを扱えるようにします。
論文 参考訳(メタデータ) (2024-12-24T08:38:35Z) - Detecting Training Data of Large Language Models via Expectation Maximization [62.28028046993391]
本稿では,予測最大化アルゴリズムを用いて,メンバーシップスコアとプレフィックススコアを反復的に洗練する新しいメンバーシップ推論手法EM-MIAを紹介する。
EM-MIAはWikiMIAで最先端の結果を得る。
論文 参考訳(メタデータ) (2024-10-10T03:31:16Z) - A Controlled Study on Long Context Extension and Generalization in LLMs [85.4758128256142]
広義のテキスト理解とテキスト内学習は、完全な文書コンテキストを利用する言語モデルを必要とする。
長期コンテキストモデルを直接訓練する際の実装上の課題のため、長期コンテキストを扱うためにモデルを拡張する多くの方法が提案されている。
我々は,一貫したベースモデルと拡張データを利用して,標準化された評価による拡張メソッドの制御プロトコルを実装した。
論文 参考訳(メタデータ) (2024-09-18T17:53:17Z) - Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - Standardizing Your Training Process for Human Activity Recognition
Models: A Comprehensive Review in the Tunable Factors [4.199844472131922]
ウェアラブルヒューマンアクティビティ認識(WHAR)分野における現代ディープラーニング研究の総括的レビューを行う。
この結果から,モデルトレーニングプロトコルが提供する詳細が欠如していることが示唆された。
分析から得られた知見をもとに,WHARモデルに適合した新たな統合トレーニング手順を定義する。
論文 参考訳(メタデータ) (2024-01-10T17:45:28Z) - Temporal Action Localization for Inertial-based Human Activity Recognition [9.948823510429902]
ビデオベースのヒューマンアクティビティ認識(TAL)は、任意の長さのタイムラインでアクティビティセグメントをローカライズするセグメントベースの予測アプローチに従っている。
本論文は、オフラインとニアオンラインのHAR(Human Activity Recognition)における最先端のTALモデルの適用性を体系的に示す最初のものである。
時系列全体を解析することにより、TALモデルはよりコヒーレントなセグメントを生成し、全てのデータセットに対して高いNULLクラス精度を実現することができることを示す。
論文 参考訳(メタデータ) (2023-11-27T13:55:21Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Invariant Feature Learning for Sensor-based Human Activity Recognition [11.334750079923428]
被験者やデバイス間で共有される共通情報を抽出する不変特徴学習フレームワーク(IFLF)を提案する。
実験により、IFLFは、一般的なオープンデータセットと社内データセットをまたいだ主題とデバイスディバージョンの両方を扱うのに効果的であることが示された。
論文 参考訳(メタデータ) (2020-12-14T21:56:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。