論文の概要: BenchHAR: Benchmarking Self-Supervised Learning for Generalizable Sensor-based Activity Recognition
- arxiv url: http://arxiv.org/abs/2605.08296v1
- Date: Fri, 08 May 2026 10:54:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.543312
- Title: BenchHAR: Benchmarking Self-Supervised Learning for Generalizable Sensor-based Activity Recognition
- Title(参考訳): BenchHAR: 一般化可能なセンサによる行動認識のための自己監督学習のベンチマーク
- Authors: Yize Cai, Rui Feng, Anlan Yu, Baoshen Guo, Zhiqing Hong,
- Abstract要約: ウェアラブルセンサーからのヒューマンアクティビティ認識(HAR)は、幅広い医療や行動科学の応用をサポートする。
視覚領域と言語領域における自己教師あり学習(SSL)の最近の進歩は、ラベルなしデータから一般化可能な表現を学習する強力な能力を示している。
センサベースHARにおけるSSL手法の一般化能力を評価するための統合フレームワークであるBenchHARについて述べる。
- 参考スコア(独自算出の注目度): 20.30670002928755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human Activity Recognition (HAR) from wearable sensors supports broad healthcare and behavior science applications. However, data heterogeneity and the scarcity of labeled data limit its real-world generalization. Recent advances in self-supervised learning (SSL) in vision and language domains have shown strong capability for learning generalizable representations from unlabeled data. Yet, few studies have systematically compared the generalization performance of SSL methods or explored how to adapt them for generalizable HAR. To address these gaps, we present BenchHAR, a unified framework for evaluating the generalization capability of SSL methods for sensor-based HAR on unseen target distributions. BenchHAR curates a large-scale dataset (~258K samples) and evaluates eight representative SSL methods across 12 encoder-classifier architectures. Our results reveal that existing SSL methods struggle to achieve satisfactory generalization performance. We find that: (1) For HAR models, the hybrid paradigm (combining reconstruction and contrastive pretraining) achieves the best overall performance. The CNN encoder exhibits the strongest ability to learn generalizable representations, while more expressive classifier architectures further improve generalization. (2) For data scale, increasing the amount of pretraining data from downstream activity classes consistently improves generalization, while adding more labeled data yields limited gains. Interestingly, incorporating unlabeled data from non-downstream activity classes does not improve generalization. (3) Sensor data collected from custom-grade devices generalizes better than that from research-grade devices, and data from limb transfers more effectively to trunk positions. BenchHAR provides a unified benchmark and actionable insights for generalizable sensor-based HAR systems. Our code is available at https://github.com/saiketa/HAR-Bench.
- Abstract(参考訳): ウェアラブルセンサーからのヒューマンアクティビティ認識(HAR)は、幅広い医療や行動科学の応用をサポートする。
しかし、データの不均一性とラベル付きデータの不足は、実世界の一般化を制限する。
視覚領域と言語領域における自己教師あり学習(SSL)の最近の進歩は、ラベルなしデータから一般化可能な表現を学習する強力な能力を示している。
しかし、SSLメソッドの一般化性能を体系的に比較したり、一般化可能なHARに適応する方法を探ったりした研究はほとんどない。
このようなギャップに対処するため,センサベースHARにおけるSSL手法の一般化能力を評価する統合フレームワークであるBenchHARを提案する。
BenchHARは大規模なデータセット(約258Kサンプル)をキュレートし、12のエンコーダ分類アーキテクチャにまたがる8つの代表的なSSLメソッドを評価する。
以上の結果から,既存のSSLメソッドは,良好な一般化性能を達成するのに苦慮していることが明らかとなった。
1)HARモデルでは、ハイブリッドパラダイム(再構成とコントラスト事前学習を組み合わせた)が全体的な性能を最高のものにする。
CNNエンコーダは、一般化可能な表現を学習する最も強力な能力を示し、より表現力のある分類器アーキテクチャは一般化をさらに改善する。
2)データスケールでは,下流のアクティビティクラスからの事前学習データの増加が常に一般化を向上する一方で,ラベル付きデータの追加は限られたゲインを得る。
興味深いことに、ダウンストリームでないアクティビティクラスからラベルなしのデータを取り込むことで、一般化は改善されない。
3) カスタムグレードデバイスから収集したセンサデータは,研究グレードデバイスより優れており,手足からのデータをトランク位置へ効率よく転送する。
BenchHARは、一般化可能なセンサーベースのHARシステムに対して、統一されたベンチマークと実行可能な洞察を提供する。
私たちのコードはhttps://github.com/saiketa/HAR-Bench.comで公開されています。
関連論文リスト
- RAG-HAR: Retrieval Augmented Generation-based Human Activity Recognition [5.089700375729287]
大規模言語モデル(LLMs)を利用したHAR(Human Activity Recognition)のためのトレーニング不要検索拡張フレームワークであるRAG-HARを紹介する。
RAG-HARは軽量な統計記述子を計算し、ベクトルデータベースから意味論的に類似したサンプルを検索し、この文脈的エビデンスを用いてLCMに基づく行動識別を行う。
論文 参考訳(メタデータ) (2025-12-06T01:53:02Z) - Deepfake Detection that Generalizes Across Benchmarks [48.85953407706351]
ディープフェイク検出器の非表示操作技術への一般化は、実用的展開の課題である。
この研究は、基礎となる事前学習された視覚エンコーダのパラメータ効率適応により、ロバストな一般化が達成可能であることを示す。
提案手法は、平均的クロスデータセットAUROCにおける、より複雑な、最新のアプローチよりも優れた、最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-08-08T12:03:56Z) - Prospector Heads: Generalized Feature Attribution for Large Models & Data [82.02696069543454]
本稿では,説明に基づく帰属手法の効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - SEER-ZSL: Semantic Encoder-Enhanced Representations for Generalized Zero-Shot Learning [0.6792605600335813]
Zero-Shot Learning (ZSL)は、トレーニング中に見えないカテゴリを特定するという課題を示す。
ゼロショット学習のためのセマンティック強化表現(SEER-ZSL)を提案する。
まず,確率的エンコーダを用いて意味のある意味情報を抽出し,意味的一貫性とロバスト性を高めることを目的とする。
第2に、学習したデータ分布を逆向きに訓練した発電機で利用することにより、視覚空間を蒸留し、第3に、未確認なカテゴリを真のデータ多様体にマッピングできるようにする。
論文 参考訳(メタデータ) (2023-12-20T15:18:51Z) - Temporal Action Localization for Inertial-based Human Activity Recognition [9.948823510429902]
ビデオベースのヒューマンアクティビティ認識(TAL)は、任意の長さのタイムラインでアクティビティセグメントをローカライズするセグメントベースの予測アプローチに従っている。
本論文は、オフラインとニアオンラインのHAR(Human Activity Recognition)における最先端のTALモデルの適用性を体系的に示す最初のものである。
時系列全体を解析することにより、TALモデルはよりコヒーレントなセグメントを生成し、全てのデータセットに対して高いNULLクラス精度を実現することができることを示す。
論文 参考訳(メタデータ) (2023-11-27T13:55:21Z) - Self-Supervised Class Incremental Learning [51.62542103481908]
既存のクラスインクリメンタルラーニング(CIL)手法は、データラベルに敏感な教師付き分類フレームワークに基づいている。
新しいクラスデータに基づいて更新する場合、それらは破滅的な忘れがちである。
本稿では,SSCILにおける自己指導型表現学習のパフォーマンスを初めて考察する。
論文 参考訳(メタデータ) (2021-11-18T06:58:19Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。