論文の概要: WHAR Arena: Benchmarking the State of the Art in Efficient Wearable Human Activity Recognition
- arxiv url: http://arxiv.org/abs/2606.13194v1
- Date: Thu, 11 Jun 2026 11:01:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.744346
- Title: WHAR Arena: Benchmarking the State of the Art in Efficient Wearable Human Activity Recognition
- Title(参考訳): WHARアリーナ:効率的なウェアラブルな人間の活動認識における最先端技術の評価
- Authors: Maximilian Burzer, Tobias King, Till Riedel, Michael Beigl, Tobias Röddiger,
- Abstract要約: 我々は、標準化された処理、統一されたモデルインターフェース、共通のオブジェクト間評価プロトコルの下で、30の多様なデータセットを統合する。
デバイス上のレイテンシ,ピークメモリ,モデルサイズとともに,Androidリファレンスデバイス上での予測性能を測定した。
以上の結果から,WHAR状態は単一アーキテクチャに支配されるのではなく,分散していることが明らかとなった。
- 参考スコア(独自算出の注目度): 5.46517570496579
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning has become the dominant paradigm in Wearable Human Activity Recognition (WHAR), yet progress is obscured by a comparability crisis. Results are often reported using inconsistent datasets, custom data processing, and varying evaluation protocols, making state-of-the-art claims fragile. We address this with a large-scale, open-source benchmark that integrates 30 diverse datasets under standardized processing, unified model interfaces, and a shared cross-subject evaluation protocol. Evaluating 17 representative architectures across 4760 training runs, we jointly measure predictive performance alongside on-device latency, peak memory, and model size on an Android reference device. Our results reveal that the WHAR state of the art is distributed rather than dominated by a single architecture. While CNN-HAR achieves the highest mean macro-F1, top-performing models cluster tightly, indicating contemporary architectures have converged near a predictive performance ceiling. When accounting for deployment efficiency, compact neural models, such as TinierHAR, and classical Random Forests define the practically relevant Pareto frontier, whereas larger recurrent and hybrid models incur high hardware costs without corresponding performance gains. Consequently, while predictive performance has plateaued, substantial potential for future progress remains in optimizing deployment efficiency and improving adaptation to domain shifts. We release our full framework to support transparent reuse and extension.
- Abstract(参考訳): 深層学習はウェアラブルヒューマンアクティビティ認識(WHAR)において支配的なパラダイムとなっているが、コンパラビリティ危機によって進歩は隠蔽されている。
結果はしばしば、一貫性のないデータセット、カスタムデータ処理、さまざまな評価プロトコルを使用して報告され、最先端のクレームは脆弱である。
我々はこれを、標準化された処理、統一されたモデルインターフェース、共有オブジェクト評価プロトコルの下で30の多様なデータセットを統合する大規模なオープンソースベンチマークで解決する。
4760のトレーニング実行で17の代表的なアーキテクチャを評価し、Androidリファレンスデバイス上でのデバイス上のレイテンシ、ピークメモリ、モデルサイズとともに、予測性能を共同で測定する。
以上の結果から,WHARは単一アーキテクチャに支配されるのではなく,分散していることが明らかとなった。
CNN-HARは最上位のマクロF1を達成しているが、トップパフォーマンスモデルは密集しており、現代のアーキテクチャは予測性能天井付近で収束していることを示している。
デプロイメント効率を考慮すると、TinierHARや古典的ランダムフォレストのようなコンパクトなニューラルモデルでは、実用的なパレートフロンティアが定義されている。
その結果、予測性能は低下しているものの、デプロイメント効率を最適化し、ドメインシフトへの適応を改善することで、今後の進歩のかなりの可能性を秘めている。
透過的な再利用と拡張をサポートするための完全なフレームワークをリリースします。
関連論文リスト
- StepVAR: Structure-Texture Guided Pruning for Visual Autoregressive Models [98.72926158261937]
本稿では,Visual AutoRegressive モデルのためのトレーニングフリートークン解析フレームワークを提案する。
我々は局所的なテクスチャの詳細を捉えるために軽量なハイパスフィルタを使用し、グローバルな構造情報を保存するために主成分分析(PCA)を活用している。
スパーストークンの下で有効な次世代の予測を維持するために,近接した特徴伝達戦略を導入する。
論文 参考訳(メタデータ) (2026-03-02T11:35:05Z) - Scaling Linear Attention with Sparse State Expansion [62.749291436866606]
トランスフォーマーアーキテクチャは、2次計算と線形メモリ成長による長期コンテキストシナリオに苦慮している。
より効率的な文脈圧縮を実現するための2つの重要な革新を提案する。
まず、情報分類として状態更新を概念化し、線形注意のための行スパース更新定式化を導入する。
次に、スパースフレームワーク内にスパース状態拡張(SSE)を示し、コンテキスト状態を複数のパーティションに拡張する。
論文 参考訳(メタデータ) (2025-07-22T13:27:31Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - AugmentGest: Can Random Data Cropping Augmentation Boost Gesture Recognition Performance? [49.64902130083662]
本稿では、幾何変換、ランダム変動、回転、ズーム、強度に基づく変換を統合する包括的データ拡張フレームワークを提案する。
提案手法は,マルチストリームe2eET,FPPRポイントクラウドベースハンドジェスチャ認識(HGR),DD-Networkの3つのモデルで評価される。
論文 参考訳(メタデータ) (2025-06-08T16:43:05Z) - Real-Time Manipulation Action Recognition with a Factorized Graph Sequence Encoder [0.6437284704257459]
本稿では、リアルタイムに実行し、時間次元を効果的にスケールする新しいファクトリズグラフシーケンスネットワークを提案する。
グラフレベルの埋め込みをより集中的に抽出するための単純なプール操作であるハンドプール操作も導入する。
F1-macroスコアは14.3%,5.6%向上した。
論文 参考訳(メタデータ) (2025-03-15T07:58:25Z) - ContextFormer: Redefining Efficiency in Semantic Segmentation [48.81126061219231]
畳み込み法は、局所的な依存関係をうまく捉えるが、長距離関係に苦慮する。
ビジョントランスフォーマー(ViT)は、グローバルなコンテキストキャプチャでは優れるが、高い計算要求によって妨げられる。
我々は,リアルタイムセマンティックセグメンテーションの効率,精度,堅牢性のバランスをとるために,CNN と ViT の強みを活用したハイブリッドフレームワーク ContextFormer を提案する。
論文 参考訳(メタデータ) (2025-01-31T16:11:04Z) - Reinforcement Learning as a Parsimonious Alternative to Prediction
Cascades: A Case Study on Image Segmentation [6.576180048533476]
PaSeR(Parsimonious with Reinforcement Learning)は、非スケーリングでコストを意識した学習パイプラインである。
ケースドモデルと比較して計算コストを最小化しながら,PaSeRの精度が向上することを示す。
コストと性能のバランスを評価するため,新しい指標IoU/GigaFlopを導入する。
論文 参考訳(メタデータ) (2024-02-19T01:17:52Z) - Incremental Outlier Detection Modelling Using Streaming Analytics in Finance & Health Care [0.0]
リアルタイムデータの時代において、従来の手法はストリーミング環境の動的な性質に追従するのに苦労することが多い。
本稿では,モデルを一度構築し,リアルタイム環境下で評価するハイブリッドフレームワークを提案する。
我々は、一級サポートベクターマシン(OCSVM)、孤立林適応型スライドウィンドウアプローチ(IForest ASD)、正確な嵐(ES)、角度ベース外乱検出(ABOD)、局所外乱係数(LOF)、Kitsunesオンラインアルゴリズム(KitNet)、K-nearest近隣の8種類の最先端外乱検出モデルを採用した。
論文 参考訳(メタデータ) (2023-05-17T02:30:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。