論文の概要: SelfHAR: Improving Human Activity Recognition through Self-training with
Unlabeled Data
- arxiv url: http://arxiv.org/abs/2102.06073v1
- Date: Thu, 11 Feb 2021 15:40:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-12 14:10:08.480962
- Title: SelfHAR: Improving Human Activity Recognition through Self-training with
Unlabeled Data
- Title(参考訳): SelfHAR: ラベルなしデータによるセルフトレーニングによるヒューマンアクティビティ認識の改善
- Authors: Chi Ian Tang, Ignacio Perez-Pozuelo, Dimitris Spathis, Soren Brage,
Nick Wareham and Cecilia Mascolo
- Abstract要約: SelfHARは、ラベルなしデータセットを利用して小さなラベル付きデータセットを補完する半教師付きモデルである。
提案手法は教師による自己学習と,ラベル付きデータセットとラベル付きデータセットの知識を融合する。
SelfHARはデータ効率が高く、教師付きアプローチの10倍のラベル付きデータを使用して、同様のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 9.270269467155547
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning and deep learning have shown great promise in mobile sensing
applications, including Human Activity Recognition. However, the performance of
such models in real-world settings largely depends on the availability of large
datasets that captures diverse behaviors. Recently, studies in computer vision
and natural language processing have shown that leveraging massive amounts of
unlabeled data enables performance on par with state-of-the-art supervised
models.
In this work, we present SelfHAR, a semi-supervised model that effectively
learns to leverage unlabeled mobile sensing datasets to complement small
labeled datasets. Our approach combines teacher-student self-training, which
distills the knowledge of unlabeled and labeled datasets while allowing for
data augmentation, and multi-task self-supervision, which learns robust
signal-level representations by predicting distorted versions of the input.
We evaluated SelfHAR on various HAR datasets and showed state-of-the-art
performance over supervised and previous semi-supervised approaches, with up to
12% increase in F1 score using the same number of model parameters at
inference. Furthermore, SelfHAR is data-efficient, reaching similar performance
using up to 10 times less labeled data compared to supervised approaches. Our
work not only achieves state-of-the-art performance in a diverse set of HAR
datasets, but also sheds light on how pre-training tasks may affect downstream
performance.
- Abstract(参考訳): 機械学習とディープラーニングは、ヒューマンアクティビティ認識を含むモバイルセンシングアプリケーションで大きな約束を示しています。
しかし、実際の環境でのモデルのパフォーマンスは、多種多様な振る舞いをキャプチャする大規模データセットの可用性に大きく依存する。
近年、コンピュータビジョンと自然言語処理の研究では、大量のラベルのないデータを活用することで、最先端の監視モデルと同等のパフォーマンスを実現できることが示されています。
本研究では,ラベルなしのモバイルセンシングデータセットを効果的に活用し,小さなラベル付きデータセットを補完する半教師付きモデルであるselfharを提案する。
本手法では,データ拡張を可能とし,ラベル付きデータセットとラベル付きデータセットの知識を蒸留する教師学習と,入力の歪んだバージョンを予測してロバストな信号レベルの表現を学習するマルチタスク自己スーパービジョンを組み合わせる。
様々なharデータセット上でselfharを評価し,教師付きおよび前回の半教師付きアプローチよりも最先端のパフォーマンスを示し,推論時のモデルパラメータ数と同じf1スコアを最大12%向上させた。
さらに、SelfHARはデータ効率が高く、教師付きアプローチの10倍のラベル付きデータを使用して、同様のパフォーマンスを実現する。
私たちの仕事は、HARデータセットの多様なセットで最先端のパフォーマンスを達成するだけでなく、事前トレーニングタスクが下流のパフォーマンスにどのように影響するかに光を当てます。
関連論文リスト
- Less is More: High-value Data Selection for Visual Instruction Tuning [127.38740043393527]
本稿では,視覚的命令データの冗長性を排除し,トレーニングコストを削減するために,高価値なデータ選択手法TIVEを提案する。
約15%のデータしか使用していない我々のアプローチは、8つのベンチマークで全データ微調整モデルに匹敵する平均性能を実現することができる。
論文 参考訳(メタデータ) (2024-03-14T16:47:25Z) - Combining Public Human Activity Recognition Datasets to Mitigate Labeled
Data Scarcity [1.274578243851308]
本稿では,一般公開されたデータセットと一般化されたHARモデルを学習するための新たな戦略を提案する。
我々の実験評価は、さまざまな最先端ニューラルネットワークアーキテクチャの実験を含むもので、公開データセットを組み合わせることで、ラベル付きサンプルの数を著しく削減できることを示している。
論文 参考訳(メタデータ) (2023-06-23T18:51:22Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Self-supervised Activity Representation Learning with Incremental Data:
An Empirical Study [7.782045150068569]
本研究では,時系列分類タスクにおける自己教師付き表現学習モデルの利用が及ぼす影響について検討する。
4つの公開データセットにおいて,ラベル付きデータのサイズ,分布,ソースが最終分類性能に与える影響を解析した。
論文 参考訳(メタデータ) (2023-05-01T01:39:55Z) - Human Activity Recognition Using Self-Supervised Representations of
Wearable Data [0.0]
HAR(Human Activity Recognition)のための正確なアルゴリズムの開発は、大規模な実世界のラベル付きデータセットの欠如によって妨げられている。
ここでは、トレーニング中に見えない実世界のデータセットで評価した場合、高い性能を有する6クラスHARモデルを開発する。
論文 参考訳(メタデータ) (2023-04-26T07:33:54Z) - SelfAct: Personalized Activity Recognition based on Self-Supervised and
Active Learning [0.688204255655161]
SelfActは、ウェアラブルおよびモバイルデバイス上でのヒューマンアクティビティ認識(HAR)のための新しいフレームワークである。
自己教師とアクティブな学習を組み合わせることで、アクティビティ実行のイントラやインターバリアビリティといった問題を軽減します。
公開されている2つのHARデータセットに関する実験は、SelfActが完全に教師付きアプローチのそれに近い、あるいはそれ以上の結果を得ることを示した。
論文 参考訳(メタデータ) (2023-04-19T09:39:11Z) - Reinforcement Learning from Passive Data via Latent Intentions [86.4969514480008]
我々は、下流RLを加速する機能を学ぶために、受動的データが引き続き使用できることを示す。
我々のアプローチは、意図をモデル化することで受動的データから学習する。
実験では、クロス・エボディメント・ビデオデータやYouTubeビデオなど、さまざまな形式の受動的データから学習できることを実証した。
論文 参考訳(メタデータ) (2023-04-10T17:59:05Z) - Striving for data-model efficiency: Identifying data externalities on
group performance [75.17591306911015]
信頼できる、効果的で責任ある機械学習システムの構築は、トレーニングデータとモデリング決定の違いが、予測パフォーマンスにどのように影響するかを理解することに集中する。
我々は、特定のタイプのデータモデル非効率性に注目し、一部のソースからトレーニングデータを追加することで、集団の重要なサブグループで評価されるパフォーマンスを実際に低下させることができる。
以上の結果から,データ効率が正確かつ信頼性の高い機械学習の鍵となることが示唆された。
論文 参考訳(メタデータ) (2022-11-11T16:48:27Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。