論文の概要: Investigating Enhancements to Contrastive Predictive Coding for Human
Activity Recognition
- arxiv url: http://arxiv.org/abs/2211.06173v1
- Date: Fri, 11 Nov 2022 12:54:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 16:50:21.790910
- Title: Investigating Enhancements to Contrastive Predictive Coding for Human
Activity Recognition
- Title(参考訳): ヒューマンアクティビティ認識のためのコントラスト予測符号化の拡張の検討
- Authors: Harish Haresamudram, Irfan Essa, Thomas Ploetz
- Abstract要約: コントラスト予測符号化(Contrastive Predictive Coding, CPC)は、時系列データの特性を活用して効果的な表現を学習する手法である。
本研究では,アーキテクチャ,アグリゲータネットワーク,今後のタイムステップ予測を体系的に検討し,CPCの強化を提案する。
提案手法は6つのターゲットデータセットのうち4つを大幅に改善し,アプリケーションシナリオを広範囲に拡張する能力を示した。
- 参考スコア(独自算出の注目度): 7.086647707011785
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The dichotomy between the challenging nature of obtaining annotations for
activities, and the more straightforward nature of data collection from
wearables, has resulted in significant interest in the development of
techniques that utilize large quantities of unlabeled data for learning
representations. Contrastive Predictive Coding (CPC) is one such method,
learning effective representations by leveraging properties of time-series data
to setup a contrastive future timestep prediction task. In this work, we
propose enhancements to CPC, by systematically investigating the encoder
architecture, the aggregator network, and the future timestep prediction,
resulting in a fully convolutional architecture, thereby improving
parallelizability. Across sensor positions and activities, our method shows
substantial improvements on four of six target datasets, demonstrating its
ability to empower a wide range of application scenarios. Further, in the
presence of very limited labeled data, our technique significantly outperforms
both supervised and self-supervised baselines, positively impacting situations
where collecting only a few seconds of labeled data may be possible. This is
promising, as CPC does not require specialized data transformations or
reconstructions for learning effective representations.
- Abstract(参考訳): アクティビティのためのアノテーションを得ることの難しさと、ウェアラブルからのデータ収集のより直接的な性質の両立は、大量のラベルのないデータを学習表現に活用する技術開発に大きな関心を惹き付けている。
コントラスト予測符号化(Contrastive Predictive Coding, CPC)は、時系列データの特性を活用して効果的な表現を学習し、コントラストのある将来予測タスクを設定する手法である。
本研究では,エンコーダアーキテクチャ,アグリゲータネットワーク,将来の時間ステップ予測を体系的に検討することにより,完全畳み込みアーキテクチャを実現し,並列性を向上させるcpcの拡張を提案する。
センサの位置や活動全体にわたって,本手法は6つのターゲットデータセットのうち4つを大幅に改善し,幅広いアプリケーションシナリオを拡張できることを示す。
さらに,ラベル付きデータが非常に限られている場合には,教師付きベースラインと自己教師付きベースラインの両方を著しく上回り,ラベル付きデータの数秒の収集が可能な状況に積極的に影響する。
cpcは効果的な表現を学ぶために特別なデータ変換や再構成を必要としないので、これは有望である。
関連論文リスト
- Interactive Counterfactual Generation for Univariate Time Series [7.331969743532515]
私たちのアプローチは、ディープラーニングモデルの意思決定プロセスの透明性と理解を高めることを目的としています。
提案手法は,提案するデータポイントとユーザインタラクションを抽象化することにより,直感的な事実説明の生成を容易にする。
本手法をECG5000ベンチマークデータセットを用いて検証し,解釈可能性と時系列分類のユーザ理解の大幅な向上を実証した。
論文 参考訳(メタデータ) (2024-08-20T08:19:55Z) - CUDC: A Curiosity-Driven Unsupervised Data Collection Method with
Adaptive Temporal Distances for Offline Reinforcement Learning [62.58375643251612]
本稿では,Curiosity-driven Unsupervised Data Collection (CUDC)法を提案する。
この適応的な到達性機構により、特徴表現は多様化することができ、エージェントは、好奇心で高品質なデータを集めるために自分自身をナビゲートすることができる。
実験的に、CUDCはDeepMindコントロールスイートの様々なダウンストリームオフラインRLタスクにおいて、既存の教師なし手法よりも効率と学習性能が優れている。
論文 参考訳(メタデータ) (2023-12-19T14:26:23Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Multi-dataset Training of Transformers for Robust Action Recognition [75.5695991766902]
動作認識のための複数のデータセットをうまく一般化することを目的として,ロバストな特徴表現の課題について検討する。
本稿では、情報損失と投影損失という2つの新しい損失項を設計した、新しいマルチデータセットトレーニングパラダイムであるMultiTrainを提案する。
本研究では,Kineetics-400,Kineetics-700,Moments-in-Time,Activitynet,Some-something-v2の5つの課題データセットに対して,本手法の有効性を検証する。
論文 参考訳(メタデータ) (2022-09-26T01:30:43Z) - Contrastive Predictive Coding for Human Activity Recognition [5.766384728949437]
本研究では,センサデータストリームの長期的時間構造をキャプチャする人間行動認識にContrastive Predictive Codingフレームワークを導入する。
CPCベースの事前学習は自己管理され、その結果得られた表現は標準のアクティビティチェーンに統合できる。
少量のラベル付きトレーニングデータしか利用できない場合、認識性能が大幅に向上します。
論文 参考訳(メタデータ) (2020-12-09T21:44:36Z) - Online Descriptor Enhancement via Self-Labelling Triplets for Visual
Data Association [28.03285334702022]
オブジェクトレベルの視覚データアソシエーションのタスクにおいて,視覚記述子を漸進的に精製する自己教師型手法を提案する。
本手法は,ドメインに依存しないデータで事前学習した画像分類ネットワークを継続的にトレーニングすることにより,オンラインのディープディスクリプタジェネレータを最適化する。
提案手法はトラッキング・バイ・ディテクト・タスクに適用された他の視覚的データ・アソシエーション手法を超越し,観測情報に適応しようとする他の手法と比較して,優れた性能向上を提供することを示す。
論文 参考訳(メタデータ) (2020-11-06T17:42:04Z) - Representation Learning for Sequence Data with Deep Autoencoding
Predictive Components [96.42805872177067]
本稿では,シーケンスデータの有用な表現が潜在空間における単純な構造を示すべきという直感に基づく,シーケンスデータの自己教師型表現学習法を提案する。
我々は,過去と将来のウィンドウ間の相互情報である潜在特徴系列の予測情報を最大化することにより,この潜時構造を奨励する。
提案手法は,ノイズの多い動的システムの潜時空間を復元し,タスク予測のための予測特徴を抽出し,エンコーダを大量の未ラベルデータで事前訓練する場合に音声認識を改善する。
論文 参考訳(メタデータ) (2020-10-07T03:34:01Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。