論文の概要: Unsupervised Multi-Modal Representation Learning for Affective Computing
with Multi-Corpus Wearable Data
- arxiv url: http://arxiv.org/abs/2008.10726v1
- Date: Mon, 24 Aug 2020 22:01:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 12:44:30.628826
- Title: Unsupervised Multi-Modal Representation Learning for Affective Computing
with Multi-Corpus Wearable Data
- Title(参考訳): マルチコーパスウェアラブルデータを用いた影響計算のための教師なしマルチモーダル表現学習
- Authors: Kyle Ross, Paul Hungler, Ali Etemad
- Abstract要約: 我々は、人間の監督への依存を減らすために、教師なしの枠組みを提案する。
提案フレームワークは2つの畳み込み自己エンコーダを用いて、ウェアラブル心電図(ECG)と電磁気放射能(EDA)信号から潜時表現を学習する。
提案手法は, 同一のデータセット上での覚醒検出を行ない, 現状の成果よりも優れていた。
- 参考スコア(独自算出の注目度): 16.457778420360537
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With recent developments in smart technologies, there has been a growing
focus on the use of artificial intelligence and machine learning for affective
computing to further enhance the user experience through emotion recognition.
Typically, machine learning models used for affective computing are trained
using manually extracted features from biological signals. Such features may
not generalize well for large datasets and may be sub-optimal in capturing the
information from the raw input data. One approach to address this issue is to
use fully supervised deep learning methods to learn latent representations of
the biosignals. However, this method requires human supervision to label the
data, which may be unavailable or difficult to obtain. In this work we propose
an unsupervised framework reduce the reliance on human supervision. The
proposed framework utilizes two stacked convolutional autoencoders to learn
latent representations from wearable electrocardiogram (ECG) and electrodermal
activity (EDA) signals. These representations are utilized within a random
forest model for binary arousal classification. This approach reduces human
supervision and enables the aggregation of datasets allowing for higher
generalizability. To validate this framework, an aggregated dataset comprised
of the AMIGOS, ASCERTAIN, CLEAS, and MAHNOB-HCI datasets is created. The
results of our proposed method are compared with using convolutional neural
networks, as well as methods that employ manual extraction of hand-crafted
features. The methodology used for fusing the two modalities is also
investigated. Lastly, we show that our method outperforms current
state-of-the-art results that have performed arousal detection on the same
datasets using ECG and EDA biosignals. The results show the wide-spread
applicability for stacked convolutional autoencoders to be used with machine
learning for affective computing.
- Abstract(参考訳): 近年のスマート技術の発展に伴い,感情認識によるユーザエクスペリエンスのさらなる向上を目的とした,感情コンピューティングへの人工知能と機械学習の利用が注目されている。
通常、情緒的コンピューティングに使用される機械学習モデルは、生体信号から手動で抽出された特徴を用いて訓練される。
このような機能は大規模なデータセットではうまく一般化できず、生の入力データから情報を取得するのに最適ではないかもしれない。
この問題に対処する1つのアプローチは、生物信号の潜在表現を学ぶために完全な教師付きディープラーニング手法を使用することである。
しかし、この方法では、データのラベル付けを人間に委ねる必要があり、入手が困難になる可能性がある。
本研究では,人的監督への依存を減らすために,教師なしの枠組みを提案する。
提案手法は,2つの積層畳み込みオートエンコーダを用いて,ウェアラブル心電図(ecg)および電極活動(eda)信号から潜在表現を学習する。
これらの表現はランダムフォレストモデルでバイナリー覚醒分類に利用される。
このアプローチは、人間の監督を減らし、より一般化可能なデータセットの集約を可能にする。
このフレームワークを検証するために、AMIGOS、ASCERTAIN、CLEAS、MAHNOB-HCIデータセットからなる集約データセットを作成する。
提案手法は,手作業による手作業による特徴抽出と,畳み込みニューラルネットワークを用いて比較した。
2つのモードを融合させる手法についても検討した。
最後に,本手法は,ECG と EDA のバイオシグナールを用いて,同じデータセット上で刺激検出を行った現在の技術結果よりも優れていることを示す。
その結果,階層型畳み込みオートエンコーダは感情コンピューティングに機械学習を応用できることがわかった。
関連論文リスト
- Joint-Embedding Masked Autoencoder for Self-supervised Learning of
Dynamic Functional Connectivity from the Human Brain [18.165807360855435]
グラフニューラルネットワーク(GNN)は、人間の脳ネットワークと表現型を区別するための動的機能接続の学習において、有望であることを示している。
本稿では,計算機ビジョンにおけるJEPA(Joint Embedding Predictive Architecture)からインスピレーションを得た,時空間連成型自動エンコーダ(ST-JEMA)について紹介する。
論文 参考訳(メタデータ) (2024-03-11T04:49:41Z) - Reinforcement Learning Based Multi-modal Feature Fusion Network for
Novel Class Discovery [47.28191501836041]
本稿では,人間の認知過程をシミュレートするために強化学習フレームワークを用いる。
また,マルチモーダル情報から特徴を抽出・融合するマルチエージェントフレームワークをデプロイした。
我々は、OS-MN40、OS-MN40-Miss、Cifar10データセットを用いて、3Dドメインと2Dドメインの両方でのアプローチの性能を示す。
論文 参考訳(メタデータ) (2023-08-26T07:55:32Z) - Defect Classification in Additive Manufacturing Using CNN-Based Vision
Processing [76.72662577101988]
本稿では、まず、畳み込みニューラルネットワーク(CNN)を用いて、画像データセットの欠陥をAMから第2に正確に分類し、発達した分類モデルにアクティブラーニング技術を適用する。
これにより、トレーニングデータやトレーニングデータの生成に必要なデータのサイズを削減できる、ヒューマン・イン・ザ・ループ機構の構築が可能になる。
論文 参考訳(メタデータ) (2023-07-14T14:36:58Z) - Application of federated learning techniques for arrhythmia
classification using 12-lead ECG signals [0.11184789007828977]
この作業では、フェデレートラーニング(FL)プライバシ保護方法論を使用して、高定義のECGの異種集合上でAIモデルをトレーニングする。
CL, IID, 非IIDアプローチを用いて訓練したモデルと比較した。
論文 参考訳(メタデータ) (2022-08-23T14:21:16Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Neurosymbolic hybrid approach to driver collision warning [64.02492460600905]
自律運転システムには2つの主要なアルゴリズムアプローチがある。
ディープラーニングだけでは、多くの分野で最先端の結果が得られています。
しかし、ディープラーニングモデルが機能しない場合、デバッグが非常に難しい場合もあります。
論文 参考訳(メタデータ) (2022-03-28T20:29:50Z) - Addressing Data Scarcity in Multimodal User State Recognition by
Combining Semi-Supervised and Supervised Learning [1.1688030627514532]
本稿では,人間とロボットの相互作用環境における解離・解離状態を検出するためのマルチモーダル機械学習手法を提案する。
我々は,少ないラベル付きデータと大きなラベル付きデータセットを用いて,デア/アグリメント検出のための平均F1スコア81.1%を達成する。
論文 参考訳(メタデータ) (2022-02-08T10:41:41Z) - Clustering augmented Self-Supervised Learning: Anapplication to Land
Cover Mapping [10.720852987343896]
本稿では,自己教師型学習のためのクラスタリングに基づくプレテキストタスクを用いて,土地被覆マッピングの新しい手法を提案する。
社会的に関係のある2つのアプリケーションに対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2021-08-16T19:35:43Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。