論文の概要: Combining Deep Transfer Learning with Signal-image Encoding for
Multi-Modal Mental Wellbeing Classification
- arxiv url: http://arxiv.org/abs/2012.03711v1
- Date: Fri, 20 Nov 2020 13:37:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 05:32:23.958306
- Title: Combining Deep Transfer Learning with Signal-image Encoding for
Multi-Modal Mental Wellbeing Classification
- Title(参考訳): マルチモーダルメンタルウェルビング分類のためのディープトランスファー学習と信号画像符号化の併用
- Authors: Kieran Woodward, Eiman Kanjo, Athanasios Tsanas
- Abstract要約: 本稿では,複数のマルチモーダルデータセット上で感情状態認識を行う際の限界に対処する枠組みを提案する。
5-point Likertスケールで評価された実世界の幸福度を推定する際のモデル性能は,我々のフレームワークを用いて向上できることを示す。
- 参考スコア(独自算出の注目度): 2.513785998932353
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The quantification of emotional states is an important step to understanding
wellbeing. Time series data from multiple modalities such as physiological and
motion sensor data have proven to be integral for measuring and quantifying
emotions. Monitoring emotional trajectories over long periods of time inherits
some critical limitations in relation to the size of the training data. This
shortcoming may hinder the development of reliable and accurate machine
learning models. To address this problem, this paper proposes a framework to
tackle the limitation in performing emotional state recognition on multiple
multimodal datasets: 1) encoding multivariate time series data into coloured
images; 2) leveraging pre-trained object recognition models to apply a Transfer
Learning (TL) approach using the images from step 1; 3) utilising a 1D
Convolutional Neural Network (CNN) to perform emotion classification from
physiological data; 4) concatenating the pre-trained TL model with the 1D CNN.
Furthermore, the possibility of performing TL to infer stress from
physiological data is explored by initially training a 1D CNN using a large
physical activity dataset and then applying the learned knowledge to the target
dataset. We demonstrate that model performance when inferring real-world
wellbeing rated on a 5-point Likert scale can be enhanced using our framework,
resulting in up to 98.5% accuracy, outperforming a conventional CNN by 4.5%.
Subject-independent models using the same approach resulted in an average of
72.3% accuracy (SD 0.038). The proposed CNN-TL-based methodology may overcome
problems with small training datasets, thus improving on the performance of
conventional deep learning methods.
- Abstract(参考訳): 感情状態の定量化は幸福を理解するための重要なステップである。
生理学や運動センサーデータなどの複数のモードからの時系列データは、感情の測定と定量化に不可欠であることが証明されている。
長期にわたる感情的軌跡のモニタリングは、トレーニングデータのサイズに関していくつかの限界を継承する。
この欠点は、信頼性と正確な機械学習モデルの開発を妨げる可能性がある。
この問題に対処するために,複数のマルチモーダルデータセット上で感情状態認識を行う際の限界に対処する枠組みを提案する。
1) 多変量時系列データをカラー画像に符号化すること
2) 事前学習対象認識モデルを利用して,ステップ1の画像を用いた伝達学習(TL)アプローチを適用する。
3) 1次元畳み込みニューラルネットワーク(cnn)を利用して,生理データから感情分類を行う。
4) 事前学習TLモデルと1D CNNを連結した。
さらに,大規模物理活動データセットを用いて1次元CNNをトレーニングし,学習した知識を対象データセットに適用することにより,生理的データからストレスを推測するためのTLの実行の可能性を検討する。
その結果,従来のCNNを4.5%上回る98.5%の精度で,実世界の幸福度を5-point Likertスケールで推定する際のモデル性能が向上できることが実証された。
同じアプローチを用いた対象非依存モデルでは平均72.3%の精度(SD 0.038)が得られた。
提案するcnn-tlに基づく手法は、小規模のトレーニングデータセットによる問題を克服し、従来のディープラーニング手法の性能を向上させる。
関連論文リスト
- Assessing Neural Network Representations During Training Using
Noise-Resilient Diffusion Spectral Entropy [55.014926694758195]
ニューラルネットワークにおけるエントロピーと相互情報は、学習プロセスに関する豊富な情報を提供する。
データ幾何を利用して基礎となる多様体にアクセスし、これらの情報理論測度を確実に計算する。
本研究は,高次元シミュレーションデータにおける固有次元と関係強度の耐雑音性の測定結果である。
論文 参考訳(メタデータ) (2023-12-04T01:32:42Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Human activity recognition using deep learning approaches and single
frame cnn and convolutional lstm [0.0]
我々は、ビデオから人間の行動を認識するために、単一のフレーム畳み込みニューラルネットワーク(CNN)と畳み込み長短期記憶という、深層学習に基づく2つのアプローチを探索する。
2つのモデルは、ベンチマークアクション認識データセットであるUCF50と、実験のために作成された別のデータセットでトレーニングされ、評価された。
どちらのモデルも精度は良いが、単一のフレームCNNモデルはUCF50データセットで99.8%の精度で畳み込みLSTMモデルより優れている。
論文 参考訳(メタデータ) (2023-04-18T01:33:29Z) - Multimodal Masked Autoencoders Learn Transferable Representations [127.35955819874063]
単純でスケーラブルなネットワークアーキテクチャであるM3AE(Multimodal Masked Autoencoder)を提案する。
M3AEは、マスク付きトークン予測により、視覚と言語データの両方の統一エンコーダを学習する。
我々は,大規模な画像テキストデータセット上で訓練されたM3AEについて実証的研究を行い,M3AEが下流タスクによく伝達される一般化可能な表現を学習できることを見出した。
論文 参考訳(メタデータ) (2022-05-27T19:09:42Z) - Dynamic Neural Diversification: Path to Computationally Sustainable
Neural Networks [68.8204255655161]
訓練可能なパラメータが制限された小さなニューラルネットワークは、多くの単純なタスクに対してリソース効率の高い候補となる。
学習過程において隠れた層内のニューロンの多様性を探索する。
ニューロンの多様性がモデルの予測にどのように影響するかを分析する。
論文 参考訳(メタデータ) (2021-09-20T15:12:16Z) - Benchmarking CNN on 3D Anatomical Brain MRI: Architectures, Data
Augmentation and Deep Ensemble Learning [2.1446056201053185]
我々は最近のSOTA(State-of-the-art)3D CNNの広範なベンチマークを提案し、データ拡張と深層アンサンブル学習の利点も評価した。
年齢予測,性別分類,統合失調症診断の3つの課題について,N=10kスキャンを含む多地点の脳解剖学的MRIデータセットを用いて実験を行った。
その結果,VBM画像の予測精度は擬似RAWデータよりも有意に向上した。
DenseNetとSmall-DenseNetは、私たちが提案したより軽量なバージョンで、すべてのデータレシエーションのパフォーマンスにおいて優れた妥協を提供する。
論文 参考訳(メタデータ) (2021-06-02T13:00:35Z) - RIFLE: Backpropagation in Depth for Deep Transfer Learning through
Re-Initializing the Fully-connected LayEr [60.07531696857743]
事前訓練されたモデルを用いたディープ畳み込みニューラルネットワーク(CNN)の微調整は、より大きなデータセットから学習した知識をターゲットタスクに転送するのに役立つ。
転送学習環境におけるバックプロパゲーションを深める戦略であるRIFLEを提案する。
RIFLEは、深いCNN層の重み付けに意味のあるアップデートをもたらし、低レベルの機能学習を改善する。
論文 参考訳(メタデータ) (2020-07-07T11:27:43Z) - Fast Modeling and Understanding Fluid Dynamics Systems with
Encoder-Decoder Networks [0.0]
本研究では,有限体積シミュレータを用いて,高精度な深層学習に基づくプロキシモデルを効率的に教えることができることを示す。
従来のシミュレーションと比較して、提案したディープラーニングアプローチはより高速なフォワード計算を可能にする。
深層学習モデルの重要物理パラメータに対する感度を定量化することにより、インバージョン問題を大きな加速で解くことができることを示す。
論文 参考訳(メタデータ) (2020-06-09T17:14:08Z) - 3D medical image segmentation with labeled and unlabeled data using
autoencoders at the example of liver segmentation in CT images [58.720142291102135]
本研究では、畳み込みニューラルネットワークによるセグメンテーションを改善するために、オートエンコーダ抽出機能の可能性を検討する。
コンボリューション・オートエンコーダを用いてラベルのないデータから特徴を抽出し,CT画像における3次元肝セグメンテーションの目標タスクを実行するために,マルチスケールの完全畳み込みCNNを用いた。
論文 参考訳(メタデータ) (2020-03-17T20:20:43Z) - 1D CNN Based Network Intrusion Detection with Normalization on
Imbalanced Data [0.19336815376402716]
侵入検知システム(IDS)は、コンピュータネットワークにおいて、コンピュータ資源とデータを外部攻撃から保護する重要な役割を担っている。
最近のIDSは、予期せぬ、予測不能な攻撃に対するIDSの柔軟性と効率性を向上する課題に直面している。
1次元畳み込みニューラルネットワーク(1D-CNN)を用いた効率的かつ柔軟なIDS構築のための深層学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-01T12:23:46Z) - Human Activity Recognition using Multi-Head CNN followed by LSTM [1.8830374973687412]
本研究では,CNNとLSTMを用いた新しい身体活動認識法を提案する。
提案手法を用いて,従来の機械学習アルゴリズムや他のディープニューラルネットワークアルゴリズムに匹敵する最先端の精度を実現する。
論文 参考訳(メタデータ) (2020-02-21T14:29:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。