論文の概要: Representation Learning with Graph Neural Networks for Speech Emotion
Recognition
- arxiv url: http://arxiv.org/abs/2208.09830v1
- Date: Sun, 21 Aug 2022 07:37:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 14:38:58.601069
- Title: Representation Learning with Graph Neural Networks for Speech Emotion
Recognition
- Title(参考訳): 音声感情認識のためのグラフニューラルネットワークによる表現学習
- Authors: Junghun Kim, Jihie Kim
- Abstract要約: 摂動と雑音に頑健なコサイン類似性に基づくグラフ畳み込みネットワーク(CoGCN)を提案する。
実験の結果,本手法は最先端の手法よりも優れていた。
- 参考スコア(独自算出の注目度): 0.7081604594416336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning expressive representation is crucial in deep learning. In speech
emotion recognition (SER), vacuum regions or noises in the speech interfere
with expressive representation learning. However, traditional RNN-based models
are susceptible to such noise. Recently, Graph Neural Network (GNN) has
demonstrated its effectiveness for representation learning, and we adopt this
framework for SER. In particular, we propose a cosine similarity-based graph as
an ideal graph structure for representation learning in SER. We present a
Cosine similarity-based Graph Convolutional Network (CoGCN) that is robust to
perturbation and noise. Experimental results show that our method outperforms
state-of-the-art methods or provides competitive results with a significant
model size reduction with only 1/30 parameters.
- Abstract(参考訳): 表現力の学習は深層学習において重要である。
音声感情認識(SER)では、音声中の真空領域やノイズが表現表現学習に干渉する。
しかし、従来のRNNベースのモデルはそのようなノイズの影響を受けやすい。
近年,グラフニューラルネットワーク(gnn)が表現学習の有効性を実証し,このフレームワークをserに適用した。
特に,SERにおける表現学習の理想的なグラフ構造として,コサイン類似性に基づくグラフを提案する。
摂動と雑音に頑健なコサイン類似性に基づくグラフ畳み込みネットワーク(CoGCN)を提案する。
実験の結果,本手法は最先端手法よりも優れており,また1/30のパラメータしか持たないモデルサイズが大幅に削減された。
関連論文リスト
- Graph Reasoning Networks [9.18586425686959]
Graph Reasoning Networks (GRNs) は、グラフ表現と学習したグラフ表現の長所と、微分可能満足度解法に基づく推論モジュールを組み合わせるための新しいアプローチである。
実世界のデータセットの結果は、GNNに匹敵するパフォーマンスを示している。
合成データセットの実験は、新しく提案された手法の可能性を示している。
論文 参考訳(メタデータ) (2024-07-08T10:53:49Z) - Seeing in Words: Learning to Classify through Language Bottlenecks [59.97827889540685]
人間は簡潔で直感的な説明を使って予測を説明することができる。
特徴表現がテキストである視覚モデルでは,画像ネットイメージを効果的に分類できることを示す。
論文 参考訳(メタデータ) (2023-06-29T00:24:42Z) - Graph Neural Networks Provably Benefit from Structural Information: A
Feature Learning Perspective [53.999128831324576]
グラフニューラルネットワーク(GNN)は、グラフ表現学習の先駆けとなった。
本研究では,特徴学習理論の文脈におけるグラフ畳み込みの役割について検討する。
論文 参考訳(メタデータ) (2023-06-24T10:21:11Z) - SR-GNN: Spatial Relation-aware Graph Neural Network for Fine-Grained
Image Categorization [24.286426387100423]
本稿では,最も関連性の高い画像領域からコンテキスト認識機能を集約することで,微妙な変化を捉える手法を提案する。
我々のアプローチは、近年の自己注意とグラフニューラルネットワーク(GNN)の発展にインスパイアされている。
これは、認識精度のかなりの差で最先端のアプローチよりも優れている。
論文 参考訳(メタデータ) (2022-09-05T19:43:15Z) - Learning the Implicit Semantic Representation on Graph-Structured Data [57.670106959061634]
グラフ畳み込みネットワークにおける既存の表現学習手法は主に、各ノードの近傍を知覚全体として記述することで設計される。
本稿では,グラフの潜在意味パスを学習することで暗黙的な意味を探索する意味グラフ畳み込みネットワーク(sgcn)を提案する。
論文 参考訳(メタデータ) (2021-01-16T16:18:43Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - GINet: Graph Interaction Network for Scene Parsing [58.394591509215005]
画像領域に対する文脈推論を促進するために,グラフインタラクションユニット(GIユニット)とセマンティックコンテキストロス(SC-loss)を提案する。
提案されたGINetは、Pascal-ContextやCOCO Stuffなど、一般的なベンチマークにおける最先端のアプローチよりも優れている。
論文 参考訳(メタデータ) (2020-09-14T02:52:45Z) - Compact Graph Architecture for Speech Emotion Recognition [0.0]
データを表現するコンパクトで効率的でスケーラブルな方法は、グラフの形式です。
グラフ畳み込みネットワーク(GCN)ベースのアーキテクチャを構築し,正確なグラフ畳み込みを実現する。
我々のモデルは、学習可能なパラメータが著しく少ない最先端のモデルに匹敵する性能を達成する。
論文 参考訳(メタデータ) (2020-08-05T12:09:09Z) - Towards Deeper Graph Neural Networks [63.46470695525957]
グラフ畳み込みは近傍の集約を行い、最も重要なグラフ操作の1つである。
いくつかの最近の研究で、この性能劣化は過度に滑らかな問題に起因している。
本研究では,大きな受容領域からの情報を適応的に組み込むディープ適応グラフニューラルネットワーク(DAGNN)を提案する。
論文 参考訳(メタデータ) (2020-07-18T01:11:14Z) - Gradient-Adjusted Neuron Activation Profiles for Comprehensive
Introspection of Convolutional Speech Recognition Models [1.6752182911522515]
我々は,Deep Neural Networksにおける特徴や表現を解釈する手段として,GradNAP(Gradient-adjusted Neuron Activation Profiles)を導入する。
GradNAPは、特定の入力のグループに対するANNの特徴的な応答であり、予測のためのニューロンの関連性を含んでいる。
ANNでデータがどのように処理されるかを知るためにGradNAPを利用する方法を示す。
論文 参考訳(メタデータ) (2020-02-19T11:59:36Z) - Comparison of Syntactic and Semantic Representations of Programs in
Neural Embeddings [1.0878040851638]
プログラム埋め込みのタスクにおいて、異なるグラフ表現を用いてグラフ畳み込みネットワークを比較する。
制御フローグラフの空間性やグラフ畳み込みネットワークの暗黙の集約は、これらのモデルがナイーブモデルよりも悪い結果をもたらすことを示している。
論文 参考訳(メタデータ) (2020-01-24T21:30:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。