論文の概要: Compact Graph Architecture for Speech Emotion Recognition
- arxiv url: http://arxiv.org/abs/2008.02063v4
- Date: Tue, 2 Feb 2021 10:34:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 18:03:15.621492
- Title: Compact Graph Architecture for Speech Emotion Recognition
- Title(参考訳): 音声感情認識のためのコンパクトグラフアーキテクチャ
- Authors: A. Shirian, T. Guha
- Abstract要約: データを表現するコンパクトで効率的でスケーラブルな方法は、グラフの形式です。
グラフ畳み込みネットワーク(GCN)ベースのアーキテクチャを構築し,正確なグラフ畳み込みを実現する。
我々のモデルは、学習可能なパラメータが著しく少ない最先端のモデルに匹敵する性能を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a deep graph approach to address the task of speech emotion
recognition. A compact, efficient and scalable way to represent data is in the
form of graphs. Following the theory of graph signal processing, we propose to
model speech signal as a cycle graph or a line graph. Such graph structure
enables us to construct a Graph Convolution Network (GCN)-based architecture
that can perform an accurate graph convolution in contrast to the approximate
convolution used in standard GCNs. We evaluated the performance of our model
for speech emotion recognition on the popular IEMOCAP and MSP-IMPROV databases.
Our model outperforms standard GCN and other relevant deep graph architectures
indicating the effectiveness of our approach. When compared with existing
speech emotion recognition methods, our model achieves comparable performance
to the state-of-the-art with significantly fewer learnable parameters (~30K)
indicating its applicability in resource-constrained devices.
- Abstract(参考訳): 本稿では,音声感情認識の課題に対処するディープグラフアプローチを提案する。
データを表現するコンパクトで効率的でスケーラブルな方法は、グラフの形式です。
グラフ信号処理の理論に倣って,周期グラフや線グラフとして音声信号をモデル化することを提案する。
このようなグラフ構造により、標準的なGCNで使用される近似畳み込みとは対照的に、正確なグラフ畳み込みを行うことができるグラフ畳み込みネットワーク(GCN)ベースのアーキテクチャを構築することができる。
一般的なIEMOCAPとMSP-IMPROVデータベースを用いた音声感情認識モデルの性能評価を行った。
我々のモデルは、標準的なGCNや他の関連するディープグラフアーキテクチャよりも優れている。
既存の音声感情認識法と比較すると,学習可能なパラメータ(約30K)が大幅に少なく,資源制約のあるデバイスに適用可能であることを示す。
関連論文リスト
- Dynamic Dense Graph Convolutional Network for Skeleton-based Human
Motion Prediction [14.825185477750479]
本稿では,高密度グラフを構築し,動的メッセージパッシングを実装した動的Dense Graph Convolutional Network (DD-GCN)を提案する。
そこで本研究では,データから動的に学習し,ユニークなメッセージを生成する動的メッセージパッシングフレームワークを提案する。
ベンチマークによるHuman 3.6MとCMU Mocapデータセットの実験は、DD-GCNの有効性を検証する。
論文 参考訳(メタデータ) (2023-11-29T07:25:49Z) - Graph-level Representation Learning with Joint-Embedding Predictive Architectures [43.89120279424267]
JEPA(Joint-Embedding Predictive Architectures)は、自己指導型表現学習の斬新で強力な技術である。
グラフ結合埋め込み予測アーキテクチャ(Graph-JEPA)を提案することにより、このパラダイムを用いてグラフレベルの表現を効果的にモデル化できることを示す。
特に、マスク付きモデリングを採用し、コンテキストサブグラフの潜時表現から始まるマスク付きサブグラフの潜時表現を予測することに焦点をあてる。
論文 参考訳(メタデータ) (2023-09-27T20:42:02Z) - Towards Relation-centered Pooling and Convolution for Heterogeneous
Graph Learning Networks [11.421162988355146]
不均一グラフニューラルネットワークは,グラフ表現学習において大きな可能性を秘めている。
我々は,PC-HGNという異種グラフ学習ネットワークのための関係中心のPooling and Convolutionを設計し,関係固有サンプリングと相互関係の畳み込みを実現する。
実世界の3つのデータセットにおける最先端グラフ学習モデルとの比較により,提案モデルの性能評価を行った。
論文 参考訳(メタデータ) (2022-10-31T08:43:32Z) - Representation Learning with Graph Neural Networks for Speech Emotion
Recognition [0.7081604594416336]
摂動と雑音に頑健なコサイン類似性に基づくグラフ畳み込みネットワーク(CoGCN)を提案する。
実験の結果,本手法は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-08-21T07:37:18Z) - Graph Condensation via Receptive Field Distribution Matching [61.71711656856704]
本稿では,元のグラフを表す小さなグラフの作成に焦点をあてる。
我々は、元のグラフを受容体の分布とみなし、受容体が同様の分布を持つ小さなグラフを合成することを目的としている。
論文 参考訳(メタデータ) (2022-06-28T02:10:05Z) - Learning Graph Structure from Convolutional Mixtures [119.45320143101381]
本稿では、観測されたグラフと潜伏グラフのグラフ畳み込み関係を提案し、グラフ学習タスクをネットワーク逆(デコンボリューション)問題として定式化する。
固有分解に基づくスペクトル法の代わりに、近似勾配反復をアンロール・トランケートして、グラフデコンボリューションネットワーク(GDN)と呼ばれるパラメータ化ニューラルネットワークアーキテクチャに到達させる。
GDNは、教師付き方式でグラフの分布を学習し、損失関数を適応させることでリンク予測やエッジウェイト回帰タスクを実行し、本質的に帰納的である。
論文 参考訳(メタデータ) (2022-05-19T14:08:15Z) - Towards Graph Self-Supervised Learning with Contrastive Adjusted Zooming [48.99614465020678]
本稿では,グラフコントラスト適応ズームによる自己教師付きグラフ表現学習アルゴリズムを提案する。
このメカニズムにより、G-Zoomはグラフから複数のスケールから自己超越信号を探索して抽出することができる。
我々は,実世界のデータセットに関する広範な実験を行い,提案したモデルが常に最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-11-20T22:45:53Z) - Attention-Driven Dynamic Graph Convolutional Network for Multi-Label
Image Recognition [53.17837649440601]
本稿では,各画像の特定のグラフを動的に生成するアテンション駆動型動的グラフ畳み込みネットワーク(ADD-GCN)を提案する。
パブリックなマルチラベルベンチマーク実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-12-05T10:10:12Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - Dynamic Emotion Modeling with Learnable Graphs and Graph Inception
Network [0.0]
本稿では,感情認識と動的データの基盤となるグラフ構造を共同で学習するLearable Graph Inception Network(L-GrIN)を提案する。
提案アーキテクチャを3つの異なるモードにまたがる5つのベンチマーク感情認識データベース上で評価する。
論文 参考訳(メタデータ) (2020-08-06T13:51:31Z) - Tensor Graph Convolutional Networks for Multi-relational and Robust
Learning [74.05478502080658]
本稿では,テンソルで表されるグラフの集合に関連するデータから,スケーラブルな半教師付き学習(SSL)を実現するためのテンソルグラフ畳み込みネットワーク(TGCN)を提案する。
提案アーキテクチャは、標準的なGCNと比較して大幅に性能が向上し、最先端の敵攻撃に対処し、タンパク質間相互作用ネットワーク上でのSSL性能が著しく向上する。
論文 参考訳(メタデータ) (2020-03-15T02:33:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。