論文の概要: Dynamic Emotion Modeling with Learnable Graphs and Graph Inception
Network
- arxiv url: http://arxiv.org/abs/2008.02661v2
- Date: Mon, 8 Feb 2021 12:21:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 08:06:02.509778
- Title: Dynamic Emotion Modeling with Learnable Graphs and Graph Inception
Network
- Title(参考訳): 学習可能なグラフとグラフインセプションネットワークを用いた動的感情モデリング
- Authors: A. Shirian, S. Tripathi, T. Guha
- Abstract要約: 本稿では,感情認識と動的データの基盤となるグラフ構造を共同で学習するLearable Graph Inception Network(L-GrIN)を提案する。
提案アーキテクチャを3つの異なるモードにまたがる5つのベンチマーク感情認識データベース上で評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human emotion is expressed, perceived and captured using a variety of dynamic
data modalities, such as speech (verbal), videos (facial expressions) and
motion sensors (body gestures). We propose a generalized approach to emotion
recognition that can adapt across modalities by modeling dynamic data as
structured graphs. The motivation behind the graph approach is to build compact
models without compromising on performance. To alleviate the problem of optimal
graph construction, we cast this as a joint graph learning and classification
task. To this end, we present the Learnable Graph Inception Network (L-GrIN)
that jointly learns to recognize emotion and to identify the underlying graph
structure in the dynamic data. Our architecture comprises multiple novel
components: a new graph convolution operation, a graph inception layer,
learnable adjacency, and a learnable pooling function that yields a graph-level
embedding. We evaluate the proposed architecture on five benchmark emotion
recognition databases spanning three different modalities (video, audio, motion
capture), where each database captures one of the following emotional cues:
facial expressions, speech and body gestures. We achieve state-of-the-art
performance on all five databases outperforming several competitive baselines
and relevant existing methods. Our graph architecture shows superior
performance with significantly fewer parameters (compared to convolutional or
recurrent neural networks) promising its applicability to resource-constrained
devices.
- Abstract(参考訳): 人間の感情は、音声(言語)、ビデオ(表情)、モーションセンサー(身振り)など、様々な動的データモーダルを使って表現され、認識され、キャプチャされる。
本稿では,動的データを構造化グラフとしてモデル化することで,モーダル性に適応できる感情認識の一般化手法を提案する。
グラフアプローチの背後にある動機は、パフォーマンスを損なうことなくコンパクトなモデルを構築することだ。
最適グラフ構築の問題を緩和するために、我々はこれを共同グラフ学習と分類タスクとみなした。
この目的のために,感情の認識と動的データの基盤となるグラフ構造を共同で学習するLearable Graph Inception Network(L-GrIN)を提案する。
我々のアーキテクチャは、新しいグラフ畳み込み演算、グラフ開始層、学習可能な隣接性、およびグラフレベルの埋め込みをもたらす学習可能なプール機能を含む。
提案したアーキテクチャは,3つのモード(ビデオ,音声,モーションキャプチャ)にまたがる5種類の感情認識データベース上で評価される。
我々は,5つのデータベースの最先端性能を,競争力のあるベースラインと関連する既存手法より優れています。
我々のグラフアーキテクチャは、リソース制約のあるデバイスに適用可能であることを約束するパラメータ(畳み込みや繰り返しのニューラルネットワークと比較して)が著しく少ない、優れたパフォーマンスを示している。
関連論文リスト
- Signed Graph Neural Ordinary Differential Equation for Modeling
Continuous-time Dynamics [13.912268915939656]
グラフニューラルネットワークを通常の微分方程式と統合する一般的なアプローチは、有望な性能を示している。
符号付きグラフニューラル常微分方程式は,符号付き情報の誤キャプチャの限界に十分対処する。
提案したソリューションは、柔軟性と効率性の両方を誇っている。
論文 参考訳(メタデータ) (2023-12-18T13:45:33Z) - When Graph Data Meets Multimodal: A New Paradigm for Graph Understanding
and Reasoning [54.84870836443311]
本稿では,画像エンコーディングとマルチモーダル技術を統合することで,グラフデータの理解と推論を行う新しいパラダイムを提案する。
このアプローチは, GPT-4Vの高度な機能を利用して, 命令応答形式によるグラフデータの理解を可能にする。
研究は、このパラダイムを様々なグラフタイプで評価し、特に中国のOCRパフォーマンスと複雑な推論タスクにおいて、モデルの強みと弱みを強調した。
論文 参考訳(メタデータ) (2023-12-16T08:14:11Z) - State of the Art and Potentialities of Graph-level Learning [54.68482109186052]
グラフレベルの学習は、比較、回帰、分類など、多くのタスクに適用されている。
グラフの集合を学習する伝統的なアプローチは、サブストラクチャのような手作りの特徴に依存している。
ディープラーニングは、機能を自動的に抽出し、グラフを低次元表現に符号化することで、グラフレベルの学習をグラフの規模に適応させるのに役立っている。
論文 参考訳(メタデータ) (2023-01-14T09:15:49Z) - TCL: Transformer-based Dynamic Graph Modelling via Contrastive Learning [87.38675639186405]
我々は,動的に進化するグラフを連続的に扱う,TCLと呼ばれる新しいグラフニューラルネットワークアプローチを提案する。
我々の知る限りでは、これは動的グラフ上の表現学習にコントラスト学習を適用する最初の試みである。
論文 参考訳(メタデータ) (2021-05-17T15:33:25Z) - GraphFormers: GNN-nested Transformers for Representation Learning on
Textual Graph [53.70520466556453]
階層的にGNNコンポーネントを言語モデルのトランスフォーマーブロックと一緒にネストするGraphFormerを提案する。
提案したアーキテクチャでは、テキストエンコーディングとグラフ集約を反復的なワークフローに融合する。
さらに、プログレッシブ・ラーニング・ストラテジーを導入し、そのモデルが操作されたデータと元のデータに基づいて連続的に訓練され、グラフ上の情報を統合する能力を強化する。
論文 参考訳(メタデータ) (2021-05-06T12:20:41Z) - Compact Graph Architecture for Speech Emotion Recognition [0.0]
データを表現するコンパクトで効率的でスケーラブルな方法は、グラフの形式です。
グラフ畳み込みネットワーク(GCN)ベースのアーキテクチャを構築し,正確なグラフ畳み込みを実現する。
我々のモデルは、学習可能なパラメータが著しく少ない最先端のモデルに匹敵する性能を達成する。
論文 参考訳(メタデータ) (2020-08-05T12:09:09Z) - GraphOpt: Learning Optimization Models of Graph Formation [72.75384705298303]
本稿では,グラフ構造形成の暗黙的モデルを学ぶエンドツーエンドフレームワークを提案し,その基盤となる最適化機構を明らかにする。
学習した目的は、観測されたグラフプロパティの説明として機能し、ドメイン内の異なるグラフを渡すために自分自身を貸すことができる。
GraphOptは、グラフ内のリンク生成をシーケンシャルな意思決定プロセスとして、最大エントロピー逆強化学習アルゴリズムを用いて解決する。
論文 参考訳(メタデータ) (2020-07-07T16:51:39Z) - Temporal Graph Networks for Deep Learning on Dynamic Graphs [4.5158585619109495]
時系列グラフネットワーク(TGN)は,時系列イベントのシーケンスとして表される動的グラフの深層学習のための汎用的で効率的なフレームワークである。
メモリモジュールとグラフベースの演算子を組み合わせた新しい組み合わせにより、TGNは、計算効率が向上した以前のアプローチを大幅に上回ることができる。
論文 参考訳(メタデータ) (2020-06-18T16:06:18Z) - Tensor Graph Convolutional Networks for Multi-relational and Robust
Learning [74.05478502080658]
本稿では,テンソルで表されるグラフの集合に関連するデータから,スケーラブルな半教師付き学習(SSL)を実現するためのテンソルグラフ畳み込みネットワーク(TGCN)を提案する。
提案アーキテクチャは、標準的なGCNと比較して大幅に性能が向上し、最先端の敵攻撃に対処し、タンパク質間相互作用ネットワーク上でのSSL性能が著しく向上する。
論文 参考訳(メタデータ) (2020-03-15T02:33:21Z) - Unifying Graph Embedding Features with Graph Convolutional Networks for
Skeleton-based Action Recognition [18.001693718043292]
本稿では,人行動認識のためのグラフ畳み込みネットワークに15のグラフ埋め込み機能を組み込んだ新しいフレームワークを提案する。
我々のモデルは,NTU-RGB+D,Kineetics,SYSU-3Dという3つの大規模データセットで検証されている。
論文 参考訳(メタデータ) (2020-03-06T02:31:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。