論文の概要: EmotionNAS: Two-stream Architecture Search for Speech Emotion
Recognition
- arxiv url: http://arxiv.org/abs/2203.13617v1
- Date: Fri, 25 Mar 2022 12:35:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-28 14:38:30.692230
- Title: EmotionNAS: Two-stream Architecture Search for Speech Emotion
Recognition
- Title(参考訳): EmotionNAS:音声感情認識のための2ストリームアーキテクチャ検索
- Authors: Haiyang Sun, Zheng Lian, Bin Liu, Ying Li, Licai Sun, Cong Cai,
Jianhua Tao, Meng Wang, Yuan Cheng
- Abstract要約: EmotionNASは、音声感情認識のためのニューラルネットワーク検索フレームワークである。
我々は、スペクトルとwav2vecの機能を入力として扱い、次にNASを用いてこれらの特徴を個別にネットワーク構造を最適化する。
IEMOCAPの実験結果から,本手法は既存のSERの最先端戦略よりも優れていることが示された。
- 参考スコア(独自算出の注目度): 48.71010404625924
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech emotion recognition (SER) is a crucial research topic in
human-computer interactions. Existing works are mainly based on manually
designed models. Despite their great success, these methods heavily rely on
historical experience, which are time-consuming but cannot exhaust all possible
structures. To address this problem, we propose a neural architecture search
(NAS) based framework for SER, called "EmotionNAS". We take spectrogram and
wav2vec features as the inputs, followed with NAS to optimize the network
structure for these features separately. We further incorporate complementary
information in these features through decision-level fusion. Experimental
results on IEMOCAP demonstrate that our method succeeds over existing
state-of-the-art strategies on SER.
- Abstract(参考訳): 音声感情認識(SER)は人間とコンピュータの相互作用において重要な研究課題である。
既存の作品は、主に手作業で設計されたモデルに基づいている。
その大きな成功にもかかわらず、これらの手法は歴史的経験に大きく依存しており、時間を要するが可能な全ての構造を使い果たせない。
そこで本研究では,serのためのニューラル・アーキテクチャ・サーチ(nas)ベースのフレームワーク「emotionnas」を提案する。
我々は、スペクトルとwav2vecの機能を入力として、次にNASを使ってこれらの特徴を個別にネットワーク構造を最適化する。
さらに,決定レベルの融合により,これらの特徴に補完的な情報を組み込む。
IEMOCAPの実験結果から,本手法は既存のSERの最先端戦略よりも優れていることが示された。
関連論文リスト
- Fair Differentiable Neural Network Architecture Search for Long-Tailed Data with Self-Supervised Learning [0.0]
本稿では,NASの長期化データセットにおける探索・訓練性能の向上について検討する。
まず、NASに関する関連する研究と、長い尾を持つデータセットに対するディープラーニング手法について論じる。
次に、自己教師付き学習と公正な差別化可能なNASを統合したSSF-NASと呼ばれる既存の研究に焦点を当てる。
最後に,性能評価のためのCIFAR10-LTデータセットについて実験を行った。
論文 参考訳(メタデータ) (2024-06-19T12:39:02Z) - IDENAS: Internal Dependency Exploration for Neural Architecture Search [0.0]
内部依存に基づくニューラルアーキテクチャ探索(NAS)とフィーチャーセレクションは、このようなシナリオで有望なソリューションとして現れている。
本研究は、内部依存に基づくニューラルアーキテクチャ探索であるIDENASを提案し、NASと特徴選択を統合する。
本手法は1次元センサと2次元画像データを含む分類のための完全パラメータ空間の内部依存性についても検討する。
論文 参考訳(メタデータ) (2023-10-26T08:58:29Z) - Surrogate-assisted Multi-objective Neural Architecture Search for
Real-time Semantic Segmentation [11.866947846619064]
ニューラルアーキテクチャサーチ(NAS)は、アーキテクチャ設計を自動化するための有望な道として登場した。
セマンティックセグメンテーションにNASを適用する際の課題を解決するために,サロゲート支援多目的手法を提案する。
提案手法は,人手による設計と他のNAS手法による自動設計の両方により,既存の最先端アーキテクチャを著しく上回るアーキテクチャを同定することができる。
論文 参考訳(メタデータ) (2022-08-14T10:18:51Z) - UnrealNAS: Can We Search Neural Architectures with Unreal Data? [84.78460976605425]
ニューラルアーキテクチャサーチ(NAS)はディープニューラルネットワーク(DNN)の自動設計において大きな成功を収めた。
これまでの研究は、NASに地道ラベルを持つことの必要性を分析し、幅広い関心を喚起した。
NASが有効であるためには、実際のデータが必要であるかどうか、さらに疑問を呈する。
論文 参考訳(メタデータ) (2022-05-04T16:30:26Z) - Neural Architecture Search for Speech Emotion Recognition [72.1966266171951]
本稿では,SERモデルの自動構成にニューラルアーキテクチャサーチ(NAS)技術を適用することを提案する。
NASはモデルパラメータサイズを維持しながらSER性能(54.89%から56.28%)を向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-31T10:16:10Z) - NAS-TC: Neural Architecture Search on Temporal Convolutions for Complex
Action Recognition [45.168746142597946]
ニューラルアーキテクチャサーチ-時間畳み込み(NAS-TC)と呼ばれる新しい処理フレームワークを提案する。
第1段階では、古典的なCNNネットワークがバックボーンネットワークとして使われ、計算集約的な特徴抽出タスクが完了する。
第2段階では、セルへの簡単な縫合探索を用いて、比較的軽量な長時間時間依存情報抽出を完了させる。
論文 参考訳(メタデータ) (2021-03-17T02:02:11Z) - PV-NAS: Practical Neural Architecture Search for Video Recognition [83.77236063613579]
ビデオタスクのためのディープニューラルネットワークは高度にカスタマイズされており、そのようなネットワークの設計にはドメインの専門家と高価な試行錯誤テストが必要である。
ネットワークアーキテクチャ検索の最近の進歩により、画像認識性能は大幅に向上した。
本研究では,実用的ビデオニューラルアーキテクチャ探索(PV-NAS)を提案する。
論文 参考訳(メタデータ) (2020-11-02T08:50:23Z) - Hierarchical Neural Architecture Search for Deep Stereo Matching [131.94481111956853]
本稿では, ディープステレオマッチングのための最初のエンドツーエンド階層型NASフレームワークを提案する。
我々のフレームワークは、タスク固有の人間の知識をニューラルアーキテクチャ検索フレームワークに組み込んでいる。
KITTI stereo 2012、2015、Middleburyベンチマークで1位、SceneFlowデータセットで1位にランクインしている。
論文 参考訳(メタデータ) (2020-10-26T11:57:37Z) - Evaluating the Effectiveness of Efficient Neural Architecture Search for
Sentence-Pair Tasks [14.963150544536203]
ニューラルアーキテクチャサーチ(NAS)手法は、最近、様々な自然言語処理やコンピュータビジョンタスクにおいて、競争または最先端(SOTA)のパフォーマンスを達成した。
本研究では,SOTANASアルゴリズム(Efficient Neural Architecture Search, ENAS)の2つの文対タスクへの適用性について検討する。
論文 参考訳(メタデータ) (2020-10-08T20:26:34Z) - NAS-Navigator: Visual Steering for Explainable One-Shot Deep Neural
Network Synthesis [53.106414896248246]
本稿では,分析者がドメイン知識を注入することで,解のサブグラフ空間を効果的に構築し,ネットワーク探索をガイドするフレームワークを提案する。
このテクニックを反復的に適用することで、アナリストは、与えられたアプリケーションに対して最高のパフォーマンスのニューラルネットワークアーキテクチャに収束することができる。
論文 参考訳(メタデータ) (2020-09-28T01:48:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。