論文の概要: EmotionNAS: Two-stream Neural Architecture Search for Speech Emotion
Recognition
- arxiv url: http://arxiv.org/abs/2203.13617v2
- Date: Fri, 9 Jun 2023 14:45:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-12 18:32:49.922468
- Title: EmotionNAS: Two-stream Neural Architecture Search for Speech Emotion
Recognition
- Title(参考訳): EmotionNAS:音声感情認識のための2ストリームニューラルアーキテクチャ探索
- Authors: Haiyang Sun, Zheng Lian, Bin Liu, Ying Li, Licai Sun, Cong Cai,
Jianhua Tao, Meng Wang, Yuan Cheng
- Abstract要約: 本稿では,2ストリームのニューラルアーキテクチャ探索フレームワークであるenquoteEmotionNASを提案する。
具体的には、入力として2つのストリーム特徴(例えば、手工芸品と深い特徴)を取り、次にNASを用いて各ストリームの最適構造を探索する。
実験の結果,本手法は手動設計モデルやNASモデルよりも優れていた。
- 参考スコア(独自算出の注目度): 48.71010404625924
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech emotion recognition (SER) is an important research topic in
human-computer interaction. Existing works mainly rely on human expertise to
design models. Despite their success, different datasets often require distinct
structures and hyperparameters. Searching for an optimal model for each dataset
is time-consuming and labor-intensive. To address this problem, we propose a
two-stream neural architecture search (NAS) based framework, called
\enquote{EmotionNAS}. Specifically, we take two-stream features (i.e.,
handcrafted and deep features) as the inputs, followed by NAS to search for the
optimal structure for each stream. Furthermore, we incorporate complementary
information in different streams through an efficient information supplement
module. Experimental results demonstrate that our method outperforms existing
manually-designed and NAS-based models, setting the new state-of-the-art
record.
- Abstract(参考訳): 音声感情認識(SER)は人間とコンピュータの相互作用において重要な研究課題である。
既存の作品は、主にモデルの設計に人間の専門知識に依存している。
その成功にもかかわらず、異なるデータセットは、しばしば異なる構造とハイパーパラメータを必要とする。
データセットごとに最適なモデルを探すのは、時間と労力を要する。
この問題に対処するため,我々は2ストリームニューラルネットワーク検索(nas)ベースのフレームワークである \enquote{emotionnas} を提案する。
具体的には、入力として2つのストリーム特徴(手工芸品と深い特徴)を、次にNASを用いて各ストリームの最適構造を探索する。
さらに,効率的な情報補完モジュールにより,異なるストリームに補完情報を組み込む。
実験の結果,本手法は既存の手作業で設計したnasベースのモデルよりも優れており,最新記録を樹立した。
関連論文リスト
- Fair Differentiable Neural Network Architecture Search for Long-Tailed Data with Self-Supervised Learning [0.0]
本稿では,NASの長期化データセットにおける探索・訓練性能の向上について検討する。
まず、NASに関する関連する研究と、長い尾を持つデータセットに対するディープラーニング手法について論じる。
次に、自己教師付き学習と公正な差別化可能なNASを統合したSSF-NASと呼ばれる既存の研究に焦点を当てる。
最後に,性能評価のためのCIFAR10-LTデータセットについて実験を行った。
論文 参考訳(メタデータ) (2024-06-19T12:39:02Z) - IDENAS: Internal Dependency Exploration for Neural Architecture Search [0.0]
内部依存に基づくニューラルアーキテクチャ探索(NAS)とフィーチャーセレクションは、このようなシナリオで有望なソリューションとして現れている。
本研究は、内部依存に基づくニューラルアーキテクチャ探索であるIDENASを提案し、NASと特徴選択を統合する。
本手法は1次元センサと2次元画像データを含む分類のための完全パラメータ空間の内部依存性についても検討する。
論文 参考訳(メタデータ) (2023-10-26T08:58:29Z) - Surrogate-assisted Multi-objective Neural Architecture Search for
Real-time Semantic Segmentation [11.866947846619064]
ニューラルアーキテクチャサーチ(NAS)は、アーキテクチャ設計を自動化するための有望な道として登場した。
セマンティックセグメンテーションにNASを適用する際の課題を解決するために,サロゲート支援多目的手法を提案する。
提案手法は,人手による設計と他のNAS手法による自動設計の両方により,既存の最先端アーキテクチャを著しく上回るアーキテクチャを同定することができる。
論文 参考訳(メタデータ) (2022-08-14T10:18:51Z) - UnrealNAS: Can We Search Neural Architectures with Unreal Data? [84.78460976605425]
ニューラルアーキテクチャサーチ(NAS)はディープニューラルネットワーク(DNN)の自動設計において大きな成功を収めた。
これまでの研究は、NASに地道ラベルを持つことの必要性を分析し、幅広い関心を喚起した。
NASが有効であるためには、実際のデータが必要であるかどうか、さらに疑問を呈する。
論文 参考訳(メタデータ) (2022-05-04T16:30:26Z) - Neural Architecture Search for Speech Emotion Recognition [72.1966266171951]
本稿では,SERモデルの自動構成にニューラルアーキテクチャサーチ(NAS)技術を適用することを提案する。
NASはモデルパラメータサイズを維持しながらSER性能(54.89%から56.28%)を向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-31T10:16:10Z) - NAS-TC: Neural Architecture Search on Temporal Convolutions for Complex
Action Recognition [45.168746142597946]
ニューラルアーキテクチャサーチ-時間畳み込み(NAS-TC)と呼ばれる新しい処理フレームワークを提案する。
第1段階では、古典的なCNNネットワークがバックボーンネットワークとして使われ、計算集約的な特徴抽出タスクが完了する。
第2段階では、セルへの簡単な縫合探索を用いて、比較的軽量な長時間時間依存情報抽出を完了させる。
論文 参考訳(メタデータ) (2021-03-17T02:02:11Z) - PV-NAS: Practical Neural Architecture Search for Video Recognition [83.77236063613579]
ビデオタスクのためのディープニューラルネットワークは高度にカスタマイズされており、そのようなネットワークの設計にはドメインの専門家と高価な試行錯誤テストが必要である。
ネットワークアーキテクチャ検索の最近の進歩により、画像認識性能は大幅に向上した。
本研究では,実用的ビデオニューラルアーキテクチャ探索(PV-NAS)を提案する。
論文 参考訳(メタデータ) (2020-11-02T08:50:23Z) - Hierarchical Neural Architecture Search for Deep Stereo Matching [131.94481111956853]
本稿では, ディープステレオマッチングのための最初のエンドツーエンド階層型NASフレームワークを提案する。
我々のフレームワークは、タスク固有の人間の知識をニューラルアーキテクチャ検索フレームワークに組み込んでいる。
KITTI stereo 2012、2015、Middleburyベンチマークで1位、SceneFlowデータセットで1位にランクインしている。
論文 参考訳(メタデータ) (2020-10-26T11:57:37Z) - Evaluating the Effectiveness of Efficient Neural Architecture Search for
Sentence-Pair Tasks [14.963150544536203]
ニューラルアーキテクチャサーチ(NAS)手法は、最近、様々な自然言語処理やコンピュータビジョンタスクにおいて、競争または最先端(SOTA)のパフォーマンスを達成した。
本研究では,SOTANASアルゴリズム(Efficient Neural Architecture Search, ENAS)の2つの文対タスクへの適用性について検討する。
論文 参考訳(メタデータ) (2020-10-08T20:26:34Z) - NAS-Navigator: Visual Steering for Explainable One-Shot Deep Neural
Network Synthesis [53.106414896248246]
本稿では,分析者がドメイン知識を注入することで,解のサブグラフ空間を効果的に構築し,ネットワーク探索をガイドするフレームワークを提案する。
このテクニックを反復的に適用することで、アナリストは、与えられたアプリケーションに対して最高のパフォーマンスのニューラルネットワークアーキテクチャに収束することができる。
論文 参考訳(メタデータ) (2020-09-28T01:48:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。