論文の概要: Differential Evolution Algorithm based Hyper-Parameters Selection of
Convolutional Neural Network for Speech Command Recognition
- arxiv url: http://arxiv.org/abs/2310.08914v1
- Date: Fri, 13 Oct 2023 07:38:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-16 13:50:18.760683
- Title: Differential Evolution Algorithm based Hyper-Parameters Selection of
Convolutional Neural Network for Speech Command Recognition
- Title(参考訳): 音声コマンド認識のための畳み込みニューラルネットワークのハイパーパラメータ選択に基づく差分進化アルゴリズム
- Authors: Sandipan Dhar, Anuvab Sen, Aritra Bandyopadhyay, Nanda Dulal Jana,
Arjun Ghosh, Zahra Sarayloo
- Abstract要約: 音声コマンド認識(SCR)は、IoTデバイスやアシスト技術など、さまざまなアプリケーションに不可欠である。
SCRタスクにおける畳み込みニューラルネットワーク(CNN)の約束にもかかわらず、その有効性はハイパーパラメータの選択に大きく依存している。
本稿では,SCRタスクの性能向上を目的とした差分進化(DE)アルゴリズムに基づくCNNのハイパーパラメータ選択手法を提案する。
- 参考スコア(独自算出の注目度): 11.541252326816975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech Command Recognition (SCR), which deals with identification of short
uttered speech commands, is crucial for various applications, including IoT
devices and assistive technology. Despite the promise shown by Convolutional
Neural Networks (CNNs) in SCR tasks, their efficacy relies heavily on
hyper-parameter selection, which is typically laborious and time-consuming when
done manually. This paper introduces a hyper-parameter selection method for
CNNs based on the Differential Evolution (DE) algorithm, aiming to enhance
performance in SCR tasks. Training and testing with the Google Speech Command
(GSC) dataset, the proposed approach showed effectiveness in classifying speech
commands. Moreover, a comparative analysis with Genetic Algorithm based
selections and other deep CNN (DCNN) models highlighted the efficiency of the
proposed DE algorithm in hyper-parameter selection for CNNs in SCR tasks.
- Abstract(参考訳): 短発話音声コマンドの識別を扱う音声コマンド認識(scr)は,iotデバイスやアシスト技術など,さまざまなアプリケーションにおいて重要である。
SCRタスクにおける畳み込みニューラルネットワーク(CNN)の約束にもかかわらず、その有効性はハイパーパラメータの選択に大きく依存している。
本稿では,SCRタスクの性能向上を目的とした差分進化(DE)アルゴリズムに基づくCNNのハイパーパラメータ選択手法を提案する。
Google Speech Command(GSC)データセットによるトレーニングとテストを行い、提案手法は音声コマンドの分類に有効であることを示した。
さらに、遺伝的アルゴリズムに基づく選択と他の深層cnn(dcnn)モデルとの比較分析により、scrタスクにおけるcnnのハイパーパラメータ選択におけるdeアルゴリズムの有効性が示された。
関連論文リスト
- Enhancing CNN Classification with Lamarckian Memetic Algorithms and Local Search [0.0]
そこで本研究では,局所探索機能を組み込んだ2段階学習手法と集団最適化アルゴリズムを併用した新しい手法を提案する。
実験の結果,提案手法は最先端の勾配に基づく手法よりも優れていた。
論文 参考訳(メタデータ) (2024-10-26T17:31:15Z) - VQ-CTAP: Cross-Modal Fine-Grained Sequence Representation Learning for Speech Processing [81.32613443072441]
テキスト音声(TTS)、音声変換(VC)、自動音声認識(ASR)などのタスクでは、クロスモーダルな粒度(フレームレベル)シーケンス表現が望まれる。
本稿では,テキストと音声を共同空間に組み込むために,クロスモーダルシーケンストランスコーダを用いた量子コントラスト・トーケン・音響事前学習(VQ-CTAP)手法を提案する。
論文 参考訳(メタデータ) (2024-08-11T12:24:23Z) - Unveiling the Power of Sparse Neural Networks for Feature Selection [60.50319755984697]
スパースニューラルネットワーク(SNN)は、効率的な特徴選択のための強力なツールとして登場した。
動的スパーストレーニング(DST)アルゴリズムで訓練されたSNNは、平均して50%以上のメモリと55%以上のFLOPを削減できることを示す。
以上の結果から,DSTアルゴリズムで訓練したSNNによる特徴選択は,平均して50ドル以上のメモリと55%のFLOPを削減できることがわかった。
論文 参考訳(メタデータ) (2024-08-08T16:48:33Z) - Switchable Decision: Dynamic Neural Generation Networks [98.61113699324429]
本稿では,各データインスタンスのリソースを動的に割り当てることで,推論を高速化するスイッチブルな決定を提案する。
提案手法は, 同一の精度を維持しながら, 推論時のコスト低減に有効である。
論文 参考訳(メタデータ) (2024-05-07T17:44:54Z) - Semantic Communication Enabling Robust Edge Intelligence for
Time-Critical IoT Applications [87.05763097471487]
本稿では、時間クリティカルなIoTアプリケーションのためのセマンティック通信を用いて、堅牢なエッジインテリジェンスを設計することを目的とする。
本稿では,画像DCT係数が推定精度に与える影響を解析し,オフロードのためのチャネル非依存の有効性符号化を提案する。
論文 参考訳(メタデータ) (2022-11-24T20:13:17Z) - Speech Command Recognition in Computationally Constrained Environments
with a Quadratic Self-organized Operational Layer [92.37382674655942]
軽量ネットワークの音声コマンド認識能力を向上するネットワーク層を提案する。
この手法はテイラー展開と二次形式の概念を借用し、入力層と隠蔽層の両方における特徴のより良い表現を構築する。
このリッチな表現は、Google音声コマンド(GSC)と合成音声コマンド(SSC)データセットに関する広範な実験で示されているように、認識精度の向上をもたらす。
論文 参考訳(メタデータ) (2020-11-23T14:40:18Z) - A Study of Genetic Algorithms for Hyperparameter Optimization of Neural
Networks in Machine Translation [0.0]
遺伝的アルゴリズムを用いて,ダーウィンのファイトテスト理論の生存をモデルとした自動チューニング手法を提案する。
研究結果は,提案手法であるGAがハイパーパラメータのランダムな選択よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-15T02:24:16Z) - Robust Image Matching By Dynamic Feature Selection [17.3367710589782]
画像間の密接な対応を推定することは、長年続く課題である。
近年の研究では、畳み込みニューラルネットワーク(CNN)を導入し、高レベルの特徴マップを抽出し、特徴マッチングを通じて対応を見つける。
異なるスケールの機能を動的に選択することで、ロバストな特徴を生成する。
論文 参考訳(メタデータ) (2020-08-13T06:21:33Z) - AutoSpeech: Neural Architecture Search for Speaker Recognition [108.69505815793028]
本稿では,AutoSpeech という名称の話者認識タスクに対して,最初のニューラルアーキテクチャ探索アプローチを提案する。
提案アルゴリズムはまず,ニューラルネットワークの最適操作の組み合わせを特定し,その後,複数回重ねてCNNモデルを導出する。
得られたCNNアーキテクチャは,モデル複雑性を低減しつつ,VGG-M,ResNet-18,ResNet-34のバックボーンに基づく現在の話者認識システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-05-07T02:53:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。