Fugu-MT 論文翻訳(概要): Elastic Net Regularization and Gabor Dictionary for Classification of Heart Sound Signals using Deep Learning

論文の概要: Elastic Net Regularization and Gabor Dictionary for Classification of Heart Sound Signals using Deep Learning

arxiv url: http://arxiv.org/abs/2604.12483v1
Date: Tue, 14 Apr 2026 09:09:30 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-15 19:11:32.366106
Title: Elastic Net Regularization and Gabor Dictionary for Classification of Heart Sound Signals using Deep Learning
Title（参考訳）: 深層学習を用いた心音信号分類のための弾性ネット正規化とガバー辞書
Authors: Mahmoud Fakhry, Ascensión Gallardo-Antolín,
Abstract要約: 5つの心臓弁膜状態の識別におけるディープラーニングネットワークの分類性能の評価を行った。心音信号とガボル原子のオーバーコンプリート辞書に基づいてフィッティングモデルを得る。最高の分類精度は980.95%$で、2番目のアーキテクチャで達成される。
参考スコア（独自算出の注目度）: 1.8907108368038215
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this article, we propose the optimization of the resolution of time-frequency atoms and the regularization of fitting models to obtain better representations of heart sound signals. This is done by evaluating the classification performance of deep learning (DL) networks in discriminating five heart valvular conditions based on a new class of time-frequency feature matrices derived from the fitting models. We inspect several combinations of resolution and regularization, and the optimal one is that provides the highest performance. To this end, a fitting model is obtained based on a heart sound signal and an overcomplete dictionary of Gabor atoms using elastic net regularization of linear models. We consider two different DL architectures, the first mainly consisting of a 1D convolutional neural network (CNN) layer and a long short-term memory (LSTM) layer, while the second is composed of 1D and 2D CNN layers followed by an LSTM layer. The networks are trained with two algorithms, namely stochastic gradient descent with momentum (SGDM) and adaptive moment (ADAM). Extensive experimentation has been conducted using a database containing heart sound signals of five heart valvular conditions. The best classification accuracy of $98.95\%$ is achieved with the second architecture when trained with ADAM and feature matrices derived from optimal models obtained with a Gabor dictionary consisting of atoms with high-time low-frequency resolution and imposing sparsity on the models.
Abstract（参考訳）: 本稿では、時間周波数の原子の分解能の最適化と適合モデルの正規化を提案し、心臓音信号のより良い表現を求める。適応モデルから得られた新しい時間周波数特徴行列に基づいて,5つの心臓弁膜状態の識別において,深層学習(DL)ネットワークの分類性能を評価する。分解能と正則化の組合せについて検討し、最も高い性能を提供するのが最適である。この目的のために、線形モデルの弾性ネット正規化を用いて、心臓音信号とガボル原子のオーバーコンプリート辞書に基づいてフィッティングモデルを得る。本稿では、主に1次元畳み込みニューラルネットワーク(CNN)層と長短期記憶(LSTM)層から構成されるDLアーキテクチャと、1次元CNN層と2次元CNN層から構成されるLSTM層とを考察する。ネットワークは、モーメント付き確率勾配降下(SGDM)と適応モーメント(ADAM)の2つのアルゴリズムで訓練される。 5つの心臓弁膜状態の心臓音信号を含むデータベースを用いて大規模な実験を行った。最高の分類精度は、ADAMで訓練されたときの第2のアーキテクチャと、高速低周波分解能の原子からなるガボル辞書で得られた最適モデルから得られる特徴行列によって達成される。

関連論文リスト

AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.525891360380285]
AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。 2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文参考訳（メタデータ） (2025-08-07T07:47:16Z)
Private Training & Data Generation by Clustering Embeddings [74.00687214400021]
差分プライバシー(DP)は、個々のデータを保護するための堅牢なフレームワークを提供する。本稿では,DP合成画像埋め込み生成のための新しい原理的手法を提案する。経験的に、合成的に生成された埋め込みに基づいて訓練された単純な2層ニューラルネットワークは、最先端(SOTA)分類の精度を達成する。
論文参考訳（メタデータ） (2025-06-20T00:17:14Z)
Classification of Heart Sounds Using Multi-Branch Deep Convolutional Network and LSTM-CNN [7.136933021609078]
本研究は, 心臓疾患の自動診断のための, 迅速かつ正確かつ費用対効果の高い手法を提供する新しいディープラーニングアーキテクチャを開発し, 評価する。まず,多様な畳み込みフィルタサイズを利用して人間の聴覚処理をエミュレートするマルチブランチディープ畳み込みニューラルネットワーク(MBDCN)と,特徴抽出のためのパワースペクトル入力の2つの革新的な手法を提案する。第二に、LSTMブロックをMBDCNに統合し、時間領域の特徴抽出を改善するLong Short-Term Memory-Convolutional Neural (LSCN)モデルである。
論文参考訳（メタデータ） (2024-07-15T13:02:54Z)
Continuous time recurrent neural networks: overview and application to forecasting blood glucose in the intensive care unit [56.801856519460465]
連続時間自己回帰リカレントニューラルネットワーク(Continuous Time Autoregressive Recurrent Neural Network, CTRNN)は、不規則な観測を考慮に入れたディープラーニングモデルである。重篤なケア環境下での血糖値の確率予測へのこれらのモデルの適用を実証する。
論文参考訳（メタデータ） (2023-04-14T09:39:06Z)
Bayesian Neural Network Language Modeling for Speech Recognition [59.681758762712754]
長期記憶リカレントニューラルネットワーク(LSTM-RNN)とトランスフォーマーで表される最先端のニューラルネットワーク言語モデル(NNLM)は非常に複雑になりつつある。本稿では,LSTM-RNN と Transformer LM の基盤となる不確実性を考慮するために,ベイズ学習フレームワークの全体構造を提案する。
論文参考訳（メタデータ） (2022-08-28T17:50:19Z)
GLEAM: Greedy Learning for Large-Scale Accelerated MRI Reconstruction [50.248694764703714]
アンロールされたニューラルネットワークは、最近最先端の加速MRI再構成を達成した。これらのネットワークは、物理ベースの一貫性とニューラルネットワークベースの正規化を交互に組み合わせることで、反復最適化アルゴリズムをアンロールする。我々は,高次元画像設定のための効率的なトレーニング戦略である加速度MRI再構成のためのグレディ・ラーニングを提案する。
論文参考訳（メタデータ） (2022-07-18T06:01:29Z)
Optimization of Residual Convolutional Neural Network for Electrocardiogram Classification [0.9281671380673306]
本稿では,2段階のリカレント1次元畳み込みニューラルネットワークモデル(R-1D-CNN)を提案する。第1段階では、残留畳み込み層と1次元畳み込みニューラルネットワーク層をトレーニングし、患者固有の心電図の特徴を学習する。 2番目のレベルは自動であり、提案アルゴリズムに基づくBOに基づいている。
論文参考訳（メタデータ） (2021-12-11T16:52:23Z)
Time-Frequency Localization Using Deep Convolutional Maxout Neural Network in Persian Speech Recognition [0.0]
一部の哺乳類の聴覚ニューロン系における時間周波数の柔軟性は、認識性能を向上させる。本稿では,ASR音響モデルにおける音声信号情報の時間的局所化のためのCNNに基づく構造を提案する。 TFCMNNモデルの平均認識スコアは、従来のモデルの平均よりも約1.6%高い。
論文参考訳（メタデータ） (2021-08-09T05:46:58Z)
Connecting Weighted Automata, Tensor Networks and Recurrent Neural Networks through Spectral Learning [58.14930566993063]
我々は、形式言語と言語学からの重み付き有限オートマトン(WFA)、機械学習で使用されるリカレントニューラルネットワーク、テンソルネットワークの3つのモデル間の接続を提示する。本稿では,連続ベクトル入力の列上に定義された線形2-RNNに対する最初の証明可能な学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-10-19T15:28:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。