論文の概要: Classification of systolic murmurs in heart sounds using multiresolution complex Gabor dictionary and vision transformer
- arxiv url: http://arxiv.org/abs/2604.16563v1
- Date: Fri, 17 Apr 2026 09:46:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.074348
- Title: Classification of systolic murmurs in heart sounds using multiresolution complex Gabor dictionary and vision transformer
- Title(参考訳): マルチレゾリューション複合ガボル辞書と視覚変換器を用いた心臓音の収縮性大腿骨の分類
- Authors: Mahmoud Fakhry, Abeer FathAllah Brery,
- Abstract要約: 収縮性大腿骨(Systolic murmurs)は、心臓周期の収縮期に発生する余分な心臓音である。
本研究は, 特徴抽出モジュールを用いた下顎骨の自動分類システムについて, 続いて分類モデルを提案する。
- 参考スコア(独自算出の注目度): 0.8594140167290097
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Systolic murmurs are extra heart sounds that occur during the contraction phase of the cardiac cycle, often indicating heart abnormalities caused by turbulent blood flow. Their intensity, pitch, and quality vary, requiring precise identification for the accurate diagnosis of cardiac disorders. This study presents an automatic classification system for systolic murmurs using a feature extraction module, followed by a classification model. The feature extraction module employs complex orthogonal matching pursuit to project single or multiple murmur segments onto a redundant dictionary composed of multiresolution complex Gabor basis functions (GBFs). The resulting projection weights are split and reshaped into variable-resolution time--frequency feature matrices. Processing multiple segments of a single recording using a shared dictionary mitigates murmur variability. This is achieved by learning the weights for each segment while enforcing that they correspond to the same set of basis functions in the dictionary, promoting consistent time--frequency feature matrices. The classification model is built based on a vision transformer to process multiple input matrices of different resolutions by passing each through a convolutional neural network for patch tokenization. All embedding tokens are then concatenated to form a matrix and forwarded to an encoder layer that includes multihead attention, residual connections, and a convolutional network with a kernel size of one. This integration of multiresolution feature extraction with transformer-based feature classification enhances the accuracy and reliability of heart murmur identification. An experimental analysis of four types of systolic murmurs from the CirCor DigiScope dataset demonstrates the effectiveness of the system, achieving a classification accuracy of $95.96\%$.
- Abstract(参考訳): 収縮性大腿骨は、心臓循環の収縮期に発生する余分な心臓の音であり、しばしば乱流による心臓の異常を示す。
その強度、ピッチ、品質は様々であり、心臓疾患の正確な診断には正確な診断が必要である。
本研究は, 特徴抽出モジュールを用いた下顎骨の自動分類システムについて, 続いて分類モデルを提案する。
特徴抽出モジュールは、複雑な直交マッチング追跡を用いて、多重解像度複素ガボル基底関数(GBFs)からなる冗長辞書に単一のまたは複数のマーマーシャルセグメントを投影する。
得られた投影重みを可変分解能時間周波数特徴行列に分割・再生成する。共有辞書を用いて単一のレコードの複数のセグメントを処理することにより、各セグメントの重みを学習し、辞書内の同じ基底関数の集合に対応させ、一貫した時間周波数特徴行列を促進する。
分類モデルは視覚変換器に基づいて構築され、パッチトークン化のための畳み込みニューラルネットワークを通過して、異なる解像度の複数の入力行列を処理する。
すべての埋め込みトークンは連結されてマトリックスを形成し、マルチヘッドアテンション、残余接続、カーネルサイズ1の畳み込みネットワークを含むエンコーダ層に転送される。
このマルチレゾリューション特徴抽出とトランスフォーマーに基づく特徴分類の統合により、心室同定の精度と信頼性が向上する。
CirCor DigiScopeデータセットから得られた4種類の嚢胞性大腿骨の実験的解析により、システムの有効性が示され、分類精度は95.96 %$である。
関連論文リスト
- Disordered Dynamics in High Dimensions: Connections to Random Matrices and Machine Learning [52.26396748560348]
ランダム行列によって駆動される高次元力学系について概説する。
機械学習理論における学習と一般化の単純なモデルへの応用に焦点を当てる。
論文 参考訳(メタデータ) (2026-01-03T00:12:32Z) - MedSpaformer: a Transferable Transformer with Multi-granularity Token Sparsification for Medical Time Series Classification [25.47662257105448]
MedTS分類に適したトランスフォーマーベースのフレームワークであるMedSpaformerを紹介する。
グローバルなコンテキストモデリングとトークンスペーシングを可能にする、スパーストークンベースのデュアルアテンション機構が組み込まれている。
我々のモデルは、教師あり学習下で7つの医療データセットで13のベースラインを上回ります。
論文 参考訳(メタデータ) (2025-03-19T13:22:42Z) - Prototype Learning Guided Hybrid Network for Breast Tumor Segmentation in DCE-MRI [58.809276442508256]
本稿では,畳み込みニューラルネットワーク(CNN)とトランスフォーマー層を組み合わせたハイブリッドネットワークを提案する。
プライベートおよびパブリックなDCE-MRIデータセットの実験結果から,提案したハイブリッドネットワークは最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-11T15:46:00Z) - DiffVein: A Unified Diffusion Network for Finger Vein Segmentation and
Authentication [50.017055360261665]
DiffVeinは、静脈分割と認証タスクを同時に処理する統合拡散モデルベースのフレームワークである。
これら2つのブランチ間の機能相互作用を改善するために,2つの特別なモジュールを導入する。
このようにして、我々のフレームワークは拡散とセグメンテーションの埋め込みの間の動的相互作用を可能にする。
論文 参考訳(メタデータ) (2024-02-03T06:49:42Z) - Dealing with Collinearity in Large-Scale Linear System Identification
Using Gaussian Regression [3.04585143845864]
複数の相互接続型動的システムからなるネットワークの推定について検討する。
我々は、任意のインパルス応答をゼロ平均ガウス過程の実現と見なすベイズ正規化フレームワークにキャストされた戦略を開発する。
我々はマルコフ連鎖モンテカルロスキームを設計し、コリナリティを効率的に扱うことでインパルス応答を後方に再構築する。
論文 参考訳(メタデータ) (2023-02-21T19:35:47Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Combining Scatter Transform and Deep Neural Networks for Multilabel
Electrocardiogram Signal Classification [0.6117371161379209]
我々は、深い残留ニューラルネットワーク(ResNet)に、散乱変換と呼ばれる複素ウェーブレット変換の変種を組み込む。
このアプローチでは、挑戦検証スコアが0.640、完全テストスコアが0.485となり、公式ランキングで41中4位になった。
論文 参考訳(メタデータ) (2020-10-15T10:13:31Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。