論文の概要: Investigation into respiratory sound classification for an imbalanced data set using hybrid LSTM-KAN architectures
- arxiv url: http://arxiv.org/abs/2601.03610v1
- Date: Wed, 07 Jan 2026 05:37:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.281593
- Title: Investigation into respiratory sound classification for an imbalanced data set using hybrid LSTM-KAN architectures
- Title(参考訳): ハイブリッドLSTM-KANアーキテクチャを用いた不均衡データセットの呼吸音分類の検討
- Authors: Nithinkumar K., Anand R,
- Abstract要約: 本研究では,階級不均衡の緩和に着目した呼吸音分類について検討した。
本稿では,Long Short-Term Memory (LSTM) ネットワークとKolmogorov-Arnold Network (KAN) を組み合わせたハイブリッドディープラーニングモデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Respiratory sounds captured via auscultation contain critical clues for diagnosing pulmonary conditions. Automated classification of these sounds faces challenges due to subtle acoustic differences and severe class imbalance in clinical datasets. This study investigates respiratory sound classification with a focus on mitigating pronounced class imbalance. We propose a hybrid deep learning model that combines a Long Short-Term Memory (LSTM) network for sequential feature encoding with a Kolmogorov-Arnold Network (KAN) for classification. The model is integrated with a comprehensive feature extraction pipeline and targeted imbalance mitigation strategies. Experiments were conducted on a public respiratory sound database comprising six classes with a highly skewed distribution. Techniques such as focal loss, class-specific data augmentation, and Synthetic Minority Over-sampling Technique (SMOTE) were employed to enhance minority class recognition. The proposed Hybrid LSTM-KAN model achieves an overall accuracy of 94.6 percent and a macro-averaged F1 score of 0.703, despite the dominant COPD class accounting for over 86 percent of the data. Improved detection performance is observed for minority classes compared to baseline approaches, demonstrating the effectiveness of the proposed architecture for imbalanced respiratory sound classification.
- Abstract(参考訳): 聴診によって捉えた呼吸音は、肺の状態を診断するための重要な手がかりを含んでいる。
これらの音の自動分類は、微妙な音響的差異と臨床データセットの厳密なクラス不均衡による課題に直面している。
本研究では,階級不均衡の緩和に着目した呼吸音分類について検討した。
本稿では,Long Short-Term Memory (LSTM) ネットワークとKolmogorov-Arnold Network (KAN) を組み合わせたハイブリッドディープラーニングモデルを提案する。
このモデルは、包括的な特徴抽出パイプラインとターゲット不均衡緩和戦略と統合されている。
高度に歪んだ分布を持つ6つのクラスからなる公衆呼吸音データベース上で実験を行った。
SMOTE(Synthetic Minority Over-Sampling Technique)は、マイノリティの認知を高めるために、焦点損失、クラス固有のデータ拡張、およびSMOTE(Synthetic Minority Over-Sampling Technique)などの技術を用いている。
提案したHybrid LSTM-KANモデルは、データの86パーセント以上を占めるCOPDクラスにもかかわらず、全体的な精度94.6%、マクロ平均F1スコア0.703を達成する。
ベースライン手法と比較して,少数クラスでは検出性能が向上し,不均衡な呼吸音分類のためのアーキテクチャの有効性が実証された。
関連論文リスト
- Benchmarking Foundation Models and Parameter-Efficient Fine-Tuning for Prognosis Prediction in Medical Imaging [40.35825564674249]
本研究では,基礎モデルにおける伝達学習戦略の堅牢性と効率性を評価するための最初の構造化されたベンチマークを紹介する。
新型コロナウイルス(COVID-19)の胸部X線データセットが4つ使用されており、死亡率、重症度、入院率をカバーしている。
一般またはバイオメディカルデータセットで事前訓練されたImageNetとFMで事前訓練されたCNNは、完全な微調整、線形探索、パラメータ効率のよい手法を用いて適応された。
論文 参考訳(メタデータ) (2025-06-23T09:16:04Z) - CycleGuardian: A Framework for Automatic RespiratorySound classification Based on Improved Deep clustering and Contrastive Learning [9.215130010602634]
早期の呼吸器および肺疾患の診断において,聴診は重要な役割を担っている。
既存の最先端モデルは過剰なパラメータサイズに悩まされており、リソース制約のあるモバイルプラットフォームへのデプロイを妨げている。
改良されたディープクラスタリングとコントラスト学習に基づくフレームワークを提案する。
われわれはこのネットワークをAndroidデバイスに展開し、総合的なインテリジェントな呼吸音聴取システムを示す。
論文 参考訳(メタデータ) (2025-02-02T09:56:47Z) - Respiratory Disease Classification and Biometric Analysis Using Biosignals from Digital Stethoscopes [3.2458203725405976]
本研究は, 自動呼吸器疾患分類とバイオメトリックス解析にデジタル聴診器技術を活用した新しいアプローチを提案する。
各種呼吸状態の分類に機械学習モデルを訓練する。
本研究は,2値分類の精度(健康と疾患のバランス精度89%)と多値分類の精度(72%)を実現している。
論文 参考訳(メタデータ) (2023-09-12T23:54:00Z) - Patch-Mix Contrastive Learning with Audio Spectrogram Transformer on Respiratory Sound Classification [18.56326840619165]
本稿では,潜在空間における混合表現を識別するために,新規かつ効果的なパッチ・ミクス・コントラスト学習を提案する。
提案手法はICBHIデータセット上での最先端性能を実現し,4.08%の改善により先行先行スコアを上回った。
論文 参考訳(メタデータ) (2023-05-23T13:04:07Z) - Successive Subspace Learning for Cardiac Disease Classification with
Two-phase Deformation Fields from Cine MRI [36.044984400761535]
本研究は,CVD分類のための軽量な逐次サブスペース学習フレームワークを提案する。
解釈可能なフィードフォワードデザインに基づいており、心房と組み合わせている。
3D CNNベースのアプローチと比較して、我々のフレームワークは140$times$より少ないパラメータで優れた分類性能を実現する。
論文 参考訳(メタデータ) (2023-01-21T15:00:59Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z) - CNN-MoE based framework for classification of respiratory anomalies and
lung disease detection [33.45087488971683]
本稿では,聴取分析のための頑健な深層学習フレームワークを提示し,検討する。
呼吸周期の異常を分類し、呼吸音の記録から病気を検出することを目的としている。
論文 参考訳(メタデータ) (2020-04-04T21:45:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。