論文の概要: Rene: A Pre-trained Multi-modal Architecture for Auscultation of Respiratory Diseases
- arxiv url: http://arxiv.org/abs/2405.07442v1
- Date: Mon, 13 May 2024 03:00:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-14 14:54:35.766090
- Title: Rene: A Pre-trained Multi-modal Architecture for Auscultation of Respiratory Diseases
- Title(参考訳): Rene: 呼吸器疾患の鎮静のためのトレーニング済みマルチモーダルアーキテクチャ
- Authors: Pengfei Zhang, Zhihang Zheng, Shichen Zhang, Minghao Yang, Shaojun Tang,
- Abstract要約: 本稿では,リアルタイム臨床診断における理解能力の低下と過小評価の課題に対処する,Reneという,革新的なマルチモーダルディープラーニングアーキテクチャを提案する。
両スレッド設計と同時マイクロホン記録とリアルタイム動的復号のための圧縮モデルパラメータを特徴とする,Reneアーキテクチャに基づくリアルタイム呼吸音識別システムを開発した。
- 参考スコア(独自算出の注目度): 5.810320353233697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study presents a novel methodology utilizing a pre-trained speech recognition model for processing respiratory sound data. By incorporating medical record information, we introduce an innovative multi-modal deep-learning architecture, named Rene, which addresses the challenges of poor interpretability and underperformance in real-time clinical diagnostic response observed in previous respiratory disease-focused models. The proposed Rene architecture demonstrated significant improvements of 10.24%, 16.15%, 15.29%, and 18.90% respectively, compared to the baseline across four tasks related to respiratory event detection and audio record classification on the SPRSound database. In patient disease prediction tests on the ICBHI database, the architecture exhibited improvements of 23% in the mean of average score and harmonic score compared to the baseline. Furthermore, we developed a real-time respiratory sound discrimination system based on the Rene architecture, featuring a dual-thread design and compressed model parameters for simultaneous microphone recording and real-time dynamic decoding. Employing state-of-the-art Edge AI technology, this system enables rapid and accurate responses for respiratory sound auscultation, facilitating deployment on wearable clinical detection devices to capture incremental data, which can be synergistically evolved with large-scale models deployed on cloud servers for downstream tasks.
- Abstract(参考訳): 本研究では,事前学習した音声認識モデルを用いて呼吸音データを処理する手法を提案する。
医療記録情報を組み込むことにより,従来の呼吸器疾患に焦点を絞ったリアルタイム臨床診断応答における,理解性の低下と過小評価の課題に対処する,Reneという,革新的なマルチモーダル深層学習アーキテクチャを導入する。
提案されたReneアーキテクチャは、それぞれ10.24%、16.15%、15.29%、および18.90%の大幅な改善を示した。
ICBHIデータベースの患者疾患予測試験では,平均スコアの平均値とハーモニックスコアの平均値が23%向上した。
さらに,同時マイクロホン記録とリアルタイム動的復号のための2スレッド設計と圧縮モデルパラメータを特徴とするReneアーキテクチャに基づく実時間呼吸音識別システムを開発した。
最先端のEdge AI技術を利用することで、呼吸音の聴取に対する迅速かつ正確な応答を可能にし、ウェアラブルな臨床検出デバイスへの展開を容易にしてインクリメンタルデータをキャプチャし、ダウンストリームタスクのためにクラウドサーバにデプロイされた大規模なモデルと相乗的に進化させることができる。
関連論文リスト
- Towards Open Respiratory Acoustic Foundation Models: Pretraining and Benchmarking [27.708473070563013]
呼吸器オーディオは幅広い医療応用の予測力を持っているが、現在はまだ探索されていない。
OPERA(OPEn Respiratory Acoustic foundation model Pretraining and benchmarking system)を紹介する。
論文 参考訳(メタデータ) (2024-06-23T16:04:26Z) - RepAugment: Input-Agnostic Representation-Level Augmentation for Respiratory Sound Classification [2.812716452984433]
本稿では,プレトレーニング音声モデルの呼吸音分類への応用について検討する。
音声と肺の音響サンプルの間には特徴的ギャップがあり,このギャップを埋めるためには,データ拡張が不可欠である。
入力に依存しない表現レベルの拡張手法であるRepAugmentを提案する。
論文 参考訳(メタデータ) (2024-05-05T16:45:46Z) - Adversarial Fine-tuning using Generated Respiratory Sound to Address
Class Imbalance [1.3686993145787067]
本稿では,条件付きニューラルボコーダとして音声拡散モデルを用いて,不均衡な呼吸音データを増やすための簡単なアプローチを提案する。
また, 合成音と実呼吸音の特徴を整合させ, 呼吸音の分類性能を向上させるために, 簡易かつ効果的な対向微調整法を実証した。
論文 参考訳(メタデータ) (2023-11-11T05:02:54Z) - SMRD: SURE-based Robust MRI Reconstruction with Diffusion Models [76.43625653814911]
拡散モデルは、高い試料品質のため、MRIの再生を加速するために人気を博している。
推論時に柔軟にフォワードモデルを組み込んだまま、効果的にリッチなデータプリエントとして機能することができる。
拡散モデル(SMRD)を用いたSUREに基づくMRI再構成を導入し,テスト時の堅牢性を向上する。
論文 参考訳(メタデータ) (2023-10-03T05:05:35Z) - Using BOLD-fMRI to Compute the Respiration Volume per Time (RTV) and
Respiration Variation (RV) with Convolutional Neural Networks (CNN) in the
Human Connectome Development Cohort [55.41644538483948]
本研究では, RVとRVTの2つの呼吸対策を再現するための1次元CNNモデルを提案する。
その結果、CNNはBOLD信号の静止から情報的特徴を捉え、現実的なRVとRVTのタイムリーを再構築できることがわかった。
論文 参考訳(メタデータ) (2023-07-03T18:06:36Z) - Patch-Mix Contrastive Learning with Audio Spectrogram Transformer on
Respiratory Sound Classification [19.180927437627282]
本稿では,潜在空間における混合表現を識別するために,新規かつ効果的なパッチ・ミクス・コントラスト学習を提案する。
提案手法はICBHIデータセット上での最先端性能を実現し,4.08%の改善により先行先行スコアを上回った。
論文 参考訳(メタデータ) (2023-05-23T13:04:07Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Detecting COVID-19 from Breathing and Coughing Sounds using Deep Neural
Networks [68.8204255655161]
私たちは、Convolutional Neural Networksのアンサンブルを適応させて、スピーカーがCOVID-19に感染しているかどうかを分類します。
最終的には、74.9%のUnweighted Average Recall(UAR)、またはニューラルネットワークをアンサンブルすることで、ROC曲線(AUC)の80.7%を達成する。
論文 参考訳(メタデータ) (2020-12-29T01:14:17Z) - Deep Learning for Automatic Pneumonia Detection [72.55423549641714]
肺炎は小児の主要な死因であり、世界でも最多死亡率の1つである。
コンピュータ支援診断システムは診断精度を向上させる可能性を示した。
本研究では, 単発検出, 圧縮励起深部畳み込みニューラルネットワーク, 拡張, マルチタスク学習に基づく肺炎領域検出のための計算手法を開発した。
論文 参考訳(メタデータ) (2020-05-28T10:54:34Z) - Robust Deep Learning Framework For Predicting Respiratory Anomalies and
Diseases [26.786743524562322]
本稿では,呼吸音の記録から呼吸器疾患を検出するための,堅牢な深層学習フレームワークを提案する。
バックエンドのディープラーニングモデルは、特徴を呼吸器疾患または異常のクラスに分類する。
ICBHIベンチマークを用いて実験を行い, 音の分類能力を評価する。
論文 参考訳(メタデータ) (2020-01-21T15:26:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。