論文の概要: A Comprehensive Evaluation of Augmentations for Robust OOD Self-Supervised Contrastive Phonocardiogram Representation Learning
- arxiv url: http://arxiv.org/abs/2312.00502v2
- Date: Mon, 18 Mar 2024 10:32:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-20 02:52:49.322228
- Title: A Comprehensive Evaluation of Augmentations for Robust OOD Self-Supervised Contrastive Phonocardiogram Representation Learning
- Title(参考訳): ロバストOOD自己監督型コントラスト心電図表現学習における拡張の包括的評価
- Authors: Aristotelis Ballas, Vasileios Papapanagiotou, Christos Diou,
- Abstract要約: 信号の一般化表現を学習することにより,1次元心電図(PCG)の異常を検出するための自己監督学習(SSL)を提案する。
実験により, トレーニング分布によっては, 完全に教師されたモデルの有効性が32%まで低下することを示した。
- 参考スコア(独自算出の注目度): 5.438725298163702
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the recent increase in research activity, deep-learning models have not yet been widely accepted in several real-world settings, such as medicine. The shortage of high-quality annotated data often hinders the development of robust and generalizable models, which do not suffer from degraded effectiveness when presented with newly-collected, out-of-distribution (OOD) datasets. Contrastive Self-Supervised Learning (SSL) offers a potential solution to labeled data scarcity, as it takes advantage of unlabeled data to increase model effectiveness and robustness. In this research, we propose applying contrastive SSL for detecting abnormalities in 1D phonocardiogram (PCG) samples by learning a generalized representation of the signal. Specifically, we perform an extensive comparative evaluation of a wide range of audio-based augmentations, evaluate trained classifiers on multiple datasets across different downstream tasks, and finally report on the impact of each augmentation in model training. We experimentally demonstrate that, depending on its training distribution, the effectiveness of a fully-supervised model can degrade up to 32% when evaluated on unseen data, while SSL models only lose up to 10% or even improve in some cases. We argue and experimentally demonstrate that, contrastive SSL pretraining can assist in providing robust classifiers which can generalize to unseen, OOD data, without relying on time- and labor-intensive annotation processes by medical experts. Furthermore, the proposed extensive evaluation protocol sheds light on the most promising and appropriate augmentations for robust PCG signal processing, by calculating their effect size on model training. Finally, we provide researchers and practitioners with a roadmap towards producing robust models for PCG classification, in addition to an open-source codebase for developing novel approaches.
- Abstract(参考訳): 近年の研究活動が増加しているにもかかわらず、深層学習モデルは医学などいくつかの現実世界では広く受け入れられていない。
高品質な注釈付きデータの不足は、しばしば堅牢で一般化可能なモデルの開発を妨げる。
Contrastive Self-Supervised Learning (SSL)は、ラベル付きデータの不足に対する潜在的な解決策を提供する。
本研究では,1D phonocardiogram (PCG) サンプルの異常検出のために,信号の一般化表現を学習してコントラッシブSSLを適用することを提案する。
具体的には、幅広いオーディオベース拡張の広範な比較評価を行い、複数の下流タスクにまたがる複数のデータセットにおける訓練された分類器の評価を行い、最終的にモデルトレーニングにおける各拡張の影響について報告する。
トレーニング分布によっては、完全教師付きモデルの有効性は、未確認データで評価すると最大32%低下し、SSLモデルは最大10%低下し、場合によっては改善可能であることを実験的に実証した。
我々は、対照的なSSL事前トレーニングが、医療専門家による時間的および労働集約的なアノテーションプロセスに頼ることなく、見つからないOODデータに一般化可能な堅牢な分類器を提供することを支援することを議論し、実験的に実証した。
さらに,提案プロトコルは,モデルトレーニングにおけるその効果の大きさを計算することにより,ロバストPCG信号処理における最も有望かつ適切な拡張点に光を当てる。
最後に、新しいアプローチを開発するためのオープンソースのコードベースに加えて、PCG分類のための堅牢なモデルを作成するためのロードマップを研究者や実践者に提供します。
関連論文リスト
- Evaluating the Impact of Data Augmentation on Predictive Model Performance [0.05624791703748109]
本稿では,データ拡張手法と予測性能への影響を体系的に比較する。
21種類の増幅法のうち、SMOTE-ENNサンプリングが最も優れ、平均AUCが0.01向上した。
いくつかの拡張技術は、予測性能を著しく低下させたり、ランダムな確率に関する性能変動を増大させたりした。
論文 参考訳(メタデータ) (2024-12-03T03:03:04Z) - Reducing self-supervised learning complexity improves weakly-supervised
classification performance in computational pathology [0.0]
自己教師付き学習(SSL)法は、注釈のないデータの大規模解析を可能にする。
本研究では、SSLの分類性能と、コンシューマグレードハードウェアの利用に関する複雑さについて検討した。
実験により,SSLトレーニング期間を90%短縮しつつ,下流分類性能を向上できることが実証された。
論文 参考訳(メタデータ) (2024-03-07T14:56:06Z) - Boosting Transformer's Robustness and Efficacy in PPG Signal Artifact
Detection with Self-Supervised Learning [0.0]
本研究は、自己教師付き学習(SSL)を用いて、このデータから潜伏した特徴を抽出することにより、豊富なラベル付きデータの未利用に対処する。
実験の結果,SSLはTransformerモデルの表現学習能力を大幅に向上させることがわかった。
このアプローチは、注釈付きデータがしばしば制限されるPICU環境において、より広範なアプリケーションに対して約束される。
論文 参考訳(メタデータ) (2024-01-02T04:00:48Z) - Self-Supervision for Tackling Unsupervised Anomaly Detection: Pitfalls
and Opportunities [50.231837687221685]
自己教師付き学習(SSL)は、機械学習とその多くの現実世界のアプリケーションに変化をもたらした。
非教師なし異常検出(AD)は、自己生成性擬似異常によりSSLにも乗じている。
論文 参考訳(メタデータ) (2023-08-28T07:55:01Z) - To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis [50.31589712761807]
大規模言語モデル(LLM)は、事前トレーニング中にトークンに悩まされていることで知られており、Web上の高品質なテキストデータは、LSMのスケーリング制限に近づいている。
本研究では,事前学習データの再学習の結果について検討し,モデルが過度に適合する可能性が示唆された。
第2に, マルチエポック劣化の原因となる要因について検討し, データセットのサイズ, モデルパラメータ, トレーニング目標など, 重要な要因について検討した。
論文 参考訳(メタデータ) (2023-05-22T17:02:15Z) - Improved Techniques for the Conditional Generative Augmentation of
Clinical Audio Data [36.45569352490318]
本稿では,学習したデータ分布からメルスペクトルを合成できる条件付き逆方向ニューラルネットワークによる拡張法を提案する。
提案手法は,従来の音質向上手法よりも優れていることを示す。
提案モデルは,臨床オーディオデータの増大における最先端の進歩と,臨床音響センシングシステムの設計におけるデータのボトルネックを改善する。
論文 参考訳(メタデータ) (2022-11-05T10:58:04Z) - Improving the efficacy of Deep Learning models for Heart Beat detection
on heterogeneous datasets [0.0]
ヘテロジニアスデータセットにディープラーニングモデルを適用する際の問題点について検討する。
本研究では,健常者からのデータに基づいてトレーニングしたモデルの性能が,心疾患患者に適用した場合に低下することを示す。
次に、異なるデータセットにモデルを適応させるためのTransfer Learningの使用を評価します。
論文 参考訳(メタデータ) (2021-10-26T14:26:55Z) - On the Robustness of Pretraining and Self-Supervision for a Deep
Learning-based Analysis of Diabetic Retinopathy [70.71457102672545]
糖尿病網膜症における訓練方法の違いによる影響を比較検討した。
本稿では,定量的性能,学習した特徴表現の統計,解釈可能性,画像歪みに対する頑健性など,さまざまな側面について検討する。
以上の結果から,ImageNet事前学習モデルでは,画像歪みに対する性能,一般化,堅牢性が著しく向上していることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T08:32:45Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z) - Generative Data Augmentation for Commonsense Reasoning [75.26876609249197]
G-DAUGCは、低リソース環境でより正確で堅牢な学習を実現することを目的とした、新しい生成データ拡張手法である。
G-DAUGCは、バックトランスレーションに基づく既存のデータ拡張手法を一貫して上回っている。
分析の結果,G-DAUGCは多種多様な流線型学習例を産出し,その選択と学習アプローチが性能向上に重要であることが示された。
論文 参考訳(メタデータ) (2020-04-24T06:12:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。