論文の概要: Core-set Selection Using Metrics-based Explanations (CSUME) for
multiclass ECG
- arxiv url: http://arxiv.org/abs/2205.14508v1
- Date: Sat, 28 May 2022 19:36:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-31 16:52:03.617171
- Title: Core-set Selection Using Metrics-based Explanations (CSUME) for
multiclass ECG
- Title(参考訳): マルチクラスECGのためのメトリクスベース説明(CSUME)を用いたコアセット選択
- Authors: Sagnik Dakshit, Barbara Mukami Maweu, Sristi Dakshit, Balakrishnan
Prabhakaran
- Abstract要約: 高品質なデータを選択することで、ディープラーニングモデルの性能が向上することを示す。
実験の結果,9.67%,8.69%の精度とリコール改善が得られた。
- 参考スコア(独自算出の注目度): 2.0520503083305073
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The adoption of deep learning-based healthcare decision support systems such
as the detection of irregular cardiac rhythm is hindered by challenges such as
lack of access to quality data and the high costs associated with the
collection and annotation of data. The collection and processing of large
volumes of healthcare data is a continuous process. The performance of
data-hungry Deep Learning models (DL) is highly dependent on the quantity and
quality of the data. While the need for data quantity has been established
through research adequately, we show how a selection of good quality data
improves deep learning model performance. In this work, we take
Electrocardiogram (ECG) data as a case study and propose a model performance
improvement methodology for algorithm developers, that selects the most
informative data samples from incoming streams of multi-class ECG data. Our
Core-Set selection methodology uses metrics-based explanations to select the
most informative ECG data samples. This also provides an understanding (for
algorithm developers) as to why a sample was selected as more informative over
others for the improvement of deep learning model performance. Our experimental
results show a 9.67% and 8.69% precision and recall improvement with a
significant training data volume reduction of 50%. Additionally, our proposed
methodology asserts the quality and annotation of ECG samples from incoming
data streams. It allows automatic detection of individual data samples that do
not contribute to model learning thus minimizing possible negative effects on
model performance. We further discuss the potential generalizability of our
approach by experimenting with a different dataset and deep learning
architecture.
- Abstract(参考訳): 不規則な心臓リズムの検出などの深層学習に基づく医療意思決定支援システムの導入は、品質データへのアクセスの欠如やデータの収集やアノテーションに関連する高コストといった課題によって妨げられている。
大量の医療データの収集と処理は継続的なプロセスである。
data-hungry deep learning model(dl)の性能は、データの量と品質に大きく依存する。
データ量の必要性は研究を通じて十分に確立されているものの,高品質なデータの選択によってディープラーニングモデルの性能が向上することを示す。
本研究では,心電図(ECG)データをケーススタディとして,マルチクラスの心電図データから最も情報性の高いデータサンプルを選択するアルゴリズム開発者のためのモデル性能改善手法を提案する。
当社のCore-Set選択手法は,メトリクスに基づく説明を用いて,最も情報性の高いECGデータサンプルを選択する。
これはまた、ディープラーニングモデルのパフォーマンス向上のために、サンプルが他よりも有益であると選択された理由に関する理解(アルゴリズム開発者にとって)を提供する。
実験の結果,9.67%と8.69%の精度とリコール改善が得られ,トレーニングデータボリュームは50%減少した。
さらに,提案手法は,データストリームからのECGサンプルの品質とアノテーションを主張する。
モデル学習に寄与しない個々のデータサンプルの自動検出を可能にし、モデルパフォーマンスに悪影響を最小化する。
さらに、異なるデータセットとディープラーニングアーキテクチャを実験することで、このアプローチの潜在的な一般化可能性についても論じる。
関連論文リスト
- A CLIP-Powered Framework for Robust and Generalizable Data Selection [51.46695086779598]
実世界のデータセットは、しばしば冗長でノイズの多いデータを含み、トレーニング効率とモデルパフォーマンスに悪影響を及ぼす。
データ選択は、データセット全体から最も代表的なサンプルを特定することを約束している。
より堅牢で一般化可能なサンプル選択にマルチモーダル情報を活用するCLIPを利用した新しいデータ選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-15T03:00:58Z) - JSCDS: A Core Data Selection Method with Jason-Shannon Divergence for Caries RGB Images-Efficient Learning [2.508255511130695]
ディープラーニングモデルのパフォーマンスは、高品質なデータに依存し、相当なトレーニングリソースを必要とする。
本稿では,Jensen-Shannon Divergence (JSCDS) を用いたコアデータ選択手法を提案する。
JSCDSは、予測性能と時間消費において、他のデータ選択方法よりも優れています。
論文 参考訳(メタデータ) (2024-06-29T08:19:25Z) - Self-Trained Model for ECG Complex Delineation [0.0]
心電図(ECG)のデライン化は、正確な診断で心臓科医を支援する上で重要な役割を担っている。
我々は,ECGデライン化のためのデータセットを導入し,大量のラベルのないECGデータを活用することを目的とした,新たな自己学習手法を提案する。
我々のアプローチでは、データセットでトレーニングされたニューラルネットワークを使用してラベルなしデータの擬似ラベル付けを行い、その後、新たにラベル付けされたサンプル上でモデルをトレーニングし、デライン化の品質を高める。
論文 参考訳(メタデータ) (2024-06-04T18:54:10Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - Which Augmentation Should I Use? An Empirical Investigation of Augmentations for Self-Supervised Phonocardiogram Representation Learning [5.438725298163702]
Contrastive Self-Supervised Learning (SSL)はラベル付きデータの不足に対する潜在的な解決策を提供する。
1次元心電図(PCG)分類におけるコントラスト学習の最適化を提案する。
トレーニング分布によっては、完全教師付きモデルの有効性が最大32%低下し、SSLモデルは最大10%低下し、場合によっては改善される。
論文 参考訳(メタデータ) (2023-12-01T11:06:00Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Learning brain MRI quality control: a multi-factorial generalization
problem [0.0]
本研究の目的は,MRIQCパイプラインの性能評価である。
分析はMRIQCの前処理ステップに焦点を合わせ、パイプラインをそれなしでテストした。
我々は、CATIデータセットのような異種集団のデータで訓練されたモデルが、目に見えないデータの最良のスコアを提供すると結論付けた。
論文 参考訳(メタデータ) (2022-05-31T15:46:44Z) - Improving the efficacy of Deep Learning models for Heart Beat detection
on heterogeneous datasets [0.0]
ヘテロジニアスデータセットにディープラーニングモデルを適用する際の問題点について検討する。
本研究では,健常者からのデータに基づいてトレーニングしたモデルの性能が,心疾患患者に適用した場合に低下することを示す。
次に、異なるデータセットにモデルを適応させるためのTransfer Learningの使用を評価します。
論文 参考訳(メタデータ) (2021-10-26T14:26:55Z) - Efficient training of lightweight neural networks using Online
Self-Acquired Knowledge Distillation [51.66271681532262]
オンライン自己獲得知識蒸留(OSAKD)は、ディープニューラルネットワークの性能をオンライン的に向上することを目的としている。
出力特徴空間におけるデータサンプルの未知確率分布を推定するために、k-nnノンパラメトリック密度推定手法を用いる。
論文 参考訳(メタデータ) (2021-08-26T14:01:04Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。