論文の概要: PTB-XL-Image-17K: A Large-Scale Synthetic ECG Image Dataset with Comprehensive Ground Truth for Deep Learning-Based Digitization
- arxiv url: http://arxiv.org/abs/2602.07446v1
- Date: Sat, 07 Feb 2026 08:52:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.626857
- Title: PTB-XL-Image-17K: A Large-Scale Synthetic ECG Image Dataset with Comprehensive Ground Truth for Deep Learning-Based Digitization
- Title(参考訳): PTB-XL- Image-17K:Deep Learning-Based Digitizationのための包括的基底真実を用いた大規模合成ECG画像データセット
- Authors: Naqcho Ali Mehdi,
- Abstract要約: PTB-XL-Image-17Kは17,271個の高画質の12値のECG画像からなる完全合成ECG画像データセットである。
データセットは、平均処理時間1サンプルあたり1.35秒で100%の成功率を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electrocardiogram (ECG) digitization-converting paper-based or scanned ECG images back into time-series signals-is critical for leveraging decades of legacy clinical data in modern deep learning applications. However, progress has been hindered by the lack of large-scale datasets providing both ECG images and their corresponding ground truth signals with comprehensive annotations. We introduce PTB-XL-Image-17K, a complete synthetic ECG image dataset comprising 17,271 high-quality 12-lead ECG images generated from the PTB-XL signal database. Our dataset uniquely provides five complementary data types per sample: (1) realistic ECG images with authentic grid patterns and annotations (50% with visible grid, 50% without), (2) pixel-level segmentation masks, (3) ground truth time-series signals, (4) bounding box annotations in YOLO format for both lead regions and lead name labels, and (5) comprehensive metadata including visual parameters and patient information. We present an open-source Python framework enabling customizable dataset generation with controllable parameters including paper speed (25/50 mm/s), voltage scale (5/10 mm/mV), sampling rate (500 Hz), grid appearance (4 colors), and waveform characteristics. The dataset achieves 100% generation success rate with an average processing time of 1.35 seconds per sample. PTB-XL-Image-17K addresses critical gaps in ECG digitization research by providing the first large-scale resource supporting the complete pipeline: lead detection, waveform segmentation, and signal extraction with full ground truth for rigorous evaluation. The dataset, generation framework, and documentation are publicly available at https://github.com/naqchoalimehdi/PTB-XL-Image-17K and https://doi.org/10.5281/zenodo.18197519.
- Abstract(参考訳): 心電図(ECG)デジタル化変換 紙ベースまたはスキャンした心電図画像を時系列信号に戻すことは、現代のディープラーニングアプリケーションにおける数十年のレガシーな臨床データを活用する上で非常に重要である。
しかし、ECG画像とそれに対応する基底真理信号の両方に包括的なアノテーションを付加する大規模なデータセットが欠如しているため、進歩は妨げられている。
PTB-XL-Image-17Kは,PTB-XL信号データベースから生成された17,271個の高画質の12値のECG画像からなる完全合成ECG画像データセットである。
本データセットは,(1)実写のグリッドパターンとアノテーション(50%は可視的グリッド,50%は非可視的グリッド),(2)ピクセルレベルのセグメンテーションマスク,(3)地平線時系列信号,(4)リード領域とリード名ラベルのYOLO形式のボックスアノテーション,(5)視覚パラメータと患者情報を含む包括的なメタデータの5つの補完的なデータタイプを提供する。
紙の速度(25/50mm/s)、電圧スケール(5/10mm/mV)、サンプリングレート(500Hz)、グリッド外観(4色)、波形特性など、制御可能なパラメータでカスタマイズ可能なデータセット生成を可能にするオープンソースPythonフレームワークを提案する。
データセットは、平均処理時間1サンプルあたり1.35秒で100%の成功率を達成する。
PTB-XL-Image-17Kは、完全なパイプラインをサポートする最初の大規模リソースであるリード検出、波形分割、信号抽出を厳密な評価のために、ECGのデジタル化研究における重要なギャップに対処する。
データセット、生成フレームワーク、ドキュメントはhttps://github.com/naqchoalimehdi/PTB-XL-Image-17Kとhttps://doi.org/10.5281/zenodo.18 197519で公開されている。
関連論文リスト
- An Open-Source Python Framework and Synthetic ECG Image Datasets for Digitization, Lead and Lead Name Detection, and Overlapping Signal Segmentation [0.24578723416255746]
合成ECG画像データセットを生成するためのオープンソースのPythonフレームワークを提案する。
各種リード構成のECG画像と、ECGデジタル化のための時系列信号との組み合わせ、リード領域とリード名を検出するためのYOLOフォーマット境界ボックス付ECG画像、U-Netモデルと互換性のあるセグメンテーションマスク付きシングルリード画像の4つのオープンアクセスデータセットを生成した。
論文 参考訳(メタデータ) (2025-05-26T20:06:50Z) - emg2qwerty: A Large Dataset with Baselines for Touch Typing using Surface Electromyography [47.160223334501126]
emg2qwertyは、QWERTYキーボードでタッチ入力しながら手首に記録された非侵襲的筋電図信号の大規模なデータセットである。
1,135のセッションが108ユーザと346時間の録画にまたがっており、これまでで最大の公開データセットである。
sEMG信号のみを用いたキープレッシャの予測において,高いベースライン性能を示す。
論文 参考訳(メタデータ) (2024-10-26T05:18:48Z) - ECG-Image-Kit: A Synthetic Image Generation Toolbox to Facilitate Deep
Learning-Based Electrocardiogram Digitization [3.4579920352329787]
本稿では,時系列データからリアルなアーティファクトを合成したマルチリードECG画像を生成するオープンソースツールボックスであるECG-Image-Kitを紹介する。
ケーススタディでは、PhyloNet QTデータベースから、ECG-Image-Kitを使用して、21,801個のECGイメージのデータセットを作成しました。
このデータセット上で、従来のコンピュータビジョンとディープニューラルネットワークモデルを組み合わせて、合成画像を時系列データに変換するようにトレーニングしました。
論文 参考訳(メタデータ) (2023-07-04T22:42:55Z) - A Large Scale Homography Benchmark [52.55694707744518]
1DSfMデータセットから10万枚の画像から約1000個の平面が観測された3D, Pi3Dの平面の大規模データセットを示す。
また,Pi3Dを利用した大規模ホモグラフィ推定ベンチマークであるHEBを提案する。
論文 参考訳(メタデータ) (2023-02-20T14:18:09Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - CNN Filter Learning from Drawn Markers for the Detection of Suggestive
Signs of COVID-19 in CT Images [58.720142291102135]
畳み込みニューラルネットワーク(CNN)のフィルタを推定するために,大規模な注釈付きデータセットやバックプロパゲーションを必要としない手法を提案する。
少数のCT画像に対して、ユーザは、代表的な正常領域と異常領域にマーカーを描画する。
本発明の方法は、カーネルがマークされたものに似た拡張領域に特有な一連の畳み込み層からなる特徴抽出器を生成する。
論文 参考訳(メタデータ) (2021-11-16T15:03:42Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。