論文の概要: A Hierarchical Computer Vision Pipeline for Physiological Data Extraction from Bedside Monitors
- arxiv url: http://arxiv.org/abs/2511.23355v1
- Date: Fri, 28 Nov 2025 17:02:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.99151
- Title: A Hierarchical Computer Vision Pipeline for Physiological Data Extraction from Bedside Monitors
- Title(参考訳): ベッドサイドモニターからの生理データ抽出のための階層型コンピュータビジョンパイプライン
- Authors: Vinh Chau, Khoa Le Dinh Van, Hon Huynh Ngoc, Binh Nguyen Thien, Hao Nguyen Thien, Vy Nguyen Quang, Phuc Vo Hong, Yen Lam Minh, Kieu Pham Tieu, Trinh Nguyen Thi Diem, Louise Thwaites, Hai Ho Bich,
- Abstract要約: 本稿では,ベッドサイドモニタ画面から直接,バイタルサインデータの自動キャプチャとデジタル化を行うコンピュータビジョンベースのパイプラインを提案する。
ベトナムのオープンソースコーパスと実世界集中治療ユニットから収集した6,498枚の画像のデータセットを用いて評価を行った。
- 参考スコア(独自算出の注目度): 0.0796870628261979
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many low-resource healthcare settings, bedside monitors remain standalone legacy devices without network connectivity, creating a persistent interoperability gap that prevents seamless integration of physiological data into electronic health record (EHR) systems. To address this challenge without requiring costly hardware replacement, we present a computer vision-based pipeline for the automated capture and digitisation of vital sign data directly from bedside monitor screens. Our method employs a hierarchical detection framework combining YOLOv11 for accurate monitor and region of interest (ROI) localisation with PaddleOCR for robust text extraction. To enhance reliability across variable camera angles and lighting conditions, a geometric rectification module standardizes the screen perspective before character recognition. We evaluated the system on a dataset of 6,498 images collected from open-source corpora and real-world intensive care units in Vietnam. The model achieved a mean Average Precision (mAP@50-95) of 99.5% for monitor detection and 91.5% for vital sign ROI localisation. The end-to-end extraction accuracy exceeded 98.9% for core physiological parameters, including heart rate, oxygen saturation SpO2, and arterial blood pressure. These results demonstrate that a lightweight, camera-based approach can reliably transform unstructured information from screen captures into structured digital data, providing a practical and scalable pathway to improve information accessibility and clinical documentation in low-resource settings.
- Abstract(参考訳): 多くの低リソースの医療環境において、ベッドサイドモニターは、ネットワーク接続のないスタンドアロンのレガシーデバイスのままであり、生理的データの電子健康記録(EHR)システムへのシームレスな統合を防止する、永続的な相互運用性のギャップを形成している。
ハードウェアの交換を必要とせずに、この課題に対処するために、ベッドサイドモニター画面から直接、バイタルサインデータの自動キャプチャとデジタル化のためのコンピュータビジョンベースのパイプラインを提案する。
本手法では, YOLOv11を精度の高いモニタ, 関心領域(ROI)のローカライゼーションに利用し, 頑健なテキスト抽出にPaddleOCRを用いる。
可変カメラアングル及び照明条件間の信頼性を高めるため、幾何学的補正モジュールは文字認識前の画面視界を標準化する。
ベトナムのオープンソースコーパスと実世界集中治療ユニットから収集した6,498枚の画像のデータセットを用いて評価を行った。
このモデルでは、平均平均精度(mAP@50-95)が99.5%のモニター検出、91.5%のバイタルサインROIローカライゼーションを達成した。
終末抽出精度は、心拍数、酸素飽和SpO2、動脈血圧などの中核生理指標の98.9%を上回った。
これらの結果は,非構造化情報を画面キャプチャから構造化されたデジタルデータに確実に変換し,低リソース環境における情報アクセス性や臨床ドキュメントを改善するための実用的でスケーラブルな経路を提供する。
関連論文リスト
- An Efficient Anomaly Detection Framework for Wireless Sensor Networks Using Markov Process [2.5777932046298786]
1次マルコフ連鎖モデルに基づく軽量かつ解釈可能な異常検出フレームワークが提案されている。
提案したフレームワークは、Intel Berkeley Research Labデータセットを使用して検証された。
論文 参考訳(メタデータ) (2025-11-01T10:19:00Z) - Enhancing ECG Classification Robustness with Lightweight Unsupervised Anomaly Detection Filters [39.9470953186283]
ウェアラブルを用いた連続心電図(ECG)モニタリングは、早期心血管疾患(CVD)検出に有意な可能性を秘めている。
リソース制約のある環境での自動分析のためのディープラーニングモデルをデプロイすることは、アウト・オブ・ディストリビューション(Out-of-Distribution)データによる信頼性上の課題に直面します。
本稿では,非教師付き異常検出(UAD)を,ロバスト性向上のための独立な上流フィルタリング機構として検討する。
論文 参考訳(メタデータ) (2025-10-30T13:54:37Z) - Lightweight Classifier for Detecting Intracranial Hemorrhage in Ultrasound Data [0.5461938536945722]
外傷性脳損傷(TBI)に続発する頭蓋内出血(ICH)は重要な診断課題である。
CT(Computed Tomography)やMRI(Magnetic Resonance Imaging)などの診断には、大きな限界がある。
超音波ティッシュパルサチリティイメージング(TPI)を用いた自動ICH検出のための機械学習手法の検討
論文 参考訳(メタデータ) (2025-10-22T09:04:42Z) - VAE-based Feature Disentanglement for Data Augmentation and Compression in Generalized GNSS Interference Classification [42.14439854721613]
干渉の正確な分類を可能にする重要な潜伏特徴を抽出するために, アンタングル化のための変分オートエンコーダ (VAE) を提案する。
提案するVAEは512から8,192の範囲のデータ圧縮率を実現し,99.92%の精度を実現している。
論文 参考訳(メタデータ) (2025-04-14T13:38:00Z) - Event-Driven Implementation of a Physical Reservoir Computing Framework for superficial EMG-based Gesture Recognition [2.222098162797332]
本稿では,表面筋電図(SEMG)データをイベント駆動方式で抽出することで,ジェスチャー認識のための新しいニューロモーフィックな実装手法を提案する。
このネットワークは、スパイキングニューラルネットワーク(SNN)の領域内で、回転ニューロン貯水池(Rotating Neuron Reservoir, RNR)と呼ばれる単純な構造化およびハードウェアフレンドリな物理貯留層コンピューティングフレームワークを実装して設計された。
提案システムはオープンアクセス型大規模sEMGデータベースで検証され,平均分類精度は74.6%,80.3%であった。
論文 参考訳(メタデータ) (2025-03-10T17:18:14Z) - Leveraging Cardiovascular Simulations for In-Vivo Prediction of Cardiac Biomarkers [43.17768785084301]
我々は、新たに構築された心臓シミュレーションの大規模なデータセットに基づいて、無傷神経後部推定器を訓練する。
シミュレーションデータと実世界の測定値との整合性を改善するために,要素モデリング効果を取り入れた。
提案するフレームワークは,実世界のデータに対する予測能力を向上するために,インバイブなデータソースをさらに統合することができる。
論文 参考訳(メタデータ) (2024-12-23T13:05:17Z) - KaLDeX: Kalman Filter based Linear Deformable Cross Attention for Retina Vessel Segmentation [46.57880203321858]
カルマンフィルタを用いた線形変形型クロスアテンション(LDCA)モジュールを用いた血管セグメンテーションのための新しいネットワーク(KaLDeX)を提案する。
我々のアプローチは、カルマンフィルタ(KF)ベースの線形変形可能な畳み込み(LD)とクロスアテンション(CA)モジュールの2つの重要なコンポーネントに基づいている。
提案手法は,網膜基底画像データセット(DRIVE,CHASE_BD1,STARE)とOCTA-500データセットの3mm,6mmを用いて評価した。
論文 参考訳(メタデータ) (2024-10-28T16:00:42Z) - RVD: A Handheld Device-Based Fundus Video Dataset for Retinal Vessel
Segmentation [42.145795119000056]
ハンドヘルドデバイスを用いた最初のビデオベース網膜データセットをデータ取得に適用する。
このデータセットは、50歳から75歳の415人の患者を含む4つのクリニックから収集された635のスマートフォンベースのファンドビデオで構成されている。
論文 参考訳(メタデータ) (2023-07-13T06:30:09Z) - PACMAN: a framework for pulse oximeter digit detection and reading in a
low-resource setting [0.42897826548373363]
新型コロナウイルスのパンデミックを受けて、患者は毎日の酸素飽和度(SpO2)とパルスレート(PR)値を健康モニタリングシステムに手動で入力する必要がある。
光文字認識(OCR)を用いた捕獲画像からの生理的価値の検出の試み
本研究の目的は,低リソース深層学習型コンピュータビジョンを用いたPACMANという新しいフレームワークを提案することである。
論文 参考訳(メタデータ) (2022-12-09T16:22:28Z) - Hybrid Artifact Detection System for Minute Resolution Blood Pressure
Signals from ICU [1.8374319565577155]
本稿では, 変分オートエンコーダと統計的検出成分を組み合わせたハイブリッド人工物検出システムについて検討する。
予備的な結果は,90%を超える感度と特異度を連続的に達成できることを示唆している。
論文 参考訳(メタデータ) (2022-03-11T14:36:52Z) - Multi-Task Neural Networks with Spatial Activation for Retinal Vessel
Segmentation and Artery/Vein Classification [49.64863177155927]
本稿では,網膜血管,動脈,静脈を同時に分割する空間活性化機構を備えたマルチタスクディープニューラルネットワークを提案する。
提案するネットワークは,容器分割における画素ワイド精度95.70%,A/V分類精度94.50%を実現している。
論文 参考訳(メタデータ) (2020-07-18T05:46:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。