論文の概要: A Framework for Transparent Reporting of Data Quality Analysis Across the Clinical Electronic Health Record Data Lifecycle
- arxiv url: http://arxiv.org/abs/2603.00921v1
- Date: Sun, 01 Mar 2026 04:48:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.414366
- Title: A Framework for Transparent Reporting of Data Quality Analysis Across the Clinical Electronic Health Record Data Lifecycle
- Title(参考訳): 電子カルテデータライフサイクルにおけるデータ品質分析の透過的報告フレームワーク
- Authors: Melinda Wassell, Kerryn Butler-Henderson, Karin Verspoor,
- Abstract要約: データ品質(DQ)と二次データの透明性は、臨床AIモデルの採用を遅らせる重要な要因である。
本研究は,臨床電子健康記録(EHR)データライフサイクルにおけるDQアセスメントの透過的報告のための枠組みを開発する。
- 参考スコア(独自算出の注目度): 5.938947835838981
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Data quality (DQ) and transparency of secondary data are critical factors that delay the adoption of clinical AI models and affect clinician trust in them. Many DQ studies fail to clarify where, along the lifecycle, quality checks occur, leading to uncertainty about provenance and fitness for reuse. This study develops a framework for transparent reporting of DQ assessments across the clinical electronic health record (EHR) data lifecycle. The reporting framework was developed through iterative analysis to identify actors and phases of the clinical data lifecycle. The framework distinguishes between data-generating organizations and data-receiving organizations to allow users to map DQ parameters to stages across the data lifecycle. The framework defines 5 key lifecycle phases and multiple actors. When applied to the real-world dataset, the framework demonstrated applicability in revealing where DQ issues may originate. The framework provides a structured approach for reporting DQ assessments, which can enhance transparency regarding data fitness for reuse, supporting reliable clinical research, AI model development, and internal organisational governance. This work provides practical guidance for researchers to understand data provenance and for organisations to target DQ improvement efforts across the data lifecycle.
- Abstract(参考訳): データ品質(DQ)と二次データの透明性は、臨床AIモデルの採用を遅らせ、臨床医の信頼に影響を与える重要な要因である。
多くのDQ研究は、ライフサイクルに沿って品質チェックが発生するかを明らかにすることができず、再利用のための証明と適合性に関する不確実性につながります。
本研究は,臨床電子健康記録(EHR)データライフサイクルにおけるDQアセスメントの透過的報告のための枠組みを開発する。
報告フレームワークは、臨床データライフサイクルのアクターとフェーズを特定するために反復分析によって開発された。
このフレームワークは、データ生成組織とデータ受信組織を区別し、ユーザがDQパラメータをデータライフサイクルのステージにマップできるようにする。
このフレームワークは5つの重要なライフサイクルフェーズと複数のアクターを定義している。
現実世界のデータセットに適用すると、このフレームワークはDQ問題の起源を明らかにするための適用性を示した。
このフレームワークはDQアセスメントを報告するための構造化されたアプローチを提供し、再利用のためのデータ適合性に関する透明性を高め、信頼できる臨床研究、AIモデル開発、内部組織ガバナンスをサポートする。
この研究は、研究者がデータ証明を理解するための実践的なガイダンスを提供し、組織がデータライフサイクル全体にわたってDQ改善の取り組みを目標にしています。
関連論文リスト
- CURENet: Combining Unified Representations for Efficient Chronic Disease Prediction [24.569877750738286]
CURENetは、構造化されていない臨床ノート、検査結果、患者の時系列データを統合するマルチモーダルモデルである。
CURENetは、さまざまな臨床データ間の複雑な相互作用を捉え、慢性疾患のより信頼性の高い予測モデルを作成することができる。
論文 参考訳(メタデータ) (2025-11-14T15:52:22Z) - Timely Clinical Diagnosis through Active Test Selection [49.091903570068155]
本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。
LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。
我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文 参考訳(メタデータ) (2025-10-21T18:10:45Z) - A Semantic Framework for Patient Digital Twins in Chronic Care [0.0]
患者医療デジタルツイン(PMDT)は、生理的、精神社会的、行動的、ゲノム的な情報をコヒーレントなモデルに統合する。
PMDTはセマンティック・インターオペラビリティを確保し、自動推論をサポートし、さまざまな臨床コンテキストでの再利用を可能にする。
データ断片化とセマンティック標準化のギャップを埋めることによって、PMDTは、次世代デジタルヘルスエコシステムの検証された基盤を提供する。
論文 参考訳(メタデータ) (2025-10-10T08:34:55Z) - Retrieval-Augmented Framework for LLM-Based Clinical Decision Support [0.19999259391104388]
本稿では,大言語モデル(LLM)を用いた臨床意思決定支援システムを提案する。
このフレームワークは自然言語処理と構造化された臨床入力を統合し、文脈に関連のあるレコメンデーションを生成する。
本稿では,表現表現のアライメントや生成戦略など,システムの技術的コンポーネントについて概説する。
論文 参考訳(メタデータ) (2025-10-01T18:45:25Z) - A Comprehensive Review of Datasets for Clinical Mental Health AI Systems [55.67299586253951]
本稿では,AIを活用した臨床アシスタントの訓練・開発に関連する臨床精神保健データセットの総合的調査を行う。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
論文 参考訳(メタデータ) (2025-08-13T13:42:35Z) - Ensuring Reliability of Curated EHR-Derived Data: The Validation of Accuracy for LLM/ML-Extracted Information and Data (VALID) Framework [0.0]
大規模言語モデル(LLM)により抽出された臨床データの質を評価するための包括的枠組みを提案する。
このフレームワークは、専門家による抽象化に対する変数レベルのパフォーマンスベンチマーク、内部の一貫性と妥当性の自動検証、レプリケーション分析を統合している。
この多次元アプローチは、改善が必要な変数の同定、潜時エラーの体系的検出、および実世界の研究におけるデータセットの適合性確認を可能にする。
論文 参考訳(メタデータ) (2025-06-09T20:59:16Z) - CDE-Mapper: Using Retrieval-Augmented Language Models for Linking Clinical Data Elements to Controlled Vocabularies [0.59374762912328]
臨床データ要素の標準化(CDEs)は、様々な医療システムにまたがる一貫した総合的な患者情報を確保することを目的としている。
既存の方法は、様々な表現と複雑な構造のCDEを標準化する際にしばしば失敗し、臨床研究におけるデータ統合と相互運用性を妨げる。
CDE-Mapperは、CDEと制御語彙のリンクを自動化するために、大規模言語モデルと組み合わせた検索・拡張生成アプローチを活用する革新的なフレームワークである。
論文 参考訳(メタデータ) (2025-05-07T12:32:05Z) - FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - P-Transformer: A Prompt-based Multimodal Transformer Architecture For Medical Tabular Data [2.4688646371447898]
医用表データに特化して設計されたマルチモーダルアンダーライントランスフォーマアーキテクチャであるPTransformerを提案する。
このフレームワークは、構造化データと非構造化データの両方から、多彩なモダリティを調和した言語意味空間に効率的にエンコードする。
PTransformerは、RMSE/MAEで10.9%/11.0%、RMSE/MAEで0.5%/2.2%、BACC/AUROCで1.6%/0.8%の改善を実証した。
論文 参考訳(メタデータ) (2023-03-30T14:25:44Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。