論文の概要: PMC-Patients: A Large-scale Dataset of Patient Summaries and Relations
for Benchmarking Retrieval-based Clinical Decision Support Systems
- arxiv url: http://arxiv.org/abs/2202.13876v3
- Date: Tue, 18 Apr 2023 07:32:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 19:10:18.436560
- Title: PMC-Patients: A Large-scale Dataset of Patient Summaries and Relations
for Benchmarking Retrieval-based Clinical Decision Support Systems
- Title(参考訳): PMC-Patients: 患者サプリメントの大規模データセットと検索型臨床診断支援システムのベンチマーク
- Authors: Zhengyun Zhao, Qiao Jin, Fangyuan Chen, Tuorui Peng, Sheng Yu
- Abstract要約: ReCDS-PAR(Patent-to-Article Retrieval)とReCDS-PPR(Patent-to-Patient Retrieval)の2つのタスクを定義し,ベンチマークすることを目指している。
我々は, PubMed Centralの論文から, シンプルさを用いて患者要約を抽出し, PubMed citation graph を用いて患者-関節関係と患者-患者の類似性を定義する。
PMC-Patientsは167kの患者要約と3.1Mの患者列関連アノテーションと293kの患者列類似アノテーションを含んでいる。
- 参考スコア(独自算出の注目度): 0.9663374205119941
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: Retrieval-based Clinical Decision Support (ReCDS) can aid clinical
workflow by providing relevant literature and similar patients for a given
patient. However, the development of ReCDS systems has been severely obstructed
by the lack of diverse patient collections and publicly available large-scale
patient-level annotation datasets. In this paper, we aim to define and
benchmark two ReCDS tasks: Patient-to-Article Retrieval (ReCDS-PAR) and
Patient-to-Patient Retrieval (ReCDS-PPR) using a novel dataset called
PMC-Patients.
Methods: We extract patient summaries from PubMed Central articles using
simple heuristics and utilize the PubMed citation graph to define
patient-article relevance and patient-patient similarity. We also implement and
evaluate several ReCDS systems on the PMC-Patients benchmarks, including sparse
retrievers, dense retrievers, and nearest neighbor retrievers. We conduct
several case studies to show the clinical utility of PMC-Patients.
Results: PMC-Patients contains 167k patient summaries with 3.1M
patient-article relevance annotations and 293k patient-patient similarity
annotations, which is the largest-scale resource for ReCDS and also one of the
largest patient collections. Human evaluation and analysis show that
PMC-Patients is a diverse dataset with high-quality annotations. The evaluation
of various ReCDS systems shows that the PMC-Patients benchmark is challenging
and calls for further research.
Conclusion: We present PMC-Patients, a large-scale, diverse, and publicly
available patient summary dataset with the largest-scale patient-level relation
annotations. Based on PMC-Patients, we formally define two benchmark tasks for
ReCDS systems and evaluate various existing retrieval methods. PMC-Patients can
largely facilitate methodology research on ReCDS systems and shows real-world
clinical utility.
- Abstract(参考訳): 目的: Retrieval-based Clinical Decision Support (ReCDS) は、特定の患者に関連文献や類似の患者を提供することで、臨床ワークフローを支援することができる。
しかし, ReCDS システムの開発は, 多様な患者コレクションの欠如と, 大規模患者レベルのアノテーションデータセットの公開により, 著しく阻害されている。
本稿では, PMC-Patients と呼ばれる新しいデータセットを用いて, ReCDS-PAR (Patent-to-Patient Retrieval) と ReCDS-PPR (Patent-to-Patient Retrieval) の2つのタスクを定義し, ベンチマークすることを目的とする。
方法: 単純ヒューリスティックスを用いてPubMed Centralの論文から患者要約を抽出し, PubMed citation graphを用いて患者-関節関係と患者-患者の類似性を定義する。
PMC-Patientsベンチマークでは,スパースレトリバー,高密度レトリバー,近隣レトリバーなど,いくつかのReCDSシステムを実装・評価している。
PMC-Patientsの臨床的有用性を示すためにいくつかの症例研究を行った。
結果:pmc患者は患者関連アノテーション3.1mと患者類似性アノテーション293kの167kのサマリーを持ち,recdの最大のリソースであり,患者のコレクションとしては最大である。
PMC-Patientsは高品質なアノテーションを備えた多様なデータセットである。
様々なReCDSシステムの評価は、PMC-Patientsベンチマークが困難であることを示し、さらなる研究を求めている。
結論:我々は,大規模で多様で広く利用可能な患者概要データセットであるpmc患者について紹介する。
PMC-Patientsに基づいて、ReCDSシステムのための2つのベンチマークタスクを正式に定義し、既存の検索手法を評価する。
PMC-Patientsは、ReCDSシステムの方法論研究を大いに促進し、現実の臨床的有用性を示す。
関連論文リスト
- TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Generating medically-accurate summaries of patient-provider dialogue: A
multi-stage approach using large language models [6.252236971703546]
効果的な要約は、対話におけるすべての医学的関連情報を一貫性と精度良く捉えることが要求される。
本稿では, 医療会話の要約問題に, タスクを, より小さな対話に基づくタスクに分解することで対処する。
論文 参考訳(メタデータ) (2023-05-10T08:48:53Z) - Toward Cohort Intelligence: A Universal Cohort Representation Learning
Framework for Electronic Health Record Analysis [15.137213823470544]
本稿では, 患者間の詳細なコホート情報を活用することで, EHR活用を促進するための共通コホート表現 lEarning (CORE) フレームワークを提案する。
COREは多様なバックボーンモデルに容易に適用でき、コホート情報を医療手法に注入してパフォーマンスを高める普遍的なプラグインフレームワークとして機能する。
論文 参考訳(メタデータ) (2023-04-10T09:12:37Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - SPeC: A Soft Prompt-Based Calibration on Performance Variability of
Large Language Model in Clinical Notes Summarization [50.01382938451978]
本稿では,ソフトプロンプトを用いたモデルに依存しないパイプラインを導入し,確率に基づく要約の利点を保ちながら分散を減少させる。
実験結果から,本手法は性能を向上するだけでなく,様々な言語モデルの分散を効果的に抑制することが明らかとなった。
論文 参考訳(メタデータ) (2023-03-23T04:47:46Z) - Modelling Patient Trajectories Using Multimodal Information [0.0]
本稿では,異なる種類の情報を組み合わせて臨床データの時間的側面を考慮した患者軌跡のモデル化手法を提案する。
本手法は, 予期せぬ患者寛解と疾患進行の2つの異なる臨床結果に基づいて検討した。
論文 参考訳(メタデータ) (2022-09-09T10:20:54Z) - SmartTriage: A system for personalized patient data capture,
documentation generation, and decision support [9.09817311390571]
我々は,電子カルテ(EMR)との緊密な双方向統合を通じて,従来の症状チェックを超える機械学習支援システムであるSmartTriageを開発した。
SmartTriageは、患者の主訴を自由テキストエントリから識別し、関連する症状学を得るために一連の個別の質問を行う。
患者固有のデータは、詳細なICD-10-CMコード、薬品、検査、画像の順序を予測するために使用される。
論文 参考訳(メタデータ) (2020-10-19T22:45:27Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Learning-based Computer-aided Prescription Model for Parkinson's
Disease: A Data-driven Perspective [61.70045118068213]
我々は、PD患者の症状と、神経科医が提供した処方薬を収集し、データセットを構築した。
そこで我々は、観察された症状と処方薬との関係を学習し、新しいコンピュータ支援処方薬モデルを構築した。
新来の患者に対しては、処方薬モデルにより、観察された症状に対して適切な処方薬を推奨できる(予測)。
論文 参考訳(メタデータ) (2020-07-31T14:34:35Z) - COMPOSE: Cross-Modal Pseudo-Siamese Network for Patient Trial Matching [70.08786840301435]
本稿では, CrOss-Modal PseudO-SiamEse Network (COMPOSE) を提案する。
実験の結果,患者基準マッチングでは98.0%,患者基準マッチングでは83.7%の精度でAUCに到達できることがわかった。
論文 参考訳(メタデータ) (2020-06-15T21:01:33Z) - Deep Representation Learning of Electronic Health Records to Unlock
Patient Stratification at Scale [0.5498849973527224]
ヘテロジニアスEHRを処理するためのディープラーニングに基づく教師なしフレームワークを提案する。
患者層形成を効果的かつ効果的に行うことができる患者表現を導出する。
論文 参考訳(メタデータ) (2020-03-14T00:04:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。