論文の概要: A Large-Language Model Framework for Relative Timeline Extraction from PubMed Case Reports
- arxiv url: http://arxiv.org/abs/2504.12350v1
- Date: Tue, 15 Apr 2025 20:54:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-18 14:39:03.486961
- Title: A Large-Language Model Framework for Relative Timeline Extraction from PubMed Case Reports
- Title(参考訳): PubMed 事例報告からの相対的タイムライン抽出のための大規模言語モデルフレームワーク
- Authors: Jing Wang, Jeremy C Weiss,
- Abstract要約: 本稿では,ケースレポートを時系列化されたテキストイベントとタイムスタンプのペアに変換するシステムを提案する。
この研究は、時間分析にPMOAコーパスを活用するためのベンチマークとして機能する可能性がある。
- 参考スコア(独自算出の注目度): 10.869574822060553
- License:
- Abstract: Timing of clinical events is central to characterization of patient trajectories, enabling analyses such as process tracing, forecasting, and causal reasoning. However, structured electronic health records capture few data elements critical to these tasks, while clinical reports lack temporal localization of events in structured form. We present a system that transforms case reports into textual time series-structured pairs of textual events and timestamps. We contrast manual and large language model (LLM) annotations (n=320 and n=390 respectively) of ten randomly-sampled PubMed open-access (PMOA) case reports (N=152,974) and assess inter-LLM agreement (n=3,103; N=93). We find that the LLM models have moderate event recall(O1-preview: 0.80) but high temporal concordance among identified events (O1-preview: 0.95). By establishing the task, annotation, and assessment systems, and by demonstrating high concordance, this work may serve as a benchmark for leveraging the PMOA corpus for temporal analytics.
- Abstract(参考訳): 臨床イベントのタイミングは、患者の軌跡の特徴の中心であり、プロセストレース、予測、因果推論などの分析を可能にする。
しかし、構造化された電子健康記録はこれらのタスクに不可欠なデータ要素をほとんど取得していないが、臨床報告では構造化された形式の事象の時間的局所化が欠如している。
本稿では,ケースレポートを時系列化されたテキストイベントとタイムスタンプのペアに変換するシステムを提案する。
10個のランダムサンプリングされたPubMed Open- Access (PMOA) ケースレポート (N=152,974) とLLM間合意 (n=3,103, N=93) のマニュアルおよび大規模言語モデル (LLM) アノテーション (n=320, n=390) を比較した。
LLMモデルは中程度のイベントリコール(O1-preview: 0.80)を持つが、特定イベント間の時間的一致が高い(O1-preview: 0.95)。
タスク,アノテーション,評価システムを確立し,高一致を示すことにより,PMOAコーパスを時間的分析に活用するためのベンチマークとして機能する可能性がある。
関連論文リスト
- Unlocking Multimodal Integration in EHRs: A Prompt Learning Framework for Language and Time Series Fusion [27.70300880284899]
大規模言語モデル(LLM)は、視覚言語タスクにおいて顕著な性能を示してきたが、医療分野におけるそれらの応用はいまだ研究されていない。
ProMedTSは、データ型を統一するために、プロンプト誘導学習を利用する、新しい自己教師型マルチモーダルフレームワークである。
実世界のデータセットを用いた診断タスクにおけるProMedTSの評価を行い,本手法が常に最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-02-19T07:56:48Z) - Explaining Categorical Feature Interactions Using Graph Covariance and LLMs [18.44675735926458]
本稿では,Counter Trafficking Data Collaborativeからのグローバルな合成データセットに焦点を当てる。
2002年から2022年にかけて20,000件以上の匿名化された記録があり、それぞれのレコードに多くの分類学的特徴がある。
本稿では,重要な分類的特徴の相互作用を分析し,抽出するための高速でスケーラブルな手法を提案する。
論文 参考訳(メタデータ) (2025-01-24T21:41:26Z) - Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives [84.03001845263]
神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。
伝統的な物語分析は、しばしば単語の使用法や構文など、ミクロ構造における局所的な指標に焦点を当てる。
本稿では,話題の変化,時間的ダイナミクス,物語の時間的コヒーレンスを分析することによって,特定の認知的・言語的課題を解明することを提案する。
論文 参考訳(メタデータ) (2025-01-07T12:16:26Z) - GenDFIR: Advancing Cyber Incident Timeline Analysis Through Retrieval Augmented Generation and Large Language Models [0.08192907805418582]
デジタル法医学とインシデント応答(DFIR)におけるサイバータイムライン解析の重要性
伝統的な手法は、証拠の識別と特徴抽出のためにログやメタデータのような構造化された成果物に依存している。
本稿では,大規模言語モデル(LLM)を利用したフレームワークであるGenDFIR,特にゼロショットモードのLlama 3.1 8Bについて紹介し,Retrieval-Augmented Generation (RAG)エージェントと統合する。
論文 参考訳(メタデータ) (2024-09-04T09:46:33Z) - Analyzing Temporal Complex Events with Large Language Models? A Benchmark towards Temporal, Long Context Understanding [57.62275091656578]
時間的複合イベント(TCE)として、長い期間にわたって多くのニュース記事から構成される複合イベントについて述べる。
本稿では,Large Language Models (LLMs) を用いて,TCE内のイベントチェーンを系統的に抽出し,解析する手法を提案する。
論文 参考訳(メタデータ) (2024-06-04T16:42:17Z) - CenTime: Event-Conditional Modelling of Censoring in Survival Analysis [49.44664144472712]
CenTimeは、イベントへの時間を直接見積もる、サバイバル分析の新しいアプローチである。
本手法は,非検閲データが少ない場合でも,堅牢なイベント条件検閲機構を特徴とする。
以上の結果から,CenTimeは同等の性能を維持しつつ,死までの時間を予測する上で,最先端のパフォーマンスを提供することがわかった。
論文 参考訳(メタデータ) (2023-09-07T17:07:33Z) - CSDI: Conditional Score-based Diffusion Models for Probabilistic Time
Series Imputation [107.63407690972139]
Conditional Score-based Diffusion Model for Imputation (CSDI) は、観測データに条件付きスコアベース拡散モデルを利用する新しい時系列計算法である。
CSDIは、一般的なパフォーマンスメトリクスの既存の確率論的計算方法よりも40-70%改善されている。
さらに、Cは最先端の決定論的計算法と比較して誤差を5-20%削減する。
論文 参考訳(メタデータ) (2021-07-07T22:20:24Z) - Temporal Cascade and Structural Modelling of EHRs for Granular
Readmission Prediction [10.943928059802174]
本稿では,時間的カスケード関係をモデル化するための新しいモデルMEDCASを提案する。
MEDCASは、訪問タイプと時間ギャップをモデル化する点過程を、注目に基づくシーケンス・ツー・シーケンス学習モデルに統合する。
3つの実世界のEHRデータセットの実験を行い、ttexttMEDCASが両方のタスクで最先端のモデルより優れていることを示した。
論文 参考訳(メタデータ) (2021-02-04T13:02:04Z) - MSED: a multi-modal sleep event detection model for clinical sleep
analysis [62.997667081978825]
ポリソムノグラムで睡眠イベントを共同検出する,単一のディープニューラルネットワークアーキテクチャを設計した。
モデルの性能は,F1,精度,リコールスコア,および指標値と臨床値との相関で定量化した。
論文 参考訳(メタデータ) (2021-01-07T13:08:44Z) - Clinical Temporal Relation Extraction with Probabilistic Soft Logic
Regularization and Global Inference [50.029659413650194]
既存のメソッドは、高価な機能エンジニアリングを必要とするか、イベント間のグローバルな依存関係をモデル化できない。
本稿では,確率論的ソフト論理規則化とグローバル推論を用いた新しい臨床時間緩和法を提案する。
論文 参考訳(メタデータ) (2020-12-16T08:23:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。