論文の概要: A Large-Language Model Framework for Relative Timeline Extraction from PubMed Case Reports
- arxiv url: http://arxiv.org/abs/2504.12350v1
- Date: Tue, 15 Apr 2025 20:54:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-26 03:27:02.425709
- Title: A Large-Language Model Framework for Relative Timeline Extraction from PubMed Case Reports
- Title(参考訳): PubMed 事例報告からの相対的タイムライン抽出のための大規模言語モデルフレームワーク
- Authors: Jing Wang, Jeremy C Weiss,
- Abstract要約: 本稿では,ケースレポートを時系列化されたテキストイベントとタイムスタンプのペアに変換するシステムを提案する。
この研究は、時間分析にPMOAコーパスを活用するためのベンチマークとして機能する可能性がある。
- 参考スコア(独自算出の注目度): 10.869574822060553
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Timing of clinical events is central to characterization of patient trajectories, enabling analyses such as process tracing, forecasting, and causal reasoning. However, structured electronic health records capture few data elements critical to these tasks, while clinical reports lack temporal localization of events in structured form. We present a system that transforms case reports into textual time series-structured pairs of textual events and timestamps. We contrast manual and large language model (LLM) annotations (n=320 and n=390 respectively) of ten randomly-sampled PubMed open-access (PMOA) case reports (N=152,974) and assess inter-LLM agreement (n=3,103; N=93). We find that the LLM models have moderate event recall(O1-preview: 0.80) but high temporal concordance among identified events (O1-preview: 0.95). By establishing the task, annotation, and assessment systems, and by demonstrating high concordance, this work may serve as a benchmark for leveraging the PMOA corpus for temporal analytics.
- Abstract(参考訳): 臨床イベントのタイミングは、患者の軌跡の特徴の中心であり、プロセストレース、予測、因果推論などの分析を可能にする。
しかし、構造化された電子健康記録はこれらのタスクに不可欠なデータ要素をほとんど取得していないが、臨床報告では構造化された形式の事象の時間的局所化が欠如している。
本稿では,ケースレポートを時系列化されたテキストイベントとタイムスタンプのペアに変換するシステムを提案する。
10個のランダムサンプリングされたPubMed Open- Access (PMOA) ケースレポート (N=152,974) とLLM間合意 (n=3,103, N=93) のマニュアルおよび大規模言語モデル (LLM) アノテーション (n=320, n=390) を比較した。
LLMモデルは中程度のイベントリコール(O1-preview: 0.80)を持つが、特定イベント間の時間的一致が高い(O1-preview: 0.95)。
タスク,アノテーション,評価システムを確立し,高一致を示すことにより,PMOAコーパスを時間的分析に活用するためのベンチマークとして機能する可能性がある。
関連論文リスト
- DENSE: Longitudinal Progress Note Generation with Temporal Modeling of Heterogeneous Clinical Notes Across Hospital Visits [0.1578515540930834]
プログレッシブノートは電子健康記録で最も臨床的に意味のあるアーティファクトの1つである。
その重要性にもかかわらず、それらは大規模なEHRデータセットでは不足している。
DENSEは、医師が過去の出会いを参照する方法をシミュレートすることで、臨床文書と整合するように設計されたシステムである。
論文 参考訳(メタデータ) (2025-07-18T17:00:27Z) - Reading Between the Lines: Combining Pause Dynamics and Semantic Coherence for Automated Assessment of Thought Disorder [8.239710313549466]
本研究では,ポーズ機能と3つのデータセット間のセマンティックコヒーレンスメトリクスを統合する。
重要な発見は、停止機能だけで形式的思考障害(FTD)の重症度を確実に予測できることである。
これらの結果から,時間的分析と意味的分析を組み合わせたフレームワークが,非編成音声の評価を洗練するためのロードマップを提供する可能性が示唆された。
論文 参考訳(メタデータ) (2025-07-17T22:00:16Z) - PMOA-TTS: Introducing the PubMed Open Access Textual Times Series Corpus [9.924632472835551]
PMOA-TTSは124,699の注釈付きPubMed Open Accessケースレポートの最初の公開データセットである。
Llama 3.3にフィルターを併用し, 単発症例の報告を同定し, 即時抽出を行った。
タイムラインの質を評価するために,3つの指標を用いてクリニカル・カレード・リファレンス・セットに対して評価を行った。
論文 参考訳(メタデータ) (2025-05-23T18:01:09Z) - MIMIC-\RNum{4}-Ext-22MCTS: A 22 Millions-Event Temporal Clinical Time-Series Dataset with Relative Timestamp for Risk Prediction [26.53949431160399]
このデータセットは、22,588,586の臨床時系列イベントで構成されている。
よく知られているが構造化されていないMIMIC-IV-Noteから選択された放電サマリー。
本稿では,各アウトレットの要約を,管理可能な小さなテキストチャンクに分割することで機能する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-01T19:40:27Z) - Temporal Entailment Pretraining for Clinical Language Models over EHR Data [9.584923572354045]
臨床領域における言語モデルのための新しい時間的包含事前学習目標を提案する。
本手法は, EHRセグメントを時間的に順序付けられた文対として定式化し, 後の状態が先行状態に関係しているか, 矛盾しているか, 中立であるかを決定するようモデルを訓練する。
論文 参考訳(メタデータ) (2025-04-25T07:30:38Z) - Reconstructing Sepsis Trajectories from Clinical Case Reports using LLMs: the Textual Time Series Corpus for Sepsis [7.734726150561087]
臨床症例報告と退院サマリーは、患者遭遇の最も完全かつ正確な要約であり得るが、それらは最終的、すなわち、遭遇後のタイムスタンプである。
我々は,大規模言語モデルを用いた症例報告において,時間的局所的な発見を表現し,抽出し,注釈するパイプラインを構築した。
論文 参考訳(メタデータ) (2025-04-12T03:07:44Z) - Unlocking Multimodal Integration in EHRs: A Prompt Learning Framework for Language and Time Series Fusion [27.70300880284899]
大規模言語モデル(LLM)は、視覚言語タスクにおいて顕著な性能を示してきたが、医療分野におけるそれらの応用はいまだ研究されていない。
ProMedTSは、データ型を統一するために、プロンプト誘導学習を利用する、新しい自己教師型マルチモーダルフレームワークである。
実世界のデータセットを用いた診断タスクにおけるProMedTSの評価を行い,本手法が常に最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-02-19T07:56:48Z) - Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives [84.03001845263]
神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。
伝統的な物語分析は、しばしば単語の使用法や構文など、ミクロ構造における局所的な指標に焦点を当てる。
本稿では,話題の変化,時間的ダイナミクス,物語の時間的コヒーレンスを分析することによって,特定の認知的・言語的課題を解明することを提案する。
論文 参考訳(メタデータ) (2025-01-07T12:16:26Z) - HC-LLM: Historical-Constrained Large Language Models for Radiology Report Generation [89.3260120072177]
本稿では,放射線学レポート生成のための歴史制約付き大規模言語モデル (HC-LLM) フレームワークを提案する。
胸部X線写真から経時的特徴と経時的特徴を抽出し,疾患の進行を捉える診断報告を行った。
特に,本手法は,テスト中の履歴データなしでも良好に動作し,他のマルチモーダル大規模モデルにも容易に適用可能である。
論文 参考訳(メタデータ) (2024-12-15T06:04:16Z) - Retrieval of Temporal Event Sequences from Textual Descriptions [0.0]
TESRBenchはテキスト記述から時間的イベントシーケンスを検索するためのベンチマークである。
イベントシーケンスの埋め込みと検索のための新しいモデルであるTPP-Embeddingを提案する。
TPP-EmbeddingはTESRBenchデータセットのベースラインモデルよりも優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-10-17T21:35:55Z) - GenDFIR: Advancing Cyber Incident Timeline Analysis Through Retrieval Augmented Generation and Large Language Models [0.08192907805418582]
デジタル法医学とインシデント応答(DFIR)におけるサイバータイムライン解析の重要性
伝統的な手法は、証拠の識別と特徴抽出のためにログやメタデータのような構造化された成果物に依存している。
本稿では,大規模言語モデル(LLM)を利用したフレームワークであるGenDFIR,特にゼロショットモードのLlama 3.1 8Bについて紹介し,Retrieval-Augmented Generation (RAG)エージェントと統合する。
論文 参考訳(メタデータ) (2024-09-04T09:46:33Z) - Analyzing Temporal Complex Events with Large Language Models? A Benchmark towards Temporal, Long Context Understanding [57.62275091656578]
時間的複合イベント(TCE)として、長い期間にわたって多くのニュース記事から構成される複合イベントについて述べる。
本稿では,Large Language Models (LLMs) を用いて,TCE内のイベントチェーンを系統的に抽出し,解析する手法を提案する。
論文 参考訳(メタデータ) (2024-06-04T16:42:17Z) - SCTc-TE: A Comprehensive Formulation and Benchmark for Temporal Event Forecasting [63.01035584154509]
私たちは完全に自動化されたパイプラインを開発し、約0.6百万のニュース記事からMidEast-TEという大規模なデータセットを構築しました。
このデータセットは、2015年から2022年まで、主に中東地域での協力と紛争イベントに焦点を当てている。
そこで本稿では,SCTc-TE予測にローカルコンテキストとグローバルコンテキストの両方を活用可能なLoGoを提案する。
論文 参考訳(メタデータ) (2023-12-02T07:40:21Z) - CenTime: Event-Conditional Modelling of Censoring in Survival Analysis [49.44664144472712]
CenTimeは、イベントへの時間を直接見積もる、サバイバル分析の新しいアプローチである。
本手法は,非検閲データが少ない場合でも,堅牢なイベント条件検閲機構を特徴とする。
以上の結果から,CenTimeは同等の性能を維持しつつ,死までの時間を予測する上で,最先端のパフォーマンスを提供することがわかった。
論文 参考訳(メタデータ) (2023-09-07T17:07:33Z) - Linking Across Data Granularity: Fitting Multivariate Hawkes Processes to Partially Interval-Censored Data [50.63666649894571]
一部の応用では、ある次元における個々の事象のタイムスタンプは観測不可能であり、インターバル内の事象数のみが知られている。
本研究では,MHPとパラメータ等価性を共有し,タイムスタンプデータとインターバルセンサデータの両方を効果的にモデル化できる新たなポイントプロセスを提案する。
合成および実世界のデータセットを用いてPCMHPの能力を実証する。
論文 参考訳(メタデータ) (2021-11-03T08:25:35Z) - CSDI: Conditional Score-based Diffusion Models for Probabilistic Time
Series Imputation [107.63407690972139]
Conditional Score-based Diffusion Model for Imputation (CSDI) は、観測データに条件付きスコアベース拡散モデルを利用する新しい時系列計算法である。
CSDIは、一般的なパフォーマンスメトリクスの既存の確率論的計算方法よりも40-70%改善されている。
さらに、Cは最先端の決定論的計算法と比較して誤差を5-20%削減する。
論文 参考訳(メタデータ) (2021-07-07T22:20:24Z) - Temporal Cascade and Structural Modelling of EHRs for Granular
Readmission Prediction [10.943928059802174]
本稿では,時間的カスケード関係をモデル化するための新しいモデルMEDCASを提案する。
MEDCASは、訪問タイプと時間ギャップをモデル化する点過程を、注目に基づくシーケンス・ツー・シーケンス学習モデルに統合する。
3つの実世界のEHRデータセットの実験を行い、ttexttMEDCASが両方のタスクで最先端のモデルより優れていることを示した。
論文 参考訳(メタデータ) (2021-02-04T13:02:04Z) - MSED: a multi-modal sleep event detection model for clinical sleep
analysis [62.997667081978825]
ポリソムノグラムで睡眠イベントを共同検出する,単一のディープニューラルネットワークアーキテクチャを設計した。
モデルの性能は,F1,精度,リコールスコア,および指標値と臨床値との相関で定量化した。
論文 参考訳(メタデータ) (2021-01-07T13:08:44Z) - Clinical Temporal Relation Extraction with Probabilistic Soft Logic
Regularization and Global Inference [50.029659413650194]
既存のメソッドは、高価な機能エンジニアリングを必要とするか、イベント間のグローバルな依存関係をモデル化できない。
本稿では,確率論的ソフト論理規則化とグローバル推論を用いた新しい臨床時間緩和法を提案する。
論文 参考訳(メタデータ) (2020-12-16T08:23:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。