論文の概要: Building Patient Journeys in Hebrew: A Language Model for Clinical Timeline Extraction
- arxiv url: http://arxiv.org/abs/2512.11502v1
- Date: Fri, 12 Dec 2025 11:54:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.755339
- Title: Building Patient Journeys in Hebrew: A Language Model for Clinical Timeline Extraction
- Title(参考訳): ヘブライ語における患者旅行の構築 : 臨床タイムライン抽出のための言語モデル
- Authors: Kai Golan Hashiloni, Brenda Kasabe Nokai, Michal Shevach, Esthy Shemesh, Ronit Bartin, Anna Bergrin, Liran Harel, Nachum Dershowitz, Liat Nadai Arad, Kfir Bar,
- Abstract要約: 電子カルテから構造化された臨床タイムラインを抽出するヘブライ語医療言語モデルを提案する。
我々のモデルはDictaBERT 2.0に基づいており、500万以上の未確認病院の記録を継続的に事前訓練している。
- 参考スコア(独自算出の注目度): 2.335661820613948
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a new Hebrew medical language model designed to extract structured clinical timelines from electronic health records, enabling the construction of patient journeys. Our model is based on DictaBERT 2.0 and continually pre-trained on over five million de-identified hospital records. To evaluate its effectiveness, we introduce two new datasets -- one from internal medicine and emergency departments, and another from oncology -- annotated for event temporal relations. Our results show that our model achieves strong performance on both datasets. We also find that vocabulary adaptation improves token efficiency and that de-identification does not compromise downstream performance, supporting privacy-conscious model development. The model is made available for research use under ethical restrictions.
- Abstract(参考訳): 本稿では,電子カルテから構造化された臨床タイムラインを抽出し,患者旅行の構築を可能にするヘブライ語医療言語モデルを提案する。
我々のモデルはDictaBERT 2.0に基づいており、500万以上の未確認病院の記録を継続的に事前訓練している。
その効果を評価するため、内科と救急科の2つの新しいデータセットと、事象の時間的関係を示すオンコロジーの2つのデータセットを紹介した。
以上の結果から,本モデルが両方のデータセットで高い性能を達成できることが示唆された。
また,語彙適応によりトークン効率が向上し,非識別が下流のパフォーマンスを損なうことなく,プライバシーに配慮したモデル開発を支援することも見出した。
このモデルは、倫理的制約の下で研究用として利用できる。
関連論文リスト
- ELMTEX: Fine-Tuning Large Language Models for Structured Clinical Information Extraction. A Case Study on Clinical Reports [3.0363830583066713]
本稿では,Large Language Models (LLMs) を用いて,構造化されていない臨床報告から構造化情報を抽出することを目的としたプロジェクトの結果について述べる。
我々は,ユーザインタフェースを用いたワークフローを開発し,戦略と微調整により,様々なサイズのLCMを評価した。
以上の結果から,微調整された小型モデルでは性能が向上し,資源制限設定の効率化が期待できることがわかった。
論文 参考訳(メタデータ) (2025-02-08T16:44:56Z) - Atlas: A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics [61.0008867391683]
本稿では,RudolfVアプローチに基づく新しい視覚基盤モデルであるAtlasを紹介する。
本モデルでは、120万の病理組織像からなるデータセットを用いてトレーニングを行った。
論文 参考訳(メタデータ) (2025-01-09T18:06:45Z) - An Interpretable Deep-Learning Framework for Predicting Hospital Readmissions From Electronic Health Records [1.9185059111021852]
本研究では,未計画の病院入退院を予測するための新しい,解釈可能な深層学習フレームワークを提案する。
実際のデータを用いて,30日と180日以内に病院入退院の2つの予測課題に関する枠組みを検証した。
我々のソリューションは、予測精度で従来の機械学習モデルより優れ、同時により解釈可能な結果を提供する。
論文 参考訳(メタデータ) (2023-10-16T08:48:52Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - Modelling Patient Trajectories Using Multimodal Information [0.0]
本稿では,異なる種類の情報を組み合わせて臨床データの時間的側面を考慮した患者軌跡のモデル化手法を提案する。
本手法は, 予期せぬ患者寛解と疾患進行の2つの異なる臨床結果に基づいて検討した。
論文 参考訳(メタデータ) (2022-09-09T10:20:54Z) - CEHR-BERT: Incorporating temporal information from structured EHR data
to improve prediction tasks [0.0]
我々は、ハイブリッドアプローチを用いて時間情報を組み込む新しいBERT適応CEHR-BERTを開発した。
CEHR-BERTはコロンビア大学アーヴィング医療センター-ヨーク長老派病院の臨床データのサブセットで訓練された。
論文 参考訳(メタデータ) (2021-11-10T16:53:32Z) - Medical Profile Model: Scientific and Practical Applications in
Healthcare [1.718235998156457]
本研究は, 患者の病歴を, 病の時間的シーケンスとして提示し, その埋め込みを教師なしで学習する。
埋め込みスペースには、一般化された患者プロファイルの作成を可能にする人口統計パラメータが含まれている。
このような医療プロファイルモデルのトレーニングは、100万人以上の患者のデータセット上で実施されている。
論文 参考訳(メタデータ) (2021-06-21T13:30:43Z) - Benchmarking Automated Clinical Language Simplification: Dataset,
Algorithm, and Evaluation [48.87254340298189]
我々はMedLaneという名の新しいデータセットを構築し、自動化された臨床言語簡易化手法の開発と評価を支援する。
我々は,人間のアノテーションの手順に従い,最先端のパフォーマンスを実現するDECLAREと呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-12-04T06:09:02Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。