論文の概要: TELII: Temporal Event Level Inverted Indexing for Cohort Discovery on a Large Covid-19 EHR Dataset
- arxiv url: http://arxiv.org/abs/2410.17134v1
- Date: Tue, 22 Oct 2024 16:06:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 12:30:59.294578
- Title: TELII: Temporal Event Level Inverted Indexing for Cohort Discovery on a Large Covid-19 EHR Dataset
- Title(参考訳): TELII: 大規模Covid-19 EHRデータセット上でのコホート発見のための時間事象レベルの逆インデックス化
- Authors: Yan Huang,
- Abstract要約: TELIIは、大規模なEHRデータセット上でのコホート発見のために設計された時間事象レベルの逆インデックス法である。
我々は,887万人の患者から得られたデータを含む,OPTUM未同定のCOVID-19 EHRデータセットにTELIIを実装した。
その結果、TELIIの時間的クエリ速度は、既存の非時間的逆索引の2000倍高速であることがわかった。
- 参考スコア(独自算出の注目度): 4.872926155522239
- License:
- Abstract: Cohort discovery is a crucial step in clinical research on Electronic Health Record (EHR) data. Temporal queries, which are common in cohort discovery, can be time-consuming and prone to errors when processed on large EHR datasets. In this work, we introduce TELII, a temporal event level inverted indexing method designed for cohort discovery on large EHR datasets. TELII is engineered to pre-compute and store the relations along with the time difference between events, thereby providing fast and accurate temporal query capabilities. We implemented TELII for the OPTUM de-identified COVID-19 EHR dataset, which contains data from 8.87 million patients. We demonstrate four common temporal query tasks and their implementation using TELII with a MongoDB backend. Our results show that the temporal query speed for TELII is up to 2000 times faster than that of existing non-temporal inverted indexes. TELII achieves millisecond-level response times, enabling users to quickly explore event relations and find preliminary evidence for their research questions. Not only is TELII practical and straightforward to implement, but it also offers easy adaptability to other EHR datasets. These advantages underscore TELII's potential to serve as the query engine for EHR-based applications, ensuring fast, accurate, and user-friendly query responses.
- Abstract(参考訳): コホート発見はElectronic Health Record(EHR)データに関する臨床研究において重要なステップである。
コホート発見に共通する時間的クエリは、大規模なEHRデータセットで処理された場合、時間がかかりエラーが発生しやすい。
本研究では,大規模なEHRデータセット上でのコホート発見を目的とした時間事象レベルの逆インデックス手法であるTELIIを紹介する。
TELIIは、イベント間の時間差とともに関係を事前計算し、保存するように設計されており、高速で正確な時間的クエリ機能を提供する。
我々は,887万人の患者から得られたデータを含む,OPTUM非同定型COVID-19 EHRデータセットにTELIIを実装した。
一般的な4つの時間的クエリタスクとその実装について,TELIIをMongoDBバックエンドで示す。
その結果,TELIIの時間的クエリ速度は,既存の非時間的逆インデックスの時間的クエリ速度の最大2000倍であることがわかった。
TELIIはミリ秒レベルの応答時間を実現し、ユーザーはイベント関係をすばやく探索し、研究課題の予備的証拠を見つけることができる。
TELIIは実用的で簡単に実装できるだけでなく、他のEHRデータセットにも容易に適応できる。
これらのアドバンテージは、HRベースのアプリケーションのクエリエンジンとして機能し、高速で正確でユーザフレンドリーなクエリ応答を保証するTELIIの可能性を浮き彫りにしている。
関連論文リスト
- BernGraph: Probabilistic Graph Neural Networks for EHR-based Medication Recommendations [28.456738816539488]
医療コミュニティは、EHRデータにおける2つの医療イベントの結果は、合理的な推奨を行うのに十分な情報を含んでいると信じている。
専門家の知識があっても、巨大な0,1のイベント結果の関係をモデル化するのは困難です。
実際には、同様に重要な0エントリが学習信号を伝達しないため、学習はバイナリ値によって停滞する可能性がある。
論文 参考訳(メタデータ) (2024-08-18T08:52:27Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - Dynamic Data Pruning for Automatic Speech Recognition [58.95758272440217]
ASR(DDP-ASR)のダイナミック・データ・プルーニング(Dynamic Data Pruning for ASR)を導入し,音声関連データセットに特化して微細なプルーニングの粒度を提供する。
実験の結果,DDP-ASRは最大1.6倍のトレーニング時間を節約できることがわかった。
論文 参考訳(メタデータ) (2024-06-26T14:17:36Z) - REXEL: An End-to-end Model for Document-Level Relation Extraction and Entity Linking [11.374031643273941]
REXELは文書レベルcIE(DocIE)の共同作業のための高効率かつ高精度なモデルである
同様の環境では、競合する既存のアプローチよりも平均11倍高速です。
速度と精度の組み合わせにより、REXELはWebスケールで構造化された情報を抽出する正確なコスト効率のシステムとなる。
論文 参考訳(メタデータ) (2024-04-19T11:04:27Z) - Few-shot Link Prediction on N-ary Facts [70.8150181683017]
ハイパーリレーショナル・ファクト(LPHFs)のリンク予測は、ハイパーリレーショナル・事実の欠落要素を予測することである。
Few-Shot Link Prediction on Hyper-Relational Facts (PHFs) は、サポートインスタンスが限定されたハイパーリレーショナルな事実において、欠落したエンティティを予測することを目的としている。
論文 参考訳(メタデータ) (2023-05-10T12:44:00Z) - RETE: Retrieval-Enhanced Temporal Event Forecasting on Unified Query
Product Evolutionary Graph [18.826901341496143]
時間的イベント予測は、統合クエリ製品進化グラフにおける新しいユーザ行動予測タスクである。
本稿では,新しいイベント予測フレームワークを提案する。
既存手法とは違って,グラフ全体の大まかに連結されたエンティティを通じてユーザ表現を強化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-12T19:27:56Z) - Approximating Aggregated SQL Queries With LSTM Networks [31.528524004435933]
本稿では、近似クエリ処理(AQP)とも呼ばれるクエリ近似法を提案する。
我々は、LSTMネットワークを用いて、クエリと結果の関係を学習し、クエリ結果を予測するための高速な推論層を提供する。
提案手法では,1秒間に最大12万のクエリを予測でき,クエリのレイテンシは2ms以下であった。
論文 参考訳(メタデータ) (2020-10-25T16:17:58Z) - Sequential Recommender via Time-aware Attentive Memory Network [67.26862011527986]
本稿では,注意機構と繰り返し単位を改善するための時間ゲーティング手法を提案する。
また,長期と短期の嗜好を統合するマルチホップ・タイムアウェア・アテンテーティブ・メモリ・ネットワークを提案する。
提案手法は,候補探索タスクに対してスケーラブルであり,ドット積に基づくTop-Kレコメンデーションのための潜在因数分解の非線形一般化とみなすことができる。
論文 参考訳(メタデータ) (2020-05-18T11:29:38Z) - AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement
with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。
総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文 参考訳(メタデータ) (2020-04-26T05:43:21Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。