論文の概要: LeafAI: query generator for clinical cohort discovery rivaling a human
programmer
- arxiv url: http://arxiv.org/abs/2304.06203v2
- Date: Mon, 14 Aug 2023 18:45:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 16:46:32.159563
- Title: LeafAI: query generator for clinical cohort discovery rivaling a human
programmer
- Title(参考訳): LeafAI:人間のプログラマと競合する臨床コホート発見のためのクエリジェネレータ
- Authors: Nicholas J Dobbins, Bin Han, Weipeng Zhou, Kristine Lan, H. Nina Kim,
Robert Harrington, Ozlem Uzuner, Meliha Yetisgen
- Abstract要約: 我々は,データモデルに依存しないクエリを生成するシステムを開発した。
また、複雑な臨床試験の適格性基準に新たな論理的推論能力を提供する。
- 参考スコア(独自算出の注目度): 4.410832512630809
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: Identifying study-eligible patients within clinical databases is a
critical step in clinical research. However, accurate query design typically
requires extensive technical and biomedical expertise. We sought to create a
system capable of generating data model-agnostic queries while also providing
novel logical reasoning capabilities for complex clinical trial eligibility
criteria.
Materials and Methods: The task of query creation from eligibility criteria
requires solving several text-processing problems, including named entity
recognition and relation extraction, sequence-to-sequence transformation,
normalization, and reasoning. We incorporated hybrid deep learning and
rule-based modules for these, as well as a knowledge base of the Unified
Medical Language System (UMLS) and linked ontologies. To enable data-model
agnostic query creation, we introduce a novel method for tagging database
schema elements using UMLS concepts. To evaluate our system, called LeafAI, we
compared the capability of LeafAI to a human database programmer to identify
patients who had been enrolled in 8 clinical trials conducted at our
institution. We measured performance by the number of actual enrolled patients
matched by generated queries.
Results: LeafAI matched a mean 43% of enrolled patients with 27,225 eligible
across 8 clinical trials, compared to 27% matched and 14,587 eligible in
queries by a human database programmer. The human programmer spent 26 total
hours crafting queries compared to several minutes by LeafAI.
Conclusions: Our work contributes a state-of-the-art data model-agnostic
query generation system capable of conditional reasoning using a knowledge
base. We demonstrate that LeafAI can rival an experienced human programmer in
finding patients eligible for clinical trials.
- Abstract(参考訳): 目的:臨床データベースにおける研究対象の特定は臨床研究における重要なステップである。
しかしながら、正確なクエリ設計は通常、広範な技術的および生物医学的専門知識を必要とする。
そこで我々は,データモデルに依存しない問合せを生成できるシステムの構築と,複雑な臨床試験の資格基準に対する論理的推論機能の提供を試みた。
資料と方法: 適格性基準からのクエリ作成のタスクは、名前付きエンティティ認識と関係抽出、シーケンスからシーケンスへの変換、正規化、推論など、いくつかのテキスト処理問題を解決する必要がある。
これらには,統合医療言語システム(umls)とリンクオントロジーの知識ベースと同様に,ハイブリッドなディープラーニングとルールベースモジュールが組み込まれている。
データモデルに依存しないクエリ生成を可能にするために,umls概念を用いたデータベーススキーマ要素のタグ付け手法を提案する。
LeafAIと呼ばれるシステムを評価するために,本施設で実施した8つの臨床試験に登録された患者を特定するために,LeafAIを人間データベースプログラマと比較した。
実登録患者数を生成クエリで一致させた結果から評価した。
結果: LeafAIは8つの臨床試験で27,225人の登録患者の平均43%と一致した。
人間のプログラマは26時間、LeafAIの数分と比べてクエリを作成しました。
結論:我々の研究は,知識ベースを用いた条件付き推論が可能な最先端のデータモデル非依存クエリ生成システムに貢献している。
そこで我々は, LeafAIが経験豊富なプログラマと競合し,臨床治験の資格のある患者を見つけることを実証した。
関連論文リスト
- TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [57.067409211231244]
本稿では,マルチモーダルデータ(例えば,薬物分子,疾患コード,テキスト,分類・数値的特徴)と臨床治験設計における8つの重要な予測課題をカバーするAIreadyデータセットを精巧にキュレートした。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Panacea: A foundation model for clinical trial search, summarization, design, and recruitment [29.099676641424384]
パナセアという臨床試験基盤モデルを提案する。
Panaceaは、トライアル検索、トライアル要約、トライアルデザイン、患者と臨床のマッチングなど、複数のタスクを扱うように設計されている。
793,279のトライアル文書と1,113,207のトライアル関連科学論文からなる、TrialAlignという大規模なデータセットも収集しました。
論文 参考訳(メタデータ) (2024-06-25T21:29:25Z) - Towards Efficient Patient Recruitment for Clinical Trials: Application of a Prompt-Based Learning Model [0.7373617024876725]
臨床試験は医薬品の介入を促進するのに不可欠であるが、適格な参加者を選ぶ際にボトルネックに直面している。
構造化されていない医療用テキストの複雑な性質は、参加者を効率的に識別する上での課題である。
本研究では,コホート選択課題に対するプロンプトベース大規模言語モデルの性能評価を目的とした。
論文 参考訳(メタデータ) (2024-04-24T20:42:28Z) - Zero-Shot Clinical Trial Patient Matching with LLMs [40.31971412825736]
大規模言語モデル(LLM)は、自動スクリーニングの有望なソリューションを提供する。
我々は,患者の診療歴を非構造的臨床テキストとして考慮し,その患者が包括的基準を満たしているかどうかを評価するLCMベースのシステムを構築した。
提案システムは,n2c2 2018コホート選択ベンチマークにおいて,最先端のスコアを達成している。
論文 参考訳(メタデータ) (2024-02-05T00:06:08Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Large Language Models for Biomedical Knowledge Graph Construction:
Information extraction from EMR notes [0.0]
大規模言語モデル(LLM)に基づくエンドツーエンド機械学習ソリューションを提案する。
KG構築プロセスで使用される物質は、疾患、因子、治療、および疾患を経験中に患者と共存する症状である。
提案手法の応用は加齢に伴う黄斑変性に対して実証される。
論文 参考訳(メタデータ) (2023-01-29T15:52:33Z) - The Leaf Clinical Trials Corpus: a new resource for query generation
from clinical trial eligibility criteria [1.7205106391379026]
本報告では,1000以上の臨床治験適性基準を記載した人称コーパスであるLeaf Clinical Trials (LCT) corpusを紹介する。
スキーマ、アノテーションプロセス、コーパスの品質、統計の詳細を提供します。
論文 参考訳(メタデータ) (2022-07-27T19:22:24Z) - VBridge: Connecting the Dots Between Features, Explanations, and Data
for Healthcare Models [85.4333256782337]
VBridgeは、臨床医の意思決定ワークフローに機械学習の説明をシームレスに組み込むビジュアル分析ツールである。
我々は,臨床医がMLの特徴に慣れていないこと,文脈情報の欠如,コホートレベルの証拠の必要性など,3つの重要な課題を特定した。
症例スタディと専門医4名のインタビューを通じて, VBridgeの有効性を実証した。
論文 参考訳(メタデータ) (2021-08-04T17:34:13Z) - Benchmarking Automated Clinical Language Simplification: Dataset,
Algorithm, and Evaluation [48.87254340298189]
我々はMedLaneという名の新しいデータセットを構築し、自動化された臨床言語簡易化手法の開発と評価を支援する。
我々は,人間のアノテーションの手順に従い,最先端のパフォーマンスを実現するDECLAREと呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-12-04T06:09:02Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。