論文の概要: Investigating Deep-Learning NLP for Automating the Extraction of
Oncology Efficacy Endpoints from Scientific Literature
- arxiv url: http://arxiv.org/abs/2311.04925v1
- Date: Fri, 3 Nov 2023 14:01:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-12 19:21:27.455508
- Title: Investigating Deep-Learning NLP for Automating the Extraction of
Oncology Efficacy Endpoints from Scientific Literature
- Title(参考訳): 科学文献からoncology effectiveness endpointsの抽出を自動化するためのディープラーニングnlpの検討
- Authors: Aline Gendrin-Brokmann, Eden Harrison, Julianne Noveras, Leonidas
Souliotis, Harris Vince, Ines Smit, Francisco Costa, David Milward, Sashka
Dimitrievska, Paul Metcalfe, Emilie Louvet
- Abstract要約: 我々は,論文中のテキストから有効終端を抽出するフレームワークを開発し,最適化した。
我々の機械学習モデルは、有効性エンドポイントに関連する25のクラスを予測し、高いF1スコアを得る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Benchmarking drug efficacy is a critical step in clinical trial design and
planning. The challenge is that much of the data on efficacy endpoints is
stored in scientific papers in free text form, so extraction of such data is
currently a largely manual task. Our objective is to automate this task as much
as possible. In this study we have developed and optimised a framework to
extract efficacy endpoints from text in scientific papers, using a machine
learning approach. Our machine learning model predicts 25 classes associated
with efficacy endpoints and leads to high F1 scores (harmonic mean of precision
and recall) of 96.4% on the test set, and 93.9% and 93.7% on two case studies.
These methods were evaluated against - and showed strong agreement with -
subject matter experts and show significant promise in the future of automating
the extraction of clinical endpoints from free text. Clinical information
extraction from text data is currently a laborious manual task which scales
poorly and is prone to human error. Demonstrating the ability to extract
efficacy endpoints automatically shows great promise for accelerating clinical
trial design moving forwards.
- Abstract(参考訳): 薬物効果のベンチマークは臨床試験の設計と計画において重要なステップである。
課題は、有効性エンドポイントのデータの多くは、科学論文に無料のテキスト形式で格納されているため、現在、これらのデータの抽出は、ほとんど手作業による作業である。
私たちの目標は、このタスクを可能な限り自動化することです。
本研究では,機械学習手法を用いて,論文中のテキストから有効終端を抽出するフレームワークを開発し,最適化した。
機械学習モデルは有効性エンドポイントに関連する25のクラスを予測し、テストセットで96.4%、ケーススタディで93.9%、93.7%という高いf1スコア(ハーモニック平均とリコール)をもたらす。
これらの手法は, 対象物質の専門家と強い一致を示し, フリーテキストから臨床エンドポイントを自動抽出する将来に有意な可能性を示した。
テキストデータからの臨床情報抽出は、現在手作業による作業であり、スケールが悪く、ヒューマンエラーを起こしやすい。
有効性エンドポイントを自動抽出する能力を示すことは、臨床試験設計の前進を加速する大きな可能性を秘めている。
関連論文リスト
- Artificial Intelligence in Extracting Diagnostic Data from Dental Records [6.132077347366551]
本研究は, 未構造化テキストから診断情報を抽出することにより, 歯科記録に欠落する構造データの問題に対処する。
我々は、GPT-4を利用した高度なAIおよびNLP手法を用いて、RoBERTaモデルの微調整のための合成ノートを生成する。
2つのデータセットからランダムに選択した120個の臨床ノートを用いてモデルの評価を行い,診断精度の向上を実証した。
論文 参考訳(メタデータ) (2024-07-23T04:05:48Z) - Accelerating Clinical Evidence Synthesis with Large Language Models [28.002870749019035]
本稿では,人間とAIのコラボレーションを促進するための生成人工知能パイプラインであるTrialMindを紹介する。
TrialMindは、検索、スクリーニング、データ抽出タスクを横断的に拡張する。
人間の専門家は、GPT-4よりもTrialMindの出力を62.5%から100%のケースで好んだ。
論文 参考訳(メタデータ) (2024-06-25T17:41:52Z) - WisPerMed at "Discharge Me!": Advancing Text Generation in Healthcare with Large Language Models, Dynamic Expert Selection, and Priming Techniques on MIMIC-IV [0.38084074204911494]
本研究は, アウトレット・サマリーの「Brief Hospital Course」と「Discharge Instructions」を自動生成するために, 最先端の言語モデルを活用することを目的としている。
医療施設において, 自動化がドキュメンテーションの精度を向上し, クリニックのバーンアウトを緩和し, 運用効率を向上させる方法について検討した。
論文 参考訳(メタデータ) (2024-05-18T10:56:45Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Detecting automatically the layout of clinical documents to enhance the
performances of downstream natural language processing [53.797797404164946]
我々は,臨床用PDF文書を処理し,臨床用テキストのみを抽出するアルゴリズムを設計した。
このアルゴリズムは、PDFを使った最初のテキスト抽出と、続いてボディテキスト、左書き、フッタなどのカテゴリに分類される。
それぞれのセクションのテキストから興味ある医学的概念を抽出し,医療的パフォーマンスを評価した。
論文 参考訳(メタデータ) (2023-05-23T08:38:33Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。
本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。
提案手法により,下流タスクの性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-03-08T03:56:31Z) - Efficient Medical Image Assessment via Self-supervised Learning [27.969767956918503]
高性能なディープラーニング手法は通常、大きな注釈付きトレーニングデータセットに依存する。
本稿では,未ラベルの医用画像データの品質をランク付けするための,新規で効率的なデータアセスメント戦略を提案する。
SSL埋め込み空間の理論的な意味から,我々はMasked Autoencoderを用いて特徴抽出を行う。
論文 参考訳(メタデータ) (2022-09-28T21:39:00Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - Learning for Dose Allocation in Adaptive Clinical Trials with Safety
Constraints [84.09488581365484]
新しい化合物の有効性と毒性の関係がより複雑になるにつれて、第1相線量測定試験はますます困難になっている。
最も一般的に使われている方法は、毒性事象のみから学習することで、最大許容量(MTD)を特定することである。
本稿では, 毒性安全性の制約を高い確率で満たしつつ, 累積効果を最大化することを目的とした, 適応型臨床試験手法を提案する。
論文 参考訳(メタデータ) (2020-06-09T03:06:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。