論文の概要: Investigating Deep-Learning NLP for Automating the Extraction of
Oncology Efficacy Endpoints from Scientific Literature
- arxiv url: http://arxiv.org/abs/2311.04925v1
- Date: Fri, 3 Nov 2023 14:01:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-12 19:21:27.455508
- Title: Investigating Deep-Learning NLP for Automating the Extraction of
Oncology Efficacy Endpoints from Scientific Literature
- Title(参考訳): 科学文献からoncology effectiveness endpointsの抽出を自動化するためのディープラーニングnlpの検討
- Authors: Aline Gendrin-Brokmann, Eden Harrison, Julianne Noveras, Leonidas
Souliotis, Harris Vince, Ines Smit, Francisco Costa, David Milward, Sashka
Dimitrievska, Paul Metcalfe, Emilie Louvet
- Abstract要約: 我々は,論文中のテキストから有効終端を抽出するフレームワークを開発し,最適化した。
我々の機械学習モデルは、有効性エンドポイントに関連する25のクラスを予測し、高いF1スコアを得る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Benchmarking drug efficacy is a critical step in clinical trial design and
planning. The challenge is that much of the data on efficacy endpoints is
stored in scientific papers in free text form, so extraction of such data is
currently a largely manual task. Our objective is to automate this task as much
as possible. In this study we have developed and optimised a framework to
extract efficacy endpoints from text in scientific papers, using a machine
learning approach. Our machine learning model predicts 25 classes associated
with efficacy endpoints and leads to high F1 scores (harmonic mean of precision
and recall) of 96.4% on the test set, and 93.9% and 93.7% on two case studies.
These methods were evaluated against - and showed strong agreement with -
subject matter experts and show significant promise in the future of automating
the extraction of clinical endpoints from free text. Clinical information
extraction from text data is currently a laborious manual task which scales
poorly and is prone to human error. Demonstrating the ability to extract
efficacy endpoints automatically shows great promise for accelerating clinical
trial design moving forwards.
- Abstract(参考訳): 薬物効果のベンチマークは臨床試験の設計と計画において重要なステップである。
課題は、有効性エンドポイントのデータの多くは、科学論文に無料のテキスト形式で格納されているため、現在、これらのデータの抽出は、ほとんど手作業による作業である。
私たちの目標は、このタスクを可能な限り自動化することです。
本研究では,機械学習手法を用いて,論文中のテキストから有効終端を抽出するフレームワークを開発し,最適化した。
機械学習モデルは有効性エンドポイントに関連する25のクラスを予測し、テストセットで96.4%、ケーススタディで93.9%、93.7%という高いf1スコア(ハーモニック平均とリコール)をもたらす。
これらの手法は, 対象物質の専門家と強い一致を示し, フリーテキストから臨床エンドポイントを自動抽出する将来に有意な可能性を示した。
テキストデータからの臨床情報抽出は、現在手作業による作業であり、スケールが悪く、ヒューマンエラーを起こしやすい。
有効性エンドポイントを自動抽出する能力を示すことは、臨床試験設計の前進を加速する大きな可能性を秘めている。
関連論文リスト
- Automated Scoring of Clinical Patient Notes using Advanced NLP and
Pseudo Labeling [2.711804338865226]
本研究では,最先端自然言語処理(NLP)技術を活用したアプローチを提案する。
提案手法は効率と有効性を向上し,性能を損なうことなくトレーニング時間を著しく短縮する。
論文 参考訳(メタデータ) (2024-01-18T05:17:18Z) - Utilizing ChatGPT to Enhance Clinical Trial Enrollment [2.3551878971309947]
本稿では,大規模言語モデルであるChatGPTを用いて患者関連情報を非構造化臨床ノートから抽出する自動アプローチを提案する。
2つのベンチマーク検索コレクションで実施した経験的評価では,既存手法と比較して検索性能が向上した。
以上の結果から,ChatGPTを医療サービスの品質を確保し,患者への直接的なリスクを最小限に抑えつつ,臨床治験の増進に活用する可能性が示唆された。
論文 参考訳(メタデータ) (2023-06-03T10:54:23Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Detecting automatically the layout of clinical documents to enhance the
performances of downstream natural language processing [53.797797404164946]
我々は,臨床用PDF文書を処理し,臨床用テキストのみを抽出するアルゴリズムを設計した。
このアルゴリズムは、PDFを使った最初のテキスト抽出と、続いてボディテキスト、左書き、フッタなどのカテゴリに分類される。
それぞれのセクションのテキストから興味ある医学的概念を抽出し,医療的パフォーマンスを評価した。
論文 参考訳(メタデータ) (2023-05-23T08:38:33Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。
本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。
提案手法により,下流タスクの性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-03-08T03:56:31Z) - Efficient Medical Image Assessment via Self-supervised Learning [27.969767956918503]
高性能なディープラーニング手法は通常、大きな注釈付きトレーニングデータセットに依存する。
本稿では,未ラベルの医用画像データの品質をランク付けするための,新規で効率的なデータアセスメント戦略を提案する。
SSL埋め込み空間の理論的な意味から,我々はMasked Autoencoderを用いて特徴抽出を行う。
論文 参考訳(メタデータ) (2022-09-28T21:39:00Z) - Adaptation of Autoencoder for Sparsity Reduction From Clinical Notes
Representation Learning [0.19573380763700707]
本稿では,臨床ノート表現の空間的縮小を生かしたオートエンコーダ学習アルゴリズムを提案する。
その動機は, 臨床注記表現特徴空間の次元を小さくすることで, スパースな高次元データを圧縮する方法を決定することである。
提案手法により,評価毎に最大3%の性能向上が得られた。
論文 参考訳(メタデータ) (2022-09-26T16:37:37Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - Learning for Dose Allocation in Adaptive Clinical Trials with Safety
Constraints [84.09488581365484]
新しい化合物の有効性と毒性の関係がより複雑になるにつれて、第1相線量測定試験はますます困難になっている。
最も一般的に使われている方法は、毒性事象のみから学習することで、最大許容量(MTD)を特定することである。
本稿では, 毒性安全性の制約を高い確率で満たしつつ, 累積効果を最大化することを目的とした, 適応型臨床試験手法を提案する。
論文 参考訳(メタデータ) (2020-06-09T03:06:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。