論文の概要: Automated tabulation of clinical trial results: A joint entity and
relation extraction approach with transformer-based language representations
- arxiv url: http://arxiv.org/abs/2112.05596v1
- Date: Fri, 10 Dec 2021 15:26:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-13 14:00:23.845341
- Title: Automated tabulation of clinical trial results: A joint entity and
relation extraction approach with transformer-based language representations
- Title(参考訳): 臨床試験結果の自動集計:変換器に基づく言語表現を用いた共同エンティティと関係抽出アプローチ
- Authors: Jetsun Whitton and Anthony Hunter
- Abstract要約: 本稿では,2つの言語処理タスク間で問題を分解し,エビデンス表の自動生成について検討する。
本稿では,実践成果を報告するRCT要約文の自動集計に着目する。
これらのモデルを訓練し、試験するために、6つの疾患領域から600近い結果文を含む新しいゴールドスタンダードコーパスが開発された。
- 参考スコア(独自算出の注目度): 5.825190876052148
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Evidence-based medicine, the practice in which healthcare professionals refer
to the best available evidence when making decisions, forms the foundation of
modern healthcare. However, it relies on labour-intensive systematic reviews,
where domain specialists must aggregate and extract information from thousands
of publications, primarily of randomised controlled trial (RCT) results, into
evidence tables. This paper investigates automating evidence table generation
by decomposing the problem across two language processing tasks: \textit{named
entity recognition}, which identifies key entities within text, such as drug
names, and \textit{relation extraction}, which maps their relationships for
separating them into ordered tuples. We focus on the automatic tabulation of
sentences from published RCT abstracts that report the results of the study
outcomes. Two deep neural net models were developed as part of a joint
extraction pipeline, using the principles of transfer learning and
transformer-based language representations. To train and test these models, a
new gold-standard corpus was developed, comprising almost 600 result sentences
from six disease areas. This approach demonstrated significant advantages, with
our system performing well across multiple natural language processing tasks
and disease areas, as well as in generalising to disease domains unseen during
training. Furthermore, we show these results were achievable through training
our models on as few as 200 example sentences. The final system is a proof of
concept that the generation of evidence tables can be semi-automated,
representing a step towards fully automating systematic reviews.
- Abstract(参考訳): エビデンスに基づく医療は、医療専門家が意思決定において最善の証拠を参照する行為であり、現代の医療の基礎を形成している。
しかし、これは労働集約的な体系的レビューに依存しており、ドメインの専門家は、主にランダム化比較試験(RCT)の結果を含む何千もの出版物から情報を収集して抽出しなければならない。
本稿では、2つの言語処理タスクにまたがる問題を分解してエビデンステーブルの自動生成について検討する。薬物名などのテキスト内のキーエンティティを識別する \textit{name entity recognition} と、それらを順序づけられたタプルに分割する関係をマッピングする \textit{relation extract} である。
本稿では,研究成果を報告するRCT要約文の自動集計に注目した。
2つのディープニューラルネットワークモデルは、トランスファー学習とトランスフォーマーに基づく言語表現の原則を用いて、統合抽出パイプラインの一部として開発された。
これらのモデルの訓練とテストのために、6つの病域から600近い結果文を含む新しい金標準コーパスが開発された。
本手法は,複数の自然言語処理タスクや疾患領域に対して良好に機能すると共に,訓練中にみられない疾患領域への一般化を図った。
さらに、これらの結果は、200の例文でモデルをトレーニングすることで達成可能であることを示す。
最終システムは、エビデンステーブルの生成を半自動化できるという概念の証明であり、体系的なレビューを完全に自動化するためのステップを表している。
関連論文リスト
- Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - Advancing Italian Biomedical Information Extraction with
Transformers-based Models: Methodological Insights and Multicenter Practical
Application [0.27027468002793437]
インフォメーション抽出は、自動化されたテキストマイニングパイプラインを使用することで、臨床実践者が限界を克服するのに役立つ。
我々は、最初のイタリアの神経心理学的名前付きエンティティ認識データセットであるPsyNITを作成し、それをトランスフォーマーベースのモデルの開発に利用した。
i)一貫性のあるアノテーションプロセスの重要な役割と(ii)古典的なメソッドと“低リソース”なアプローチを組み合わせた微調整戦略です。
論文 参考訳(メタデータ) (2023-06-08T16:15:46Z) - Detecting automatically the layout of clinical documents to enhance the
performances of downstream natural language processing [53.797797404164946]
我々は,臨床用PDF文書を処理し,臨床用テキストのみを抽出するアルゴリズムを設計した。
このアルゴリズムは、PDFを使った最初のテキスト抽出と、続いてボディテキスト、左書き、フッタなどのカテゴリに分類される。
それぞれのセクションのテキストから興味ある医学的概念を抽出し,医療的パフォーマンスを評価した。
論文 参考訳(メタデータ) (2023-05-23T08:38:33Z) - Jointly Extracting Interventions, Outcomes, and Findings from RCT
Reports with LLMs [21.868871974136884]
本研究では,命令調整型大規模言語モデルに基づくテキスト・テキスト・モデルの提案と評価を行う。
我々は,2022年中頃に公開されたRCTのコレクションにモデルを適用し,構造化された結果の検索可能なデータベースをリリースする。
論文 参考訳(メタデータ) (2023-05-05T16:02:06Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - A Unified Framework of Medical Information Annotation and Extraction for
Chinese Clinical Text [1.4841452489515765]
現在の最先端(SOTA)NLPモデルは、ディープラーニング技術と高度に統合されている。
本研究では,医学的実体認識,関係抽出,属性抽出の工学的枠組みを提案する。
論文 参考訳(メタデータ) (2022-03-08T03:19:16Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z) - Med7: a transferable clinical natural language processing model for
electronic health records [6.935142529928062]
本稿では,臨床自然言語処理のための匿名認識モデルを提案する。
このモデルは、薬物名、ルート、頻度、摂取量、強度、形態、期間の7つのカテゴリを認識するよう訓練されている。
本研究は、米国における集中治療室のデータから、英国における二次医療精神保健記録(CRIS)へのモデル導入可能性を評価するものである。
論文 参考訳(メタデータ) (2020-03-03T00:55:43Z) - Data Mining in Clinical Trial Text: Transformers for Classification and
Question Answering Tasks [2.127049691404299]
本研究は,医学的テキストに基づくエビデンス合成に自然言語処理の進歩を適用した。
主な焦点は、Population、Intervention、Comparator、Outcome(PICO)フレームワークを通じて特徴づけられる情報である。
トランスフォーマーに基づく最近のニューラルネットワークアーキテクチャは、トランスファーラーニングの能力を示し、下流の自然言語処理タスクのパフォーマンスが向上している。
論文 参考訳(メタデータ) (2020-01-30T11:45:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。