論文の概要: A Span-based Model for Extracting Overlapping PICO Entities from RCT
Publications
- arxiv url: http://arxiv.org/abs/2401.06791v1
- Date: Mon, 8 Jan 2024 03:35:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-22 12:28:45.894175
- Title: A Span-based Model for Extracting Overlapping PICO Entities from RCT
Publications
- Title(参考訳): RCT出版物から重なり合うPICOエンティティを抽出するスパンベースモデル
- Authors: Gongbo Zhang, Yiliang Zhou, Yan Hu, Hua Xu, Chunhua Weng, Yifan Peng
- Abstract要約: 重なり合うPICOエンティティを抽出する新しいPICOX法を提案する。
単語がエンティティの開始か終了かを評価することによってエンティティを識別する。
次に、複数ラベルの分類器を使用して、1つ以上のPICOラベルをスパン候補に割り当てる。
- 参考スコア(独自算出の注目度): 24.67593934432951
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Objectives Extraction of PICO (Populations, Interventions, Comparison, and
Outcomes) entities is fundamental to evidence retrieval. We present a novel
method PICOX to extract overlapping PICO entities.
Materials and Methods PICOX first identifies entities by assessing whether a
word marks the beginning or conclusion of an entity. Then it uses a multi-label
classifier to assign one or more PICO labels to a span candidate. PICOX was
evaluated using one of the best-performing baselines, EBM-NLP, and three more
datasets, i.e., PICO-Corpus, and RCT publications on Alzheimer's Disease or
COVID-19, using entity-level precision, recall, and F1 scores.
Results PICOX achieved superior precision, recall, and F1 scores across the
board, with the micro F1 score improving from 45.05 to 50.87 (p << 0.01). On
the PICO-Corpus, PICOX obtained higher recall and F1 scores than the baseline
and improved the micro recall score from 56.66 to 67.33. On the COVID-19
dataset, PICOX also outperformed the baseline and improved the micro F1 score
from 77.10 to 80.32. On the AD dataset, PICOX demonstrated comparable F1 scores
with higher precision when compared to the baseline.
Conclusion PICOX excels in identifying overlapping entities and consistently
surpasses a leading baseline across multiple datasets. Ablation studies reveal
that its data augmentation strategy effectively minimizes false positives and
improves precision.
- Abstract(参考訳): pico(populations, interventions, comparison, and outcomes)エンティティの目的抽出は、エビデンス検索の基本である。
重なり合うPICOエンティティを抽出する新しいPICOX法を提案する。
材料と方法 PICOXは、単語がエンティティの開始または終了を示すかどうかを評価することによって、エンティティを最初に識別する。
その後、マルチラベル分類器を使用して、1つ以上のpicoラベルをスパン候補に割り当てる。
PICOXは、最も優れたベースラインであるEMM-NLPと、さらに3つのデータセット、すなわち、PICO-Corpus、およびアルツハイマー病またはCOVID-19に関するRCTの出版物を用いて、エンティティレベルの精度、リコール、F1スコアを用いて評価された。
その結果、PICOXは、マイクロF1スコアが45.05から50.87(p<<0.01)に改善され、ボード全体の精度、リコール、F1スコアが向上した。
PICO-Corpusでは、PICOXはベースラインよりも高いリコールとF1スコアを獲得し、マイクロリコールスコアは56.66から67.33に改善された。
COVID-19データセットでは、PICOXはベースラインを上回り、マイクロF1スコアを77.10から80.32に改善した。
ADデータセットでは、PICOXはベースラインと比較して高い精度のF1スコアを示した。
結論 PICOX は重複するエンティティを識別し、複数のデータセットにわたる主要なベースラインを一貫して超越する。
アブレーション研究によれば、そのデータ拡張戦略は偽陽性を効果的に最小化し、精度を向上させる。
関連論文リスト
- Phikon-v2, A large and public feature extractor for biomarker prediction [42.52549987351643]
我々は、DINOv2を用いて視覚変換器を訓練し、このモデルの1つのイテレーションを公開して、Phikon-v2と呼ばれるさらなる実験を行う。
Phikon-v2は、公開されている組織学のスライドをトレーニングしながら、以前リリースしたモデル(Phikon)を上回り、プロプライエタリなデータでトレーニングされた他の病理学基盤モデル(FM)と同等に動作します。
論文 参考訳(メタデータ) (2024-09-13T20:12:29Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - A Federated Learning Framework for Stenosis Detection [70.27581181445329]
本研究は,冠動脈造影画像(CA)の狭窄検出におけるFL(Federated Learning)の使用について検討した。
アンコナのOspedale Riuniti(イタリア)で取得した200人の患者1219枚の画像を含む2施設の異種データセットについて検討した。
データセット2には、文献で利用可能な90人の患者からの7492のシーケンシャルな画像が含まれている。
論文 参考訳(メタデータ) (2023-10-30T11:13:40Z) - Large Language Models to Identify Social Determinants of Health in
Electronic Health Records [2.168737004368243]
健康の社会的決定因子(SDoH)は、患者の結果に重要な影響を与えるが、電子健康記録(EHR)から不完全に収集される。
本研究では,EHRにおける自由テキストからSDoHを抽出する大規模言語モデルについて検討した。
800の患者ノートをSDoHカテゴリーにアノテートし,いくつかのトランスフォーマーモデルを評価した。
論文 参考訳(メタデータ) (2023-08-11T19:18:35Z) - Exploring the Value of Pre-trained Language Models for Clinical Named
Entity Recognition [6.917786124918387]
我々は、スクラッチからトレーニングされたTransformerモデルと、細調整されたBERTベースのLLMを比較した。
文脈学習を促進するために,追加のCRF層がそのようなモデルに与える影響を検討する。
論文 参考訳(メタデータ) (2022-10-23T16:27:31Z) - Learning to diagnose common thorax diseases on chest radiographs from
radiology reports in Vietnamese [0.33598755777055367]
ベトナムの放射線学報告から情報を抽出し,胸部X線(CXR)画像の正確なラベルを提供するデータ収集・アノテーションパイプラインを提案する。
このことは、ベトナムの放射線学者や臨床医が、国によって異なる可能性のある内因性診断カテゴリと密接に一致したデータに注釈を付けることで、ベトナムの放射線技師や臨床医に利益をもたらす可能性がある。
論文 参考訳(メタデータ) (2022-09-11T06:06:03Z) - Deeper Clinical Document Understanding Using Relation Extraction [0.0]
名前付きエンティティ認識(NER)と関係抽出(RE)モデルからなるテキストマイニングフレームワークを提案する。
我々は2つの新しいREモデルアーキテクチャを導入し、BioBERTをベースとした精度最適化アーキテクチャと、フル接続ニューラルネットワーク(FCNN)上のクラフト機能を活用した速度最適化アーキテクチャを紹介した。
本稿では,この枠組みの実践的応用として,バイオメディカル知識グラフの構築と臨床コードへの実体マッピングの精度向上について述べる。
論文 参考訳(メタデータ) (2021-12-25T17:14:13Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Federated Deep AUC Maximization for Heterogeneous Data with a Constant
Communication Complexity [77.78624443410216]
異種胸部データ検出のための改良型FDAMアルゴリズムを提案する。
本研究は,提案アルゴリズムの通信が機械数に強く依存し,精度レベルにも強く依存していることを示す。
FDAMアルゴリズムのベンチマークデータセットと、異なる組織の医療用胸部X線画像に対する効果を実験により実証した。
論文 参考訳(メタデータ) (2021-02-09T04:05:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。