論文の概要: CCS Explorer: Relevance Prediction, Extractive Summarization, and Named
Entity Recognition from Clinical Cohort Studies
- arxiv url: http://arxiv.org/abs/2211.00201v1
- Date: Tue, 1 Nov 2022 00:30:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 12:48:07.924304
- Title: CCS Explorer: Relevance Prediction, Extractive Summarization, and Named
Entity Recognition from Clinical Cohort Studies
- Title(参考訳): ccsエクスプローラー:臨床コホート研究からの関連性予測、抽出要約、名前付きエンティティ認識
- Authors: Irfan Al-Hussaini, Davi Nakajima An, Albert J. Lee, Sarah Bi, Cassie
S. Mitchell
- Abstract要約: CCSエクスプローラーは、文の関連性予測、抽出要約、患者、結果、介入エンティティ検出のためのエンドツーエンドシステムである。
CCSエクスプローラーはウェブベースのグラフィカルユーザーインタフェースにパッケージされており、ユーザーはどんな病名も提供できる。
CCSエクスプローラーは、これらのタスクごとに追加のレイヤを持つトランスフォーマーに基づいて、事前訓練された言語モデルを微調整する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical Cohort Studies (CCS) are a great source of documented clinical
research. Ideally, a clinical expert will interpret these articles for
exploratory analysis ranging from drug discovery for evaluating the efficacy of
existing drugs in tackling emerging diseases to the first test of newly
developed drugs. However, more than 100 CCS articles are published on PubMed
every day. As a result, it can take days for a doctor to find articles and
extract relevant information. Can we find a way to quickly sift through the
long list of these articles faster and document the crucial takeaways from each
of these articles? In this work, we propose CCS Explorer, an end-to-end system
for relevance prediction of sentences, extractive summarization, and patient,
outcome, and intervention entity detection from CCS. CCS Explorer is packaged
in a web-based graphical user interface where the user can provide any disease
name. CCS Explorer then extracts and aggregates all relevant information from
articles on PubMed based on the results of an automatically generated query
produced on the back-end. CCS Explorer fine-tunes pre-trained language models
based on transformers with additional layers for each of these tasks. We
evaluate the models using two publicly available datasets. CCS Explorer obtains
a recall of 80.2%, AUC-ROC of 0.843, and an accuracy of 88.3% on sentence
relevance prediction using BioBERT and achieves an average Micro F1-Score of
77.8% on Patient, Intervention, Outcome detection (PIO) using PubMedBERT. Thus,
CCS Explorer can reliably extract relevant information to summarize articles,
saving time by ~ 660$\times$.
- Abstract(参考訳): 臨床コホート研究(CCS)は、文書化された臨床研究の大きな源である。
理想的には、臨床の専門家は、既存の薬物の新興疾患に対する有効性を評価するための薬の発見から、新しく開発された薬物の最初の試験まで、探索的分析のためにこれらの論文を解釈する。
しかし、毎日100以上のCCS記事がPubMedに掲載されている。
その結果、医師が記事を見つけ、関連する情報を抽出するのに何日もかかる可能性がある。
これらの記事の長いリストを素早く掘り下げて、これらの記事の要点を文書化する方法を見つけることはできますか?
本研究では,文の関連性予測,抽出要約,患者,結果,介入エンティティ検出のためのエンドツーエンドシステムであるCSエクスプローラーを提案する。
CCSエクスプローラーはウェブベースのグラフィカルユーザーインタフェースにパッケージされており、ユーザーはどんな病名も提供できる。
CCS Explorerは、バックエンドで自動生成されたクエリの結果に基づいて、PubMedの記事から関連するすべての情報を抽出し、集約する。
CCSエクスプローラーは、これらのタスクごとに追加レイヤを持つトランスフォーマーに基づいて、事前訓練された言語モデルを微調整する。
2つの公開データセットを用いてモデルを評価する。
CCSエクスプローラーは80.2%、AUC-ROC 0.843、BioBERTを用いた文関連予測では88.3%のリコールを取得し、PubMedBERTを用いた患者、介入、アウトカム検出(PIO)では平均77.8%のマイクロF1スコアを達成した。
これにより、ccsエクスプローラーは関連情報を確実に抽出して記事を要約し、660$\times$で節約することができる。
関連論文リスト
- TotalSegmentator MRI: Sequence-Independent Segmentation of 59 Anatomical Structures in MR images [62.53931644063323]
本研究では,TotalSegmentatorをMR画像に拡張した。
このデータセットに基づいてnnU-Netセグメンテーションアルゴリズムを訓練し、類似度係数(Dice)を計算し、モデルの性能を評価した。
このモデルは、他の2つの公開セグメンテーションモデル(Dice score 0.824 vs 0.762; p0.001 and 0.762 versus 0.542; p)を大きく上回った。
論文 参考訳(メタデータ) (2024-05-29T20:15:54Z) - Machine Learning to Promote Translational Research: Predicting Patent
and Clinical Trial Inclusion in Dementia Research [0.0]
認知症は、2040年までに英国で6100万人に影響を及ぼし、年間25億ポンドの費用がかかると予想されている。
1990~2023年の間に、イギリスの認知症研究出版物43,091件からDmensionsデータベースを用いてデータを抽出した。
特許の予測では、受信者動作特性曲線(AUROC)の精度は0.84と77.17%であり、臨床試験の精度は0.81と75.11%である。
論文 参考訳(メタデータ) (2024-01-10T13:25:49Z) - Leveraging deep active learning to identify low-resource mobility
functioning information in public clinical notes [0.157286095422595]
国際機能・障害・健康分類(ICF)のモビリティ領域に関する最初の公開アノテートデータセット
我々はNational NLP Clinical Challenges (n2c2) 研究データセットを用いてキーワード拡張を用いた候補文のプールを構築する。
最終的なデータセットは,5,511のアクションエンティティ,5,328のモビリティエンティティ,306のアシストエンティティ,639の量子化エンティティを含む,合計11,784のエンティティからなる4,265の文で構成されています。
論文 参考訳(メタデータ) (2023-11-27T15:53:11Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - Towards Unifying Anatomy Segmentation: Automated Generation of a
Full-body CT Dataset via Knowledge Aggregation and Anatomical Guidelines [113.08940153125616]
我々は533巻のボクセルレベルのラベルを142ドル(約1万2000円)で、全身CTスキャンのデータセットを作成し、解剖学的包括的カバレッジを提供する。
提案手法はラベル集約段階において手作業によるアノテーションに依存しない。
我々はCTデータに142ドルの解剖学的構造を予測できる統一解剖学的セグメンテーションモデルをリリースする。
論文 参考訳(メタデータ) (2023-07-25T09:48:13Z) - Detecting automatically the layout of clinical documents to enhance the
performances of downstream natural language processing [53.797797404164946]
我々は,臨床用PDF文書を処理し,臨床用テキストのみを抽出するアルゴリズムを設計した。
このアルゴリズムは、PDFを使った最初のテキスト抽出と、続いてボディテキスト、左書き、フッタなどのカテゴリに分類される。
それぞれのセクションのテキストから興味ある医学的概念を抽出し,医療的パフォーマンスを評価した。
論文 参考訳(メタデータ) (2023-05-23T08:38:33Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Natural Language Processing Methods to Identify Oncology Patients at
High Risk for Acute Care with Clinical Notes [9.49721872804122]
本研究は, がん患者の急性期治療(ACU)のリスクを明らかにするために, 自然言語処理がいかに有用かを評価するものである。
構造化健康データ(SHD)を用いたリスク予測は標準となっているが、自由テキスト形式を用いた予測は複雑である。
論文 参考訳(メタデータ) (2022-09-28T06:31:19Z) - CLIP: A Dataset for Extracting Action Items for Physicians from Hospital
Discharge Notes [17.107315598110183]
我々はMIMIC-III上に注釈付けされた臨床行動項目のデータセットを作成する。
このデータセットはCLIPと呼ばれ、医師によって注釈付けされ、1万の文章を表す文書をカバーしています。
本稿では,これらの文書からアクション項目を抽出するタスクを多アスペクト抽出要約として記述する。
論文 参考訳(メタデータ) (2021-06-04T14:49:02Z) - HINT: Hierarchical Interaction Network for Trial Outcome Prediction
Leveraging Web Data [56.53715632642495]
臨床試験は、有効性、安全性、または患者採用の問題により、不確実な結果に直面する。
本稿では,より一般的な臨床試験結果予測のための階層型Interaction Network(HINT)を提案する。
論文 参考訳(メタデータ) (2021-02-08T15:09:07Z) - Multiple Sclerosis Severity Classification From Clinical Text [5.8335613930036265]
本報告では,MIMIC以外の臨床データに基づいてトレーニングした最初の公開トランスフォーマーモデルであるMS-BERTについて述べる。
次に、MS-BERTを用いて埋め込みを生成し、EDSSと関数サブスコアを予測する分類器MSBCを提案する。
最後に、Snorkelを用いてMSBCを他のモデルと組み合わせて、競合しないコンサルティングノートのスコアを生成する方法について検討する。
論文 参考訳(メタデータ) (2020-10-29T02:15:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。