論文の概要: Extracting periodontitis diagnosis in clinical notes with RoBERTa and
regular expression
- arxiv url: http://arxiv.org/abs/2311.10809v1
- Date: Fri, 17 Nov 2023 18:09:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 14:12:35.801830
- Title: Extracting periodontitis diagnosis in clinical notes with RoBERTa and
regular expression
- Title(参考訳): 臨床ノートによる歯周炎診断のロバータによる抽出と正規発現
- Authors: Yao-Shun Chuang, Chun-Teh Lee, Ryan Brandon, Trung Duong Tran,
Oluwabunmi Tokede, Muhammad F. Walji, Xiaoqian Jiang
- Abstract要約: 正規表現法 (RE) の2段階の複雑さを用いて, トレーニングデータの抽出と生成を行った。
SpaCyパッケージとRoBERTaトランスフォーマーモデルは、NERモデルの構築と手作業によるゴールド標準による性能評価に使用された。
NERモデルは評価基準で0.84-0.92を示す単純なRE法と、評価で0.95-0.99を示す高度なRE法と組み合わせRE法とで優れた予測を示した。
- 参考スコア(独自算出の注目度): 6.636721448099117
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study aimed to utilize text processing and natural language processing
(NLP) models to mine clinical notes for the diagnosis of periodontitis and to
evaluate the performance of a named entity recognition (NER) model on different
regular expression (RE) methods. Two complexity levels of RE methods were used
to extract and generate the training data. The SpaCy package and RoBERTa
transformer models were used to build the NER model and evaluate its
performance with the manual-labeled gold standards. The comparison of the RE
methods with the gold standard showed that as the complexity increased in the
RE algorithms, the F1 score increased from 0.3-0.4 to around 0.9. The NER
models demonstrated excellent predictions, with the simple RE method showing
0.84-0.92 in the evaluation metrics, and the advanced and combined RE method
demonstrating 0.95-0.99 in the evaluation. This study provided an example of
the benefit of combining NER methods and NLP models in extracting target
information from free-text to structured data and fulfilling the need for
missing diagnoses from unstructured notes.
- Abstract(参考訳): 本研究の目的は、テキスト処理と自然言語処理(NLP)モデルを用いて歯周炎診断のための臨床ノートをマイニングし、異なる正規表現(RE)法を用いて名前付きエンティティ認識(NER)モデルの性能を評価することである。
トレーニングデータの抽出と生成には,RE法の2つの複雑さレベルが用いられた。
SpaCyパッケージとRoBERTaトランスフォーマーモデルは、NERモデルの構築と手作業によるゴールド標準による性能評価に使用された。
RE法と金標準法を比較すると、REアルゴリズムの複雑さが増大すると、F1スコアは0.3-0.4から0.9に増加した。
NERモデルは評価基準で0.84-0.92を示す単純なRE法と、評価で0.95-0.99を示す高度なRE法と組み合わせRE法で優れた予測を示した。
本研究では,NER法とNLPモデルを組み合わせることで,自由テキストから構造化データへ対象情報を抽出し,非構造化ノートから欠損診断を行う必要性を満たす。
関連論文リスト
- RaTEScore: A Metric for Radiology Report Generation [59.37561810438641]
本稿では,Radiological Report (Text) Evaluation (RaTEScore) として,新しい実体認識尺度を提案する。
RaTEScoreは、診断結果や解剖学的詳細などの重要な医療機関を強調し、複雑な医学的同義語に対して堅牢であり、否定表現に敏感である。
我々の評価は、RaTEScoreが既存の指標よりも人間の嗜好とより密接に一致していることを示し、確立された公開ベンチマークと、新たに提案したRaTE-Evalベンチマークの両方で検証した。
論文 参考訳(メタデータ) (2024-06-24T17:49:28Z) - Reshaping Free-Text Radiology Notes Into Structured Reports With Generative Transformers [0.29530625605275984]
構造化報告(SR)は様々な医療社会で推奨されている。
自由テキストレポートから情報を抽出するパイプラインを提案する。
我々の研究は自然言語処理(NLP)とトランスフォーマーベースのモデルを活用することを目的としている。
論文 参考訳(メタデータ) (2024-03-27T18:38:39Z) - Use GPT-J Prompt Generation with RoBERTa for NER Models on Diagnosis
Extraction of Periodontal Diagnosis from Electronic Dental Records [6.636721448099117]
GPT-Jモデルによる即時生成は、金標準を試験し、種を生成するために利用された。
性能はF1スコアで0.92-0.97と、RoBERTaモデルでトレーニングした後の全ての設定で整合性を示した。
論文 参考訳(メタデータ) (2023-11-17T18:14:08Z) - ssVERDICT: Self-Supervised VERDICT-MRI for Enhanced Prostate Tumour
Characterisation [2.755232740505053]
トレーニングデータなしでVERDICT推定パラメータマップを適合させる自己教師型ニューラルネットワーク。
本研究では,SsVERDICTの性能を拡散MRIモデルに適合する2つの確立されたベースライン法と比較する。
論文 参考訳(メタデータ) (2023-09-12T14:31:33Z) - Less is More: Mitigate Spurious Correlations for Open-Domain Dialogue
Response Generation Models by Causal Discovery [52.95935278819512]
本研究で得られたCGDIALOGコーパスに基づくオープンドメイン応答生成モデルのスプリアス相関に関する最初の研究を行った。
因果探索アルゴリズムに着想を得て,反応生成モデルの学習と推論のための新しいモデル非依存手法を提案する。
論文 参考訳(メタデータ) (2023-03-02T06:33:48Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Prediction of drug effectiveness in rheumatoid arthritis patients based
on machine learning algorithms [2.5759046095742453]
慢性関節リウマチ(RA)は、患者の免疫系が誤って自身の組織を標的としたときに引き起こされる自己免疫疾患である。
機械学習(ML)は、患者の電子的健康記録のパターンを特定し、患者の結果を改善する最良の臨床治療を予測する可能性がある。
本研究は, 臨床データから情報を取り出すためのデータ処理パイプラインを設計し, 機能的使用のために前処理し, 2) 薬物に対するRA患者の反応を予測し, 分類モデルの性能を評価するためのTNFフレームワークを導入した。
論文 参考訳(メタデータ) (2022-10-14T15:15:37Z) - Natural Language Processing Methods to Identify Oncology Patients at
High Risk for Acute Care with Clinical Notes [9.49721872804122]
本研究は, がん患者の急性期治療(ACU)のリスクを明らかにするために, 自然言語処理がいかに有用かを評価するものである。
構造化健康データ(SHD)を用いたリスク予測は標準となっているが、自由テキスト形式を用いた予測は複雑である。
論文 参考訳(メタデータ) (2022-09-28T06:31:19Z) - Improving Classification Model Performance on Chest X-Rays through Lung
Segmentation [63.45024974079371]
本稿では, セグメンテーションによる異常胸部X線(CXR)識別性能を向上させるための深層学習手法を提案する。
提案手法は,CXR画像中の肺領域を局所化するための深層ニューラルネットワーク(XLSor)と,大規模CXRデータセットで事前学習した自己教師あり運動量コントラスト(MoCo)モデルのバックボーンを用いたCXR分類モデルである。
論文 参考訳(メタデータ) (2022-02-22T15:24:06Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。