Fugu-MT 論文翻訳(概要): SODA: A Natural Language Processing Package to Extract Social Determinants of Health for Cancer Studies

論文の概要: SODA: A Natural Language Processing Package to Extract Social Determinants of Health for Cancer Studies

arxiv url: http://arxiv.org/abs/2212.03000v2
Date: Thu, 18 May 2023 18:39:20 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-22 19:35:06.103575
Title: SODA: A Natural Language Processing Package to Extract Social Determinants of Health for Cancer Studies
Title（参考訳）: soda: がん研究のための健康の社会的決定要因を抽出するための自然言語処理パッケージ
Authors: Zehao Yu, Xi Yang, Chong Dang, Prakash Adekkanattu, Braja Gopal Patra, Yifan Peng, Jyotishman Pathak, Debbie L. Wilson, Ching-Yuan Chang, Wei-Hsuan Lo-Ciganic, Thomas J. George, William R. Hogan, Yi Guo, Jiang Bian, Yonghui Wu
Abstract要約: 我々は,がん患者の健康決定因子(SDoH)を抽出するために,事前学習したトランスフォーマーモデルを用いたオープンソースパッケージSODA(Social DeterminAnts)の開発を目指している。 SDoHの分類と属性を同定し,一般がんコホートを用いたSDoHコーパスを開発した。 SDoHを抽出するために4つのトランスフォーマーベースNLPモデルを比較し,オピオイドを処方した患者のコホートとNLPモデルの一般化性を検討した。
参考スコア（独自算出の注目度）: 34.24528053846599
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Objective: We aim to develop an open-source natural language processing (NLP) package, SODA (i.e., SOcial DeterminAnts), with pre-trained transformer models to extract social determinants of health (SDoH) for cancer patients, examine the generalizability of SODA to a new disease domain (i.e., opioid use), and evaluate the extraction rate of SDoH using cancer populations. Methods: We identified SDoH categories and attributes and developed an SDoH corpus using clinical notes from a general cancer cohort. We compared four transformer-based NLP models to extract SDoH, examined the generalizability of NLP models to a cohort of patients prescribed with opioids, and explored customization strategies to improve performance. We applied the best NLP model to extract 19 categories of SDoH from the breast (n=7,971), lung (n=11,804), and colorectal cancer (n=6,240) cohorts. Results and Conclusion: We developed a corpus of 629 cancer patients notes with annotations of 13,193 SDoH concepts/attributes from 19 categories of SDoH. The Bidirectional Encoder Representations from Transformers (BERT) model achieved the best strict/lenient F1 scores of 0.9216 and 0.9441 for SDoH concept extraction, 0.9617 and 0.9626 for linking attributes to SDoH concepts. Fine-tuning the NLP models using new annotations from opioid use patients improved the strict/lenient F1 scores from 0.8172/0.8502 to 0.8312/0.8679. The extraction rates among 19 categories of SDoH varied greatly, where 10 SDoH could be extracted from >70% of cancer patients, but 9 SDoH had a low extraction rate (<70% of cancer patients). The SODA package with pre-trained transformer models is publicly available at https://github.com/uf-hobiinformatics-lab/SDoH_SODA.
Abstract（参考訳）: 目的: がん患者に対する社会的決定因子(SDoH)を抽出するための事前学習型トランスフォーマーモデルを用いて, オープンソース自然言語処理(NLP)パッケージであるSODA(Social DeterminAnts)を開発し, 新しい疾患領域(オピオイド使用)へのSODAの一般化可能性を検討すること, がん集団を用いたSDoHの抽出率を評価することを目的とする。方法:sdoh分類と属性を同定し,一般がんコホートからの臨床ノートを用いたsdohコーパスを開発した。 SDoHを抽出するために4つのトランスフォーマーベースNLPモデルを比較し,オピオイドを処方した患者のコホートとNLPモデルの一般化性を検討した。乳癌(n=7,971),肺(n=11,804),大腸癌(n=6,240)コホートから19種類のSDoHを抽出した。結果と結論: SDoHの19カテゴリから13,193のSDoH概念/属性の注釈を付した629名のがん患者のコーパスを作成した。変換器(BERT)モデルによる双方向エンコーダ表現は,SDoH概念抽出において0.9216,0.9441,属性をSDoH概念にリンクする0.9617,0.9626の厳密/高信頼F1スコアを達成した。オピオイド患者からの新しいアノテーションを用いてNLPモデルを微調整し、厳密/高信頼F1スコアを0.8172/0.8502から0.8312/0.8679に改善した。 19種類のSDoHの抽出率は, がん患者の70%から10個のSDoHを抽出できるが, 9個のSDoHは低抽出率(がん患者の70%)であった。事前トレーニングされたトランスフォーマーモデルを備えたSODAパッケージはhttps://github.com/uf-hobiinformatics-lab/SDoH_SODAで公開されている。

関連論文リスト

Explainable Admission-Level Predictive Modeling for Prolonged Hospital Stay in Elderly Populations: Challenges in Low- and Middle-Income Countries [65.4286079244589]
長期滞在期間 (pLoS) は, 院内感染のリスクに関連する重要な要因である。入院レベルの患者と病院の診療データを用いて, pLosの予測モデルを開発し, 解説する。
論文参考訳（メタデータ） (2026-01-07T23:35:24Z)
Vision-Language Model-Based Semantic-Guided Imaging Biomarker for Early Lung Cancer Detection [1.5391321019692428]
本研究は, 放射線技師による結節評価から得られた意味的特徴を統合することを目的としており, 肺がん予測のための臨床的, 堅牢, 説明可能な特徴を学習できるようにする。比較言語-画像事前訓練モデルにパラメータ効率の良い微調整手法を適用し, 画像特徴と意味的特徴を一致させ, 1年間の肺がん診断を予測した。我々のモデルは、AUROCが0.90、AUPRCが0.78で、外部データセットのベースライン・オブ・ザ・アーティファクトモデルよりも優れていることを示した。
論文参考訳（メタデータ） (2025-04-30T06:11:34Z)
Multi-modal AI for comprehensive breast cancer prognostication [18.691704371847855]
そこで我々は,新しいAI手法を用いて,デジタル病理と臨床特性に基づく乳癌患者層化試験を開発した。この検査は15のコホートにまたがる8,161人の乳癌患者のデータを用いて開発・評価された。その結果、我々のAIテストは精度を向上し、幅広い患者に適用性を高め、治療選択ツールへのアクセスを向上させることが示唆された。
論文参考訳（メタデータ） (2024-10-28T17:54:29Z)
Improving Fairness of Automated Chest X-ray Diagnosis by Contrastive Learning [19.948079693716075]
提案するAIモデルは、教師付きコントラスト学習を利用して、CXR診断におけるバイアスを最小限にする。 77,887個のCXR画像を用いたMIDRCデータセットと,112,120個のCXR画像を用いたNIH Chest X-rayデータセットの2つのデータセットについて評価を行った。
論文参考訳（メタデータ） (2024-01-25T20:03:57Z)
Improving Precancerous Case Characterization via Transformer-based Ensemble Learning [31.891340667123124]
自然言語処理のがん病理学報告への応用は、がん症例の検出に焦点が当てられている。先天性腺腫のキャラクタリゼーションの改善は、早期がんの検出と予防のための診断試験の開発を支援する。以上の結果から,NLPを用いて早期がん予防のための診断試験の開発を促進できる可能性が示唆された。
論文参考訳（メタデータ） (2022-12-10T00:06:28Z)
WSSS4LUAD: Grand Challenge on Weakly-supervised Tissue Semantic Segmentation for Lung Adenocarcinoma [51.50991881342181]
この課題には10,091個のパッチレベルのアノテーションと1300万以上のラベル付きピクセルが含まれる。第一位チームは0.8413mIoUを達成した(腫瘍:0.8389、ストーマ:0.7931、正常:0.8919)。
論文参考訳（メタデータ） (2022-04-13T15:27:05Z)
A Deep Learning Based Workflow for Detection of Lung Nodules With Chest Radiograph [0.0]
CXRから肺領域を識別するセグメンテーションモデルを構築し,それを16個のパッチに分割した。これらのラベル付きパッチを使用して、ディープニューラルネットワーク(DNN)モデルを微調整し、パッチをポジティブまたはネガティブに分類する。
論文参考訳（メタデータ） (2021-12-19T16:19:46Z)
Bootstrapping Your Own Positive Sample: Contrastive Learning With Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。 EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文参考訳（メタデータ） (2021-04-07T06:02:04Z)
CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。 SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文参考訳（メタデータ） (2020-07-20T21:47:28Z)
Automated Quantification of CT Patterns Associated with COVID-19 from Chest CT [48.785596536318884]
提案法は,非造影胸部CTを入力として,病変,肺,葉を3次元に分割する。この方法では、肺の重症度と葉の関与度を2つの組み合わせて測定し、COVID-19の異常度と高不透明度の存在度を定量化する。このアルゴリズムの評価は、カナダ、ヨーロッパ、米国からの200人の参加者(感染者100人、健康管理100人)のCTで報告されている。
論文参考訳（メタデータ） (2020-04-02T21:49:14Z)
Machine-Learning-Based Multiple Abnormality Prediction with Large-Scale Chest Computed Tomography Volumes [64.21642241351857]
19,993症例から36,316巻の胸部CTデータセットを収集,解析した。自由テキストラジオグラフィーレポートから異常ラベルを自動的に抽出するルールベース手法を開発した。胸部CTボリュームの多臓器・多臓器分類モデルも開発した。
論文参考訳（メタデータ） (2020-02-12T00:59:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。