論文の概要: Clinical BioBERT Hyperparameter Optimization using Genetic Algorithm
Clinical BioBERT Hyperparameter Optimization using Genetic Algorithm
- arxiv url: http://arxiv.org/abs/2302.03822v1
- Date: Wed, 8 Feb 2023 01:11:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-09 17:43:21.338831
- Title: Clinical BioBERT Hyperparameter Optimization using Genetic Algorithm
Clinical BioBERT Hyperparameter Optimization using Genetic Algorithm
- Title(参考訳): 遺伝的アルゴリズムを用いたBioBERTハイパーパラメータ最適化による臨床BioBERTハイパーパラメータ最適化
- Authors: Navya Martin Kollapally, James Geller
- Abstract要約: 社会的健康決定因子(Social Determinants of Health, SDoH)は、社会決定因子(Social Determinants of Health, SDoH)と呼ばれる。
SDoHデータの大部分は、医師や開業医による構造化されていない臨床ノートに記録されている。
本研究は,臨床ノートから文章を抽出し,適切な概念を提供する。
- 参考スコア(独自算出の注目度): 0.15229257192293197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical factors account only for a small portion, about 10-30%, of the
controllable factors that affect an individual's health outcomes. The remaining
factors include where a person was born and raised, where he/she pursued their
education, what their work and family environment is like, etc. These factors
are collectively referred to as Social Determinants of Health (SDoH). The
majority of SDoH data is recorded in unstructured clinical notes by physicians
and practitioners. Recording SDoH data in a structured manner (in an EHR) could
greatly benefit from a dedicated ontology of SDoH terms. Our research focuses
on extracting sentences from clinical notes, making use of such an SDoH
ontology (called SOHO) to provide appropriate concepts. We utilize recent
advancements in Deep Learning to optimize the hyperparameters of a Clinical
BioBERT model for SDoH text. A genetic algorithm-based hyperparameter tuning
regimen was implemented to identify optimal parameter settings. To implement a
complete classifier, we pipelined Clinical BioBERT with two subsequent linear
layers and two dropout layers. The output predicts whether a text fragment
describes an SDoH issue of the patient. We compared the AdamW, Adafactor, and
LAMB optimizers. In our experiments, AdamW outperformed the others in terms of
accuracy.
- Abstract(参考訳): 臨床因子は、個人の健康に影響を及ぼすコントロール可能な因子のうち、わずか10~30%しか含まれていない。
残る要因は、出生・育児の場所、教育を追求した場所、仕事や家庭環境がどのようなものかなどである。
これらの要因を総称してSDoH(Social Determinants of Health)と呼ぶ。
sdohのデータの大部分は、医師や開業医による非構造化臨床記録に記録されている。
構造化された方法で(EHRで)SDoHデータを記録することは、SDoH用語の専用オントロジーから大きな恩恵を受けることができる。
本研究は臨床ノートから文章を抽出することに焦点を当て,sdohオントロジー(soho)を用いて適切な概念を提供する。
近年のDeep Learningの進歩を利用して,SDoHテキストに対する臨床用BibiBERTモデルのハイパーパラメータを最適化する。
最適なパラメータ設定を特定するために,遺伝的アルゴリズムに基づくハイパーパラメータチューニングレジームを実装した。
完全な分類器を実装するために, 臨床バイオバートを2つの線形層と2つのドロップアウト層でパイプライン化した。
出力は、テキストフラグメントが患者のSDoH問題を記述するかどうかを予測する。
我々はAdamW、Adafactor、LAMBオプティマイザを比較した。
私たちの実験では、AdamWは正確さで他よりも優れています。
関連論文リスト
- Improving Extraction of Clinical Event Contextual Properties from Electronic Health Records: A Comparative Study [2.0884301753594334]
本研究は,医学テキスト分類のための様々な自然言語モデルの比較分析を行う。
BERTはBi-LSTMモデルを最大28%、ベースラインのBERTモデルを最大16%上回り、マイノリティクラスをリコールする。
論文 参考訳(メタデータ) (2024-08-30T10:28:49Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Towards Understanding the Survival of Patients with High-Grade
Gastroenteropancreatic Neuroendocrine Neoplasms: An Investigation of Ensemble
Feature Selection in the Prediction of Overall Survival [0.0]
Ensemble機能セレクタを使えば、サンプルサイズが低いデータセットで、そのような機能を識別できる。
RENTとUBayFSは、機能選択プロセスにおいて、専門家の知識を優先的に統合することができる。
以上の結果から,両機能セレクタが正確な予測を可能にし,専門家の知識が機能セットに安定化効果があることが示唆された。
論文 参考訳(メタデータ) (2023-02-20T17:08:03Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Survival Prediction of Children Undergoing Hematopoietic Stem Cell
Transplantation Using Different Machine Learning Classifiers by Performing
Chi-squared Test and Hyper-parameter Optimization: A Retrospective Analysis [4.067706269490143]
効率的な生存率分類モデルが包括的に提示される。
欠落した値を入力し、ダミー変数符号化を用いてデータを変換し、チ二乗特徴選択を用いて59個の特徴から11個の最も相関した特徴にデータセットを圧縮することにより、合成データセットを生成する。
この点に関しては、決定木(Decision Tree)、ランダムフォレスト(Random Forest)、ロジスティック回帰(Logistic Regression)、K-Nearest Neighbors(K-Nearest Neighbors)、グラディエントブースティング(Gradient Boosting)、Ada Boost(Ada Boost)、XG Boost(XG Boost)など、いくつかの教師付きML手法が訓練された。
論文 参考訳(メタデータ) (2022-01-22T08:01:22Z) - Online Optimization of Stimulation Speed in an Auditory Brain-Computer
Interface under Time Constraints [5.695163312473305]
本稿では,個別化実験プロトコルの利点を活かし,聴覚的BCIで評価する手法を提案する。
本研究は,個別化実験プロトコルの利点を活かし,聴覚的BCIで評価する手法を提案する。
論文 参考訳(メタデータ) (2021-08-26T08:18:03Z) - Resource Planning for Hospitals Under Special Consideration of the
COVID-19 Pandemic: Optimization and Sensitivity Analysis [87.31348761201716]
新型コロナウイルス(covid-19)パンデミックのような危機は、医療機関にとって深刻な課題となる。
BaBSim.Hospitalは離散イベントシミュレーションに基づく容量計画ツールである。
BaBSim.Hospitalを改善するためにこれらのパラメータを調査し最適化することを目指しています。
論文 参考訳(メタデータ) (2021-05-16T12:38:35Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - DTR Bandit: Learning to Make Response-Adaptive Decisions With Low Regret [59.81290762273153]
動的治療体制 (DTR) はパーソナライズされ適応された多段階の治療計画であり、治療決定を個人の初期特徴に適応させ、その後の各段階における中間結果と特徴に適応させる。
本稿では,探索と搾取を慎重にバランスさせることで,遷移モデルと報酬モデルが線形である場合に,速度-最適後悔を実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-06T13:03:42Z) - Optimization of Genomic Classifiers for Clinical Deployment: Evaluation
of Bayesian Optimization to Select Predictive Models of Acute Infection and
In-Hospital Mortality [0.0]
血液から特定の遺伝子の発現レベルを定量化することにより、患者の免疫反応を特徴づけることにより、両方のタスクを遂行する潜在的によりタイムリーで正確な手段を示す。
機械学習手法は、デプロイ対応の分類モデルの開発にこの‘ホスト応答’を活用するプラットフォームを提供する。
急性感染症の診断分類器の開発におけるHO法と29の診断マーカーの遺伝子発現による院内死亡率の比較を行った。
論文 参考訳(メタデータ) (2020-03-27T10:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。