論文の概要: Cross-institution text mining to uncover clinical associations: a case
study relating social factors and code status in intensive care medicine
- arxiv url: http://arxiv.org/abs/2301.06570v1
- Date: Mon, 16 Jan 2023 19:04:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 15:33:22.121238
- Title: Cross-institution text mining to uncover clinical associations: a case
study relating social factors and code status in intensive care medicine
- Title(参考訳): 病院間テキストマイニングによる臨床研究 : 集中医療における社会的要因とコードステータスとの関連
- Authors: Madhumita Sushil, Atul J. Butte, Ewoud Schuit, Maarten van Smeden,
Artuur M. Leeuwenberg
- Abstract要約: インテリア・インテリア・インテリア・インスティテュート・インスティテュート・インスティテュート・インスティテュート・インスティテュート・インスティート・インスティート・インスティート・インスティート・インスティート・インスティルト・インスティート・インスティート・インスティート
本研究は, 社会的要因の関連性について検討し, ド・リサミネート/インキュベート・コードを用いて検討した。
- 参考スコア(独自算出の注目度): 0.27998963147546146
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: Text mining of clinical notes embedded in electronic medical
records is increasingly used to extract patient characteristics otherwise not
or only partly available, to assess their association with relevant health
outcomes. As manual data labeling needed to develop text mining models is
resource intensive, we investigated whether off-the-shelf text mining models
developed at external institutions, together with limited within-institution
labeled data, could be used to reliably extract study variables to conduct
association studies.
Materials and Methods: We developed multiple text mining models on different
combinations of within-institution and external-institution data to extract
social factors from discharge reports of intensive care patients. Subsequently,
we assessed the associations between social factors and having a
do-not-resuscitate/intubate code. Results: Important differences were found
between associations based on manually labeled data compared to text-mined
social factors in three out of five cases. Adopting external-institution text
mining models using manually labeled within-institution data resulted in models
with higher F1-scores, but not in meaningfully different associations.
Discussion: While text mining facilitated scaling analyses to larger samples
leading to discovering a larger number of associations, the estimates may be
unreliable. Confirmation is needed with better text mining models, ideally on a
larger manually labeled dataset.
Conclusion: The currently used text mining models were not sufficiently
accurate to be used reliably in an association study. Model adaptation using
within-institution data did not improve the estimates. Further research is
needed to set conditions for reliable use of text mining in medical research.
- Abstract(参考訳): 目的: 電子カルテに埋め込まれた臨床記録のテキストマイニングは, 患者の特徴を抽出し, 関連する健康状態との関連性を評価するためにますます利用されている。
テキストマイニングモデルの開発に必要な手作業のデータラベリングが資源集約的であることから,外部機関で開発された既製テキストマイニングモデルと限られた内部ラベリングデータを用いて,研究変数を確実に抽出して関連研究を行うことができるか検討した。
資料と方法: 集中治療患者の退院報告から社会的要因を抽出するために, 施設内データと施設外データを組み合わせた複数のテキストマイニングモデルを開発した。
その後, 社会的要因とDo-not-resuscitate/inubate符号の関連性を検討した。
結果: 5例中3例において,手動ラベルデータに基づく関連関係とテキストマインド・ソーシャル・ファクターとの有意差がみられた。
手動ラベル付き内部データを用いた外部機関テキストマイニングモデルの採用により、f1-scoreが高いが有意義な関連はないモデルが誕生した。
議論: テキストマイニングは、より大きなサンプルへのスケール分析を促進し、より多くの関連の発見につながったが、その推定は信頼性に欠ける可能性がある。
より優れたテキストマイニングモデル、理想的にはより大きな手動ラベル付きデータセットで確認する必要がある。
結論: 現在使用されているテキストマイニングモデルは, 関連研究において十分な精度は得られなかった。
施設内データを用いたモデル適応では, 評価は改善しなかった。
医学研究におけるテキストマイニングの信頼性確保のためには,さらなる研究が必要である。
関連論文リスト
- Improving Extraction of Clinical Event Contextual Properties from Electronic Health Records: A Comparative Study [2.0884301753594334]
本研究は,医学テキスト分類のための様々な自然言語モデルの比較分析を行う。
BERTはBi-LSTMモデルを最大28%、ベースラインのBERTモデルを最大16%上回り、マイノリティクラスをリコールする。
論文 参考訳(メタデータ) (2024-08-30T10:28:49Z) - Federated Learning on Transcriptomic Data: Model Quality and Performance
Trade-Offs [0.0]
大規模なゲノムまたは転写データの機械学習は、多くの新しい健康アプリケーションにとって重要である。
プライバシーと規制上の理由から、信頼できるサードパーティですべてのデータを集約することも問題となる。
生データを交換することなく、分散型で協調的な機械学習を可能にするため、フェデレーション学習は有望なソリューションである。
論文 参考訳(メタデータ) (2024-02-22T13:21:26Z) - Data Augmentations for Improved (Large) Language Model Generalization [17.75815547057179]
本稿では,データの因果構造を知ることによって導かれる反ファクト的データ拡張を用いて,突発的特徴に対する介入をシミュレートすることを提案する。
この戦略は,ラベルが属性と突発的に相関しているような予測問題に適していることを示す。
論文 参考訳(メタデータ) (2023-10-19T14:59:25Z) - Sample Size in Natural Language Processing within Healthcare Research [0.14865681381012494]
事前収集されたデータの十分なコーパスの欠如は、新しい研究のためにサンプルサイズを決定する際の制限要因となる可能性がある。
本稿では、医療領域におけるテキスト分類タスクのサンプルサイズを推奨することで、この問題に対処しようとする。
論文 参考訳(メタデータ) (2023-09-05T13:42:43Z) - Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。
本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。
提案手法により,下流タスクの性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-03-08T03:56:31Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Improving Clinical Document Understanding on COVID-19 Research with
Spark NLP [0.0]
世界的な新型コロナウイルスのパンデミックの後、ウイルスを研究する科学論文の数は大幅に増加しました。
これまでの取り組みを3つの方法で改善する臨床テキストマイニングシステムを紹介します。
まず、健康、解剖学、リスクファクター、有害事象の社会的決定要因を含む100以上の異なるエンティティタイプを認識することができます。
第2に、テキスト処理パイプラインは、アサーション状態検出を含み、患者以外の誰かの存在、欠如、条件付き、または、患者に関する臨床事実を区別する。
論文 参考訳(メタデータ) (2020-12-07T19:17:05Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。