論文の概要: SDOH-NLI: a Dataset for Inferring Social Determinants of Health from
Clinical Notes
- arxiv url: http://arxiv.org/abs/2310.18431v1
- Date: Fri, 27 Oct 2023 19:09:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 18:47:47.408403
- Title: SDOH-NLI: a Dataset for Inferring Social Determinants of Health from
Clinical Notes
- Title(参考訳): SDOH-NLI : 臨床ノートから健康決定因子を推定するためのデータセット
- Authors: Adam D. Lelkes, Eric Loreaux, Tal Schuster, Ming-Jun Chen, Alvin
Rajkomar
- Abstract要約: 社会的および行動的健康決定因子(SDOH)は、健康結果を形成する上で重要な役割を果たす。
このタスクにNLPメソッドを使うことの進歩は、高品質な公開ラベル付きデータの不足によって妨げられている。
本稿では,公開ノートをベースとした新たなデータセットであるSDOH-NLIを紹介する。
- 参考スコア(独自算出の注目度): 13.991819517682574
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Social and behavioral determinants of health (SDOH) play a significant role
in shaping health outcomes, and extracting these determinants from clinical
notes is a first step to help healthcare providers systematically identify
opportunities to provide appropriate care and address disparities. Progress on
using NLP methods for this task has been hindered by the lack of high-quality
publicly available labeled data, largely due to the privacy and regulatory
constraints on the use of real patients' information. This paper introduces a
new dataset, SDOH-NLI, that is based on publicly available notes and which we
release publicly. We formulate SDOH extraction as a natural language inference
(NLI) task, and provide binary textual entailment labels obtained from human
raters for a cross product of a set of social history snippets as premises and
SDOH factors as hypotheses. Our dataset differs from standard NLI benchmarks in
that our premises and hypotheses are obtained independently. We evaluate both
"off-the-shelf" entailment models as well as models fine-tuned on our data, and
highlight the ways in which our dataset appears more challenging than commonly
used NLI datasets.
- Abstract(参考訳): 社会的および行動的健康決定因子(SDOH)は、健康結果を形成する上で重要な役割を担い、臨床ノートからこれらの決定因子を抽出することは、医療提供者が適切なケアを提供し、格差に対処する機会を体系的に特定するための第一歩である。
このタスクにNLPメソッドを使うことの進歩は、実際の患者の情報の使用に関するプライバシーと規制の制約により、高品質な公開ラベル付きデータの不足によって妨げられている。
本稿では,公開ノートをベースとした新たなデータセットであるSDOH-NLIを紹介する。
我々は、自然言語推論(NLI)タスクとしてSDOH抽出を定式化し、社会史スニペットの集合を前提とし、SDOH因子を仮説として、人間のラッカーから得られたバイナリテキストエンターメントラベルを提供する。
我々のデータセットは標準のNLIベンチマークと異なり、前提と仮説は独立して得られる。
包含モデルとデータに微調整されたモデルの両方を評価し、一般的なnliデータセットよりもデータセットがより難しいように見える方法を強調します。
関連論文リスト
- Your Model Is Not Predicting Depression Well And That Is Why: A Case
Study of PRIMATE Dataset [0.0]
ソーシャルメディアのテキストからNLPに基づく抑うつレベル推定に使用されるメンタルヘルスデータセットのアノテーションの品質について検討する。
本研究は,アノテーションの妥当性,特に関心の欠如や快楽症状に対する懸念を明らかにする。
Data Use Agreementの下でリリースされる当社の洗練されたアノテーションは、アンヘドニア検出のための高品質なテストセットを提供します。
論文 参考訳(メタデータ) (2024-03-01T10:47:02Z) - Evaluating the Impact of Social Determinants on Health Prediction in the
Intensive Care Unit [10.764842579064636]
健康の社会的決定因子(SDOH)は、人の健康と幸福に重要な役割を果たす。
電子健康記録に基づくリスク予測モデルの多くは、包括的なSDOH機能群を含まない。
我々の研究は、公開のEHRデータベースMIMIC-IVをドキュメント化されたSDOH機能にリンクしています。
論文 参考訳(メタデータ) (2023-05-22T01:27:51Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - SPeC: A Soft Prompt-Based Calibration on Performance Variability of
Large Language Model in Clinical Notes Summarization [50.01382938451978]
本稿では,ソフトプロンプトを用いたモデルに依存しないパイプラインを導入し,確率に基づく要約の利点を保ちながら分散を減少させる。
実験結果から,本手法は性能を向上するだけでなく,様々な言語モデルの分散を効果的に抑制することが明らかとなった。
論文 参考訳(メタデータ) (2023-03-23T04:47:46Z) - Leveraging Natural Language Processing to Augment Structured Social
Determinants of Health Data in the Electronic Health Record [1.7812428873698403]
健康の社会的決定因子(SDOH)は健康に影響を及ぼす。
臨床ノートにはより包括的なSDOH情報が含まれていることが多い。
我々は,ディープラーニングエンティティと関係抽出アーキテクチャを用いた新しいSDOH抽出器を開発した。
論文 参考訳(メタデータ) (2022-12-14T22:51:49Z) - Healthsheet: Development of a Transparency Artifact for Health Datasets [13.57051456780329]
健康に配慮したアンケートデータシートであるHealthsheetを紹介した。
ケーススタディとして、公開可能な3つの医療データセットと連携しています。
論文 参考訳(メタデータ) (2022-02-26T01:05:55Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Automatically Identifying Semantic Bias in Crowdsourced Natural Language
Inference Datasets [78.6856732729301]
NLIデータセットに仮説を組み込んだ学習空間に"バイアスクラスタ"を見つけるために,モデル駆動で教師なしの手法を導入する。
データセットの仮説分布のセマンティックバイアスを改善するために、介入と追加のラベリングを行うことができる。
論文 参考訳(メタデータ) (2021-12-16T22:49:01Z) - An Empirical Survey of Data Augmentation for Limited Data Learning in
NLP [88.65488361532158]
豊富なデータへの依存は、低リソース設定や新しいタスクにNLPモデルを適用するのを防ぐ。
NLPにおけるデータ効率を改善する手段として,データ拡張手法が検討されている。
限定ラベル付きデータ設定におけるNLPのデータ拡張に関する最近の進展を実証的に調査する。
論文 参考訳(メタデータ) (2021-06-14T15:27:22Z) - Anonymizing Data for Privacy-Preserving Federated Learning [3.3673553810697827]
我々は,フェデレートラーニングの文脈において,プライバシを提供するための最初の構文的アプローチを提案する。
当社のアプローチは,プライバシの保護レベルをサポートしながら,実用性やモデルの性能を最大化することを目的としている。
医療領域における2つの重要な課題について,100万人の患者の実世界電子健康データを用いて包括的実証評価を行った。
論文 参考訳(メタデータ) (2020-02-21T02:30:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。