論文の概要: CARE-SD: Classifier-based analysis for recognizing and eliminating stigmatizing and doubt marker labels in electronic health records: model development and validation
- arxiv url: http://arxiv.org/abs/2405.05204v1
- Date: Wed, 8 May 2024 16:40:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-09 13:55:22.253683
- Title: CARE-SD: Classifier-based analysis for recognizing and eliminating stigmatizing and doubt marker labels in electronic health records: model development and validation
- Title(参考訳): CARE-SD:電子健康記録におけるスティグマタイズと疑わしいマーカーラベルの認識と排除のための分類器に基づく分析:モデル開発と検証
- Authors: Drew Walker, Annie Thorne, Sudeshna Das, Jennifer Love, Hannah LF Cooper, Melvin Livingston III, Abeed Sarker,
- Abstract要約: 患者ラベル,疑わしいマーカー,難解な引用文などの言語的特徴を抽出するために,文献駆動の語句から辞書と正規表現のリストを作成した。
これらの辞書は、Intensive Care-IIIデータセットの特定されていない医療情報マートから1800万文にわたる一致を検索するために使用された。
各言語バイアスの特徴について,1000の文一致をサンプリングし,専門臨床および公衆衛生アノテータによってラベル付けし,教師付き学習分類器に使用した。
- 参考スコア(独自算出の注目度): 2.0509897967847563
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Objective: To detect and classify features of stigmatizing and biased language in intensive care electronic health records (EHRs) using natural language processing techniques. Materials and Methods: We first created a lexicon and regular expression lists from literature-driven stem words for linguistic features of stigmatizing patient labels, doubt markers, and scare quotes within EHRs. The lexicon was further extended using Word2Vec and GPT 3.5, and refined through human evaluation. These lexicons were used to search for matches across 18 million sentences from the de-identified Medical Information Mart for Intensive Care-III (MIMIC-III) dataset. For each linguistic bias feature, 1000 sentence matches were sampled, labeled by expert clinical and public health annotators, and used to supervised learning classifiers. Results: Lexicon development from expanded literature stem-word lists resulted in a doubt marker lexicon containing 58 expressions, and a stigmatizing labels lexicon containing 127 expressions. Classifiers for doubt markers and stigmatizing labels had the highest performance, with macro F1-scores of .84 and .79, positive-label recall and precision values ranging from .71 to .86, and accuracies aligning closely with human annotator agreement (.87). Discussion: This study demonstrated the feasibility of supervised classifiers in automatically identifying stigmatizing labels and doubt markers in medical text, and identified trends in stigmatizing language use in an EHR setting. Additional labeled data may help improve lower scare quote model performance. Conclusions: Classifiers developed in this study showed high model performance and can be applied to identify patterns and target interventions to reduce stigmatizing labels and doubt markers in healthcare systems.
- Abstract(参考訳): 目的: 自然言語処理技術を用いて集中治療用電子健康記録(EHR)において, 偏在言語の特徴を検出し, 分類する。
資料と方法:我々はまず,患者のラベル,疑わしいマーカー,EHR内での引用文など,言語的特徴を示す文献駆動の語句から辞書と正規表現のリストを作成した。
辞書はWord2VecとGPT 3.5を使ってさらに拡張され、人間の評価によって洗練された。
これらの辞書は、特定されていない医療情報マート(MIMIC-III)データセットから1800万文にわたる一致を検索するために使用された。
各言語バイアスの特徴について,1000の文一致をサンプリングし,専門臨床および公衆衛生アノテータによってラベル付けし,教師付き学習分類器に使用した。
結果: 拡張された文献ステムワードリストによる語彙発達の結果, 58の表現を含む疑わしいマーカー辞書, 127の表現を含むスティグマタイズラベル辞書が得られた。
疑わしいマーカーとスティグマティフィケーションラベルの分類器は、.84と.79のマクロF1スコア、.71から.86の正ラベルのリコールと精度値、人間のアノテータ合意(.87)と密接に一致した精度で最高性能を示した。
考察: 本研究は, 医療用テキスト中の発語ラベルと疑わしいマーカーを自動的に識別する上で, 教師付き分類器の有効性を実証し, EHR設定における言語使用の傾向を明らかにした。
ラベル付きデータを追加することで、より少ない引用モデルのパフォーマンスが向上する可能性がある。
結論: 本研究で開発された分類器は, 高いモデル性能を示し, 医療システムにおける分類ラベルや疑わしいマーカーを減らすために, パターンや標的介入の識別に応用できる。
関連論文リスト
- Beyond Label Attention: Transparency in Language Models for Automated Medical Coding via Dictionary Learning [27.778160315671776]
辞書の特徴は, モデル行動の把握や, 医学的に無関係なトークンの90%以上の隠された意味の解明に有効であり, 人間の解釈が可能であることを示す。
辞書の特徴は, モデル行動の把握や, 医学的に無関係なトークンの90%以上の隠された意味の解明に有効であり, 人間の解釈が可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T19:39:40Z) - Weakly-supervised diagnosis identification from Italian discharge letters [0.0]
本報告では, イタリアの退院状から病気を認識するための, 弱教師付きパイプラインを提案する。
私たちのパイプラインは、イタリアのUmbertoモデルの微調整バージョンをベースにしています。
論文 参考訳(メタデータ) (2024-10-19T09:42:20Z) - Vision-language Assisted Attribute Learning [53.60196963381315]
大規模な属性ラベリングは通常不完全で部分的である。
既存の属性学習手法は、欠落したラベルを否定的な扱いをすることが多い。
利用可能な視覚言語知識を活用して、モデル学習の強化に欠落しているラベルを明確に明らかにする。
論文 参考訳(メタデータ) (2023-12-12T06:45:19Z) - Navigating the Grey Area: How Expressions of Uncertainty and
Overconfidence Affect Language Models [74.07684768317705]
LMはプロンプトにおける確実性のマーカーに非常に敏感であり、アクーは80%以上変化している。
その結果,高い確実性の表現は低い表現に比べて精度が低下し,事実動詞が性能を損なうのに対して,明らかな表現はパフォーマンスに寄与することがわかった。
これらの関連性は、LMが真に不確実性を反映するのではなく、観察された言語の使用に基づいていることを示唆している。
論文 参考訳(メタデータ) (2023-02-26T23:46:29Z) - Semantic Coherence Markers for the Early Diagnosis of the Alzheimer
Disease [0.0]
パープレキシティはもともと、与えられた言語モデルがテキストシーケンスを予測するのにどの程度適しているかを評価するための情報理論の尺度として考え出された。
我々は2グラムから5グラムまでのN-gramとトランスフォーマーベース言語モデルであるGPT-2を多種多様な言語モデルに適用した。
ベストパフォーマンスモデルでは、ADクラスと制御対象の両方から対象を分類する際に、完全精度とFスコア(精度/特異度とリコール/感度のそれぞれ1.00)を達成した。
論文 参考訳(メタデータ) (2023-02-02T11:40:16Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Label Cleaning Multiple Instance Learning: Refining Coarse Annotations
on Single Whole-Slide Images [83.7047542725469]
病理検体の全スライディング画像(WSI)における癌領域のアノテーションは、臨床診断、生医学研究、機械学習アルゴリズムの開発において重要な役割を担っている。
本稿では,外部トレーニングデータを必要とせず,単一のWSI上で粗いアノテーションを洗練するためのLC-MIL (Label Cleaning Multiple Instance Learning) を提案する。
乳癌リンパ節転移,肝癌,大腸癌の検体を併用した異種 WSI 実験の結果,LC-MIL は粗いアノテーションを著しく改善し,単一スライドから学習しながらも,最先端の代替品よりも優れていた。
論文 参考訳(メタデータ) (2021-09-22T15:06:06Z) - Detecting of a Patient's Condition From Clinical Narratives Using
Natural Language Representation [0.3149883354098941]
本稿では,臨床自然言語表現学習と教師付き分類フレームワークを提案する。
この新しいフレームワークは、文脈的臨床物語入力から分布構文と潜在意味論(表現学習)を共同で発見する。
提案手法では, 精度, 再現性, 精度をそれぞれ89 %, 88 %, 89 %とした総合分類性能が得られる。
論文 参考訳(メタデータ) (2021-04-08T17:16:04Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Challenges in Automated Debiasing for Toxic Language Detection [81.04406231100323]
バイアスド・アソシエーションは、有害な言語を検出するための分類器の開発において課題となっている。
我々は最近,有害な言語検出に適用されたテキスト分類データセットとモデルに対するデバイアス法について検討した。
我々の焦点は語彙(例えば、誓い言葉、スラー、アイデンティティの言及)と方言マーカー(特にアフリカ系アメリカ人の英語)である。
論文 参考訳(メタデータ) (2021-01-29T22:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。