論文の概要: Weakly Supervised Medical Entity Extraction and Linking for Chief Complaints
- arxiv url: http://arxiv.org/abs/2509.01899v1
- Date: Tue, 02 Sep 2025 02:39:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.887306
- Title: Weakly Supervised Medical Entity Extraction and Linking for Chief Complaints
- Title(参考訳): 主訴に対する医療用エンティティ抽出・リンクの監督について
- Authors: Zhimeng Luo, Zhendong Wang, Rui Meng, Diyang Xue, Adam Frisch, Daqing He,
- Abstract要約: 主訴 (CC) は, 患者自身の言葉で述べた医療訪問の理由である。
主要な苦情記録は、様々な入力方法をとることが多く、医学的な表記法が多様である。
そこで本研究では,ヒトのアノテーションがない場合に,主訴のエンティティを自動的に抽出し,リンクする手法を提案する。
- 参考スコア(独自算出の注目度): 27.85394557636773
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A Chief complaint (CC) is the reason for the medical visit as stated in the patient's own words. It helps medical professionals to quickly understand a patient's situation, and also serves as a short summary for medical text mining. However, chief complaint records often take a variety of entering methods, resulting in a wide variation of medical notations, which makes it difficult to standardize across different medical institutions for record keeping or text mining. In this study, we propose a weakly supervised method to automatically extract and link entities in chief complaints in the absence of human annotation. We first adopt a split-and-match algorithm to produce weak annotations, including entity mention spans and class labels, on 1.2 million real-world de-identified and IRB approved chief complaint records. Then we train a BERT-based model with generated weak labels to locate entity mentions in chief complaint text and link them to a pre-defined ontology. We conducted extensive experiments, and the results showed that our Weakly Supervised Entity Extraction and Linking (\ours) method produced superior performance over previous methods without any human annotation.
- Abstract(参考訳): 主訴は、患者自身の言葉で述べられているように、医療訪問の理由である。
医療専門家が患者の状況を素早く理解するのに役立つだけでなく、医療用テキストマイニングの略としても役立つ。
しかし、主要な苦情記録は様々な入力方法をとることが多く、医学的な表記法が多岐にわたるため、記録保管やテキストマイニングのために異なる医療機関間で標準化が困難になる。
本研究では,ヒトのアノテーションがない場合に,主訴のエンティティを自動的に抽出・リンクする弱教師付き手法を提案する。
我々はまず、120万の現実世界の非識別とIRBが主訴記録を承認した上で、エンティティ参照スパンやクラスラベルを含む弱いアノテーションを生成するために、スプリット・アンド・マッチアルゴリズムを採用した。
次に、生成した弱いラベルを持つBERTベースのモデルをトレーニングし、主訴文中のエンティティの言及を識別し、事前に定義されたオントロジーにリンクする。
Weakly Supervised Entity extract and Linking (\ours) 法は,人間のアノテーションを使わずに従来の手法よりも優れた性能を示した。
関連論文リスト
- MedHal: An Evaluation Dataset for Medical Hallucination Detection [2.5782420501870296]
MedHalは、医療用テキストの幻覚をモデルが検出できるかどうかを評価するために設計された、新しい大規模データセットである。
MedHalは,(1)多様な医学的テキストソースとタスクを取り入れ,(2)医学的幻覚検出モデルの訓練に適した注釈付きサンプルを大量に提供し,(3)モデル学習を導くための事実的不整合の説明を含むギャップに対処する。
論文 参考訳(メタデータ) (2025-04-11T14:55:15Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - "Nothing Abnormal": Disambiguating Medical Reports via Contrastive
Knowledge Infusion [6.9551174393701345]
コントラスト型事前学習と摂動型書き換えに基づく書き換えアルゴリズムを提案する。
胸部報告に基づくOpenI-Annotatedと、一般的な医療報告に基づくVA-Annotatedの2つのデータセットを作成しました。
提案アルゴリズムは,高内容忠実度で少ないあいまいな方法で文を効果的に書き換える。
論文 参考訳(メタデータ) (2023-05-15T02:01:20Z) - An Entity-based Claim Extraction Pipeline for Real-world Biomedical
Fact-checking [10.536415845097661]
本稿では,名前付きエンティティ認識と,エンティティリンクによる用語正規化を組み込んだ医療ツイートのクレーム抽出パイプラインを提案する。
自動NERは金のアノテーションに比べて性能が低下するが, 事実チェック性能は変化しないツイートの入力よりも改善されている。
論文 参考訳(メタデータ) (2023-04-11T15:07:24Z) - A Marker-based Neural Network System for Extracting Social Determinants
of Health [12.6970199179668]
健康の社会的決定因子(SDoH)は、患者の医療の質と格差を左右する。
多くのSDoHアイテムは、電子健康記録の構造化形式でコード化されていない。
我々は,臨床ノートから自動的にSDoH情報を抽出する,名前付きエンティティ認識(NER),関係分類(RC),テキスト分類手法を含む多段階パイプラインを探索する。
論文 参考訳(メタデータ) (2022-12-24T18:40:23Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Unifying Relational Sentence Generation and Retrieval for Medical Image
Report Composition [142.42920413017163]
現在の手法は、個々のケースのデータセットバイアスにより、しばしば最も一般的な文を生成する。
テンプレート検索と文生成を一体化し、共通およびまれな異常に対処する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-09T04:33:27Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Collaborative Unsupervised Domain Adaptation for Medical Image Diagnosis [102.40869566439514]
我々は、Unsupervised Domain Adaptation (UDA)を通じて、対象タスクにおける学習を支援するために、関連ドメインからの豊富なラベル付きデータを活用しようとしている。
クリーンなラベル付きデータやサンプルを仮定するほとんどのUDAメソッドが等しく転送可能であるのとは異なり、協調的教師なしドメイン適応アルゴリズムを革新的に提案する。
提案手法の一般化性能を理論的に解析し,医用画像と一般画像の両方で実験的に評価する。
論文 参考訳(メタデータ) (2020-07-05T11:49:17Z) - Understanding patient complaint characteristics using contextual
clinical BERT embeddings [1.9060575156739825]
臨床会話の応用では、抽出された実体は患者の苦情の主訴をとらえる傾向にある。
本稿では,一般利用者が提示する症状などの特徴を2段階に分けて検出する手法を提案する。
臨床テキストのエンコードにはWord2VecとBERTを用いる。
処理された符号化とLDA(Linear Discriminant Analysis)アルゴリズムを組み合わせて、主エンティティの特性を分類する。
論文 参考訳(メタデータ) (2020-02-14T07:45:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。