論文の概要: An Automated Method to Enrich Consumer Health Vocabularies Using GloVe
Word Embeddings and An Auxiliary Lexical Resource
- arxiv url: http://arxiv.org/abs/2105.08812v1
- Date: Tue, 18 May 2021 20:16:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-20 23:55:12.625323
- Title: An Automated Method to Enrich Consumer Health Vocabularies Using GloVe
Word Embeddings and An Auxiliary Lexical Resource
- Title(参考訳): GloVe ワード埋め込みと補助語彙資源を用いた消費者健康語彙の充実のための自動化手法
- Authors: Mohammed Ibrahim, Susan Gauch, Omar Salman, Mohammed Alqahatani
- Abstract要約: 平民は、ドメインに共通する専門用語を理解できないため、専門家とのコミュニケーションが困難になる可能性がある。
いくつかの専門用語は、平凡な医学用語を専門的な医学用語にマッピングするために作られており、その逆も同様である。
本稿では,どのドメインの語彙にも適用可能な,平民の語彙を豊かにするための自動手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: Clear language makes communication easier between any two
parties. A layman may have difficulty communicating with a professional due to
not understanding the specialized terms common to the domain. In healthcare, it
is rare to find a layman knowledgeable in medical terminology which can lead to
poor understanding of their condition and/or treatment. To bridge this gap,
several professional vocabularies and ontologies have been created to map
laymen medical terms to professional medical terms and vice versa.
Objective: Many of the presented vocabularies are built manually or
semi-automatically requiring large investments of time and human effort and
consequently the slow growth of these vocabularies. In this paper, we present
an automatic method to enrich laymen's vocabularies that has the benefit of
being able to be applied to vocabularies in any domain.
Methods: Our entirely automatic approach uses machine learning, specifically
Global Vectors for Word Embeddings (GloVe), on a corpus collected from a social
media healthcare platform to extend and enhance consumer health vocabularies
(CHV). Our approach further improves the CHV by incorporating synonyms and
hyponyms from the WordNet ontology. The basic GloVe and our novel algorithms
incorporating WordNet were evaluated using two laymen datasets from the
National Library of Medicine (NLM), Open-Access Consumer Health Vocabulary (OAC
CHV) and MedlinePlus Healthcare Vocabulary.
Results: The results show that GloVe was able to find new laymen terms with
an F-score of 48.44%. Furthermore, our enhanced GloVe approach outperformed
basic GloVe with an average F-score of 61%, a relative improvement of 25%.
Furthermore, the enhanced GloVe showed a statistical significance over the two
ground truth datasets with P<.001.
- Abstract(参考訳): 背景: 明快な言語は、任意の当事者間のコミュニケーションを容易にする。
在職者は、ドメインに共通する専門用語を理解できないため、専門家とのコミュニケーションが困難になる可能性がある。
医療分野では、病状や治療の理解が不十分な、医学用語に精通する素人を見つけることは稀である。
このギャップを埋めるために、いくつかの専門用語とオントロジーが作成され、平凡な医学用語を専門的な医学用語にマッピングする。
目的: 提示された語彙の多くは手動または半自動で構築され、時間と人的労力に大きな投資を必要とし、結果としてこれらの語彙の成長が遅くなる。
本稿では,任意の領域の語彙に適用できるという利点を持つ,在職者の語彙を豊かにするための自動手法を提案する。
方法: 完全に自動化されたアプローチでは、マシンラーニング、特にglove(global vectors for word embeddeds)を使用して、ソーシャルメディアのヘルスケアプラットフォームから収集したコーパスに基づいて、consumer health vocabularies(chv)を拡張し、拡張します。
提案手法は,WordNetのオントロジーから同義語や偽名を取り込むことにより,CHVをさらに改善する。
The basic GloVe and our novel algorithm in Using WordNet using two laymen datasets from the National Library of Medicine (NLM), Open-Access Consumer Health Vocabulary (OAC CHV) and MedlinePlus Healthcare Vocabulary。
結果は、GloVeが48.44%のFスコアで新しいレイメン語を見つけることができたことを示している。
さらに, 強化グローブアプローチは, 平均fスコアが61%, 相対的に25%向上したベーシックグローブよりも優れていた。
さらに、強化されたGloVeはP<.001の2つの基底真理データセットに対して統計的に有意であった。
関連論文リスト
- Refinement of an Epilepsy Dictionary through Human Annotation of Health-related posts on Instagram [5.410785987233275]
私たちは、バイオメディカル用語で作られた辞書を使って、少なくとも一度はてんかん関連薬に言及したユーザーによって、800万件以上のInstagram投稿をタグ付けしました。
1,771のポストと2,947の項一致のランダムなサンプルを、ヒトのアノテーターによって評価し、偽陽性を同定した。
OpenAIのGPTシリーズモデルは人間のアノテーションと比較された。
論文 参考訳(メタデータ) (2024-05-14T17:27:59Z) - Integrating LLM, EEG, and Eye-Tracking Biomarker Analysis for Word-Level
Neural State Classification in Semantic Inference Reading Comprehension [4.390968520425543]
本研究は、意味的関係読解作業中の個人の神経状態に関する洞察を提供することを目的とする。
本研究では,LLM,視線,脳波(EEG)データを共同で分析し,読解中にキーワードに関連性のある単語をどのように処理するかについて検討する。
論文 参考訳(メタデータ) (2023-09-27T15:12:08Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - MedJEx: A Medical Jargon Extraction Model with Wiki's Hyperlink Span and
Contextualized Masked Language Model Score [6.208127495081593]
我々は18K+EHR注記文から専門家が注釈付けした医療用語を用いた,新規かつ公開なデータセットを提示する。
次に,既存のNLPモデルよりも優れた医療ジャーゴン抽出(MedJEx$)モデルを提案する。
論文 参考訳(メタデータ) (2022-10-12T02:27:32Z) - Always Keep your Target in Mind: Studying Semantics and Improving
Performance of Neural Lexical Substitution [124.99894592871385]
本稿では,従来の言語モデルと最近の言語モデルの両方を用いた語彙置換手法の大規模比較研究を行う。
目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによるすでに競合する結果がさらに大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-06-07T16:16:19Z) - Short-Term Word-Learning in a Dynamically Changing Environment [63.025297637716534]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識するためのメカニズムを用いて、エンドツーエンドのASRシステムを補完する方法を示す。
誤報がわずかに増加しただけで, 単語の検出速度が大幅に向上した。
論文 参考訳(メタデータ) (2022-03-29T10:05:39Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Open Vocabulary Electroencephalography-To-Text Decoding and Zero-shot
Sentiment Classification [78.120927891455]
最先端のブレイン・トゥ・テキストシステムは、ニューラルネットワークを使用して脳信号から直接言語を復号することに成功した。
本稿では,自然読解課題における語彙的脳波(EEG)-テキスト列列列復号化とゼロショット文感性分類に問題を拡張する。
脳波-テキストデコーディングで40.1%のBLEU-1スコア、ゼロショット脳波に基づく3次感情分類で55.6%のF1スコアを達成し、教師付きベースラインを著しく上回る結果となった。
論文 参考訳(メタデータ) (2021-12-05T21:57:22Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - Integration of Domain Knowledge using Medical Knowledge Graph Deep
Learning for Cancer Phenotyping [6.077023952306772]
本稿では,医学用語からの外部知識を単語埋め込みによって捉えた文脈に統合する手法を提案する。
提案手法は,Multitask Convolutional Neural Network (MT-CNN) を用いて,900Kの癌病理所見のデータセットから6つのがん特性を抽出する。
論文 参考訳(メタデータ) (2021-01-05T03:59:43Z) - Enriching Consumer Health Vocabulary Using Enhanced GloVe Word Embedding [0.0]
Open-Access and Collaborative Consumer Health Vocabulary (OAC CHV)は、英語で書かれた医学用語の集合体である。
国立医学図書館は、CHV用語をUMLS(Unified Medical Language System)に統合し、マッピングした。
本稿では,消費者生成テキストから新たなCHV語を生成する拡張単語埋め込み手法を提案する。
論文 参考訳(メタデータ) (2020-03-31T22:50:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。