Fugu-MT 論文翻訳(概要): Enriching Consumer Health Vocabulary Using Enhanced GloVe Word Embedding

論文の概要: Enriching Consumer Health Vocabulary Using Enhanced GloVe Word Embedding

arxiv url: http://arxiv.org/abs/2004.00150v2
Date: Mon, 13 Apr 2020 18:02:10 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-17 23:54:13.384143
Title: Enriching Consumer Health Vocabulary Using Enhanced GloVe Word Embedding
Title（参考訳）: 強化GloVeワード埋め込みによる消費者健康語彙の充実
Authors: Mohammed Ibrahim, Susan Gauch, Omar Salman, Mohammed Alqahatani
Abstract要約: Open-Access and Collaborative Consumer Health Vocabulary (OAC CHV)は、英語で書かれた医学用語の集合体である。国立医学図書館は、CHV用語をUMLS(Unified Medical Language System)に統合し、マッピングした。本稿では,消費者生成テキストから新たなCHV語を生成する拡張単語埋め込み手法を提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Open-Access and Collaborative Consumer Health Vocabulary (OAC CHV, or CHV for short), is a collection of medical terms written in plain English. It provides a list of simple, easy, and clear terms that laymen prefer to use rather than an equivalent professional medical term. The National Library of Medicine (NLM) has integrated and mapped the CHV terms to their Unified Medical Language System (UMLS). These CHV terms mapped to 56000 professional concepts on the UMLS. We found that about 48% of these laymen's terms are still jargon and matched with the professional terms on the UMLS. In this paper, we present an enhanced word embedding technique that generates new CHV terms from a consumer-generated text. We downloaded our corpus from a healthcare social media and evaluated our new method based on iterative feedback to word embedding using ground truth built from the existing CHV terms. Our feedback algorithm outperformed unmodified GLoVe and new CHV terms have been detected.
Abstract（参考訳）: Open-Access and Collaborative Consumer Health Vocabulary (OAC CHV、略してCHV)は、平易な英語で書かれた医学用語の集合体である。これは、平民が同等の専門的な医療用語よりもむしろ好む単純で簡単で明確な用語のリストを提供する。国立医学図書館(NLM)は、CHV用語をUMLS(Unified Medical Language System)に統合し、マッピングしている。これらのCHV用語はUMLS上の56000のプロフェッショナルな概念にマッピングされた。これらのレイメンの用語の約48%は、まだジャーゴンであり、UMLSの専門用語と一致していることがわかった。本稿では,消費者生成テキストから新たなCHV語を生成する拡張単語埋め込み手法を提案する。我々は,医療ソーシャルメディアからコーパスをダウンロードし,既存のCHV用語から構築した真理を用いて,反復的なフィードバックから単語埋め込みまでの新しい手法を評価した。フィードバックアルゴリズムは未修正GLoVeよりも優れており,新しいCHV項が検出されている。

関連論文リスト

QwenCLIP: Boosting Medical Vision-Language Pretraining via LLM Embeddings and Prompt tuning [1.8957478338649112]
対照的な言語画像訓練(CLIP)は、医療領域における視覚言語タスクの強力な一般化を実証している。 CLIPのテキストエンコーダは77個のトークンしか受け入れないため、長く情報に富んだ放射線学レポートを表現できない。 QwenCLIPはCLIPのテキストエンコーダを大きな言語モデル(LLM)ベースの埋め込みモジュールに置き換える視覚言語フレームワークである。
論文参考訳（メタデータ） (2025-11-17T19:51:59Z)
Evaluation of LLMs in Medical Text Summarization: The Role of Vocabulary Adaptation in High OOV Settings [26.442558912559658]
近年,Large Language Models (LLMs) は,テキスト内学習を単純に利用することで,医学的テキスト要約において大きな成功を収めている。その結果,LLMは語彙外単語の濃度が高い点や,新規性が高い点では顕著な性能低下を示した。語彙適応は、この語彙ミスマッチ問題に対する直感的な解決法である。
論文参考訳（メタデータ） (2025-05-27T14:23:03Z)
Extracting domain-specific terms using contextual word embeddings [2.7941582470640784]
本稿では,用語抽出のための新しい機械学習手法を提案する。従来の用語抽出システムの特徴と、文脈単語の埋め込みから派生した新しい文脈特徴を組み合わせる。われわれのアプローチは、これまでの最先端よりもF1スコアの点で大幅に改善されている。
論文参考訳（メタデータ） (2025-02-24T16:06:35Z)
Biomedical Named Entity Recognition via Dictionary-based Synonym Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文参考訳（メタデータ） (2023-05-22T14:36:32Z)
MedJEx: A Medical Jargon Extraction Model with Wiki's Hyperlink Span and Contextualized Masked Language Model Score [6.208127495081593]
我々は18K+EHR注記文から専門家が注釈付けした医療用語を用いた,新規かつ公開なデータセットを提示する。次に,既存のNLPモデルよりも優れた医療ジャーゴン抽出(MedJEx$)モデルを提案する。
論文参考訳（メタデータ） (2022-10-12T02:27:32Z)
Constructing Cross-lingual Consumer Health Vocabulary with Word-Embedding from Comparable User Generated Content [2.4316589174722485]
オープンアクセスで協調的な消費者健康語彙(OAC CHV)は、このような課題に対処するための制御された語彙である。本研究は、英語のCHVを言語横断言語に拡張するための言語間自動用語認識フレームワークを提案する。
論文参考訳（メタデータ） (2022-06-23T10:46:39Z)
Always Keep your Target in Mind: Studying Semantics and Improving Performance of Neural Lexical Substitution [124.99894592871385]
本稿では,従来の言語モデルと最近の言語モデルの両方を用いた語彙置換手法の大規模比較研究を行う。目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによるすでに競合する結果がさらに大幅に改善できることを示す。
論文参考訳（メタデータ） (2022-06-07T16:16:19Z)
Towards more patient friendly clinical notes through language models and ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文参考訳（メタデータ） (2021-12-23T16:11:19Z)
Clinical Named Entity Recognition using Contextualized Token Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文参考訳（メタデータ） (2021-06-23T18:12:58Z)
An Automated Method to Enrich Consumer Health Vocabularies Using GloVe Word Embeddings and An Auxiliary Lexical Resource [0.0]
平民は、ドメインに共通する専門用語を理解できないため、専門家とのコミュニケーションが困難になる可能性がある。いくつかの専門用語は、平凡な医学用語を専門的な医学用語にマッピングするために作られており、その逆も同様である。本稿では,どのドメインの語彙にも適用可能な,平民の語彙を豊かにするための自動手法を提案する。
論文参考訳（メタデータ） (2021-05-18T20:16:45Z)
UmlsBERT: Clinical Domain Knowledge Augmentation of Contextual Embeddings Using the Unified Medical Language System Metathesaurus [73.86656026386038]
事前学習プロセス中にドメイン知識を統合するコンテキスト埋め込みモデルであるUmlsBERTを紹介する。これらの2つの戦略を適用することで、UmlsBERTは、臨床領域の知識を単語埋め込みにエンコードし、既存のドメイン固有モデルより優れている。
論文参考訳（メタデータ） (2020-10-20T15:56:31Z)
Can Embeddings Adequately Represent Medical Terminology? New Large-Scale Medical Term Similarity Datasets Have the Answer! [13.885093944392464]
医療データに基づいて訓練された埋め込みが多数出現しているが、医療用語がどの程度うまく表現されているかは定かではない。大規模医療用語類似度データセットを複数作成する。我々は,複数のベクトル類似度指標と単語ベクトル集約技術を比較し,新しいデータセット上での最先端の単語と文脈の埋め込みを評価した。
論文参考訳（メタデータ） (2020-03-24T19:18:34Z)
Learning Contextualized Document Representations for Healthcare Answer Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文参考訳（メタデータ） (2020-02-03T15:47:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。