論文の概要: Complementary and Integrative Health Lexicon (CIHLex) and Entity
Recognition in the Literature
- arxiv url: http://arxiv.org/abs/2305.17353v1
- Date: Sat, 27 May 2023 03:21:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 20:03:49.792193
- Title: Complementary and Integrative Health Lexicon (CIHLex) and Entity
Recognition in the Literature
- Title(参考訳): 補完的・統合的健康辞書(CIHLex)と文献におけるエンティティ認識
- Authors: Huixue Zhou, Robin Austin, Sheng-Chieh Lu, Greg Silverman, Yuqi Zhou,
Halil Kilicoglu, Hua Xu, Rui Zhang
- Abstract要約: 完全補完・統合健康(CIH)レキシコン(CIHLex)を構築した。
我々は,CIH のエンティティ認識に Bi Representations from Transformers (BERT) や GPT-3.5 Turbo などの高度な自然言語処理(NLP)モデルを適用した。
BlueBERTのマクロ平均F1スコアは0.90で、他のモデルを上回った。
- 参考スコア(独自算出の注目度): 14.047598195781156
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Objective: Our study aimed to construct an exhaustive Complementary and
Integrative Health (CIH) Lexicon (CIHLex) to better represent the often
underrepresented physical and psychological CIH approaches in standard
terminologies. We also intended to apply advanced Natural Language Processing
(NLP) models such as Bidirectional Encoder Representations from Transformers
(BERT) and GPT-3.5 Turbo for CIH named entity recognition, evaluating their
performance against established models like MetaMap and CLAMP. Materials and
Methods: We constructed the CIHLex by integrating various resources, compiling
and integrating data from biomedical literature and relevant knowledge bases.
The Lexicon encompasses 198 unique concepts with 1090 corresponding unique
terms. We matched these concepts to the Unified Medical Language System (UMLS).
Additionally, we developed and utilized BERT models and compared their
efficiency in CIH named entity recognition to that of other models such as
MetaMap, CLAMP, and GPT3.5-turbo. Results: From the 198 unique concepts in
CIHLex, 62.1% could be matched to at least one term in the UMLS. Moreover,
75.7% of the mapped UMLS Concept Unique Identifiers (CUIs) were categorized as
"Therapeutic or Preventive Procedure." Among the models applied to CIH named
entity recognition, BLUEBERT delivered the highest macro average F1-score of
0.90, surpassing other models. Conclusion: Our CIHLex significantly augments
representation of CIH approaches in biomedical literature. Demonstrating the
utility of advanced NLP models, BERT notably excelled in CIH entity
recognition. These results highlight promising strategies for enhancing
standardization and recognition of CIH terminology in biomedical contexts.
- Abstract(参考訳): 目的:本研究は,標準用語における身体的・心理的なCIHアプローチをより良く表現するために,完全補完・統合健康(CIHLex)レキシコンを構築することを目的とした。
また,トランスフォーマー(BERT)による双方向エンコーダ表現や,エンティティ認識のためのGPT-3.5 Turboといった,高度な自然言語処理(NLP)モデルの適用を意図し,メタマップやCLAMPといった既存のモデルに対して性能評価を行った。
資料と方法: 様々な資源を統合し, バイオメディカル文献や関連知識ベースからのデータをコンパイルし, 統合することでCIHLexを構築した。
Lexiconは198のユニークな概念と1090のユニークな用語を含んでいる。
これらの概念をUMLS(Unified Medical Language System)と比較した。
さらに,BERTモデルを開発し,その効率をMetaMap,CLAMP,GPT3.5-turboといった他のモデルと比較した。
結果: CIHLexの198のユニークな概念から、62.1%はUMLSの少なくとも1つの用語と一致する。
さらに、地図化されたUMLS概念の75.7%が「治療的または予防的手続き」に分類された。
CIHのエンティティ認識に適用されたモデルのうち、BLUEBERTはマクロ平均F1スコアが0.90で、他のモデルを上回った。
結論:CIHLexは生医学文献におけるCIHアプローチの表現を著しく増強する。
BERTは高度なNLPモデルの実用性を実証し、特にCIHエンティティ認識に優れていた。
これらの結果は,生物医学的文脈におけるCIH用語の標準化と認識を促進するための有望な戦略を強調した。
関連論文リスト
- ClinLinker: Medical Entity Linking of Clinical Concept Mentions in Spanish [39.81302995670643]
本研究は、医療エンティティリンクのための2相パイプラインを用いた新しいアプローチであるClinLinkerを提示する。
SapBERTベースのバイエンコーダに基づいており、その後クロスエンコーダで再ランクされ、スペインの医療概念に合わせた対照的な学習戦略に従って訓練されている。
論文 参考訳(メタデータ) (2024-04-09T15:04:27Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - Multi-level biomedical NER through multi-granularity embeddings and
enhanced labeling [3.8599767910528917]
本稿では,複数のモデルの強みを統合するハイブリッドアプローチを提案する。
BERTは、文脈化された単語の埋め込み、文字レベルの情報キャプチャのための事前訓練されたマルチチャネルCNN、およびテキスト内の単語間の依存関係のシーケンスラベリングとモデル化のためのBiLSTM + CRFを提供する。
我々は、ベンチマークi2b2/2010データセットを用いて、F1スコア90.11を達成する。
論文 参考訳(メタデータ) (2023-12-24T21:45:36Z) - Detecting Idiomatic Multiword Expressions in Clinical Terminology using
Definition-Based Representation Learning [12.30055843580139]
バイオメディカルなMWEの慣用性を評価するための有効なツールを開発し,それらのMWEの意味表現とそれらの構成成分の表現の重み付け平均との類似度に基づいて評価する。
以上の結果から,BioLORDモデルは他のモデルでは再現されず,慣用的なMWEを識別する能力が強いことが示唆された。
論文 参考訳(メタデータ) (2023-05-11T13:42:58Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z) - Evaluating Biomedical BERT Models for Vocabulary Alignment at Scale in
the UMLS Metathesaurus [8.961270657070942]
現在のUMLS(Unified Medical Language System)メタテーザウルス構築プロセスは高価でエラーを起こしやすい。
自然言語処理の最近の進歩は、下流タスクにおける最先端(SOTA)のパフォーマンスを達成している。
BERTモデルを用いたアプローチがUMLSメタテーラスの同義語予測において,既存のアプローチよりも優れているかどうかを検証することを目的としている。
論文 参考訳(メタデータ) (2021-09-14T16:52:16Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - A Hybrid Approach to Measure Semantic Relatedness in Biomedical Concepts [0.0]
ELMo, BERT, Sentence BERTモデルを用いて概念優先項を符号化して概念ベクトルを生成した。
SNLIおよびSTSbデータセット上でSiameseネットワークを使用してすべてのBERTモデルをトレーニングし、モデルがセマンティック情報を学ぶことができるようにしました。
概念ベクトルにオントロジー知識を注入すると、その品質がさらに向上し、関連性のスコアが向上する。
論文 参考訳(メタデータ) (2021-01-25T16:01:27Z) - UmlsBERT: Clinical Domain Knowledge Augmentation of Contextual
Embeddings Using the Unified Medical Language System Metathesaurus [73.86656026386038]
事前学習プロセス中にドメイン知識を統合するコンテキスト埋め込みモデルであるUmlsBERTを紹介する。
これらの2つの戦略を適用することで、UmlsBERTは、臨床領域の知識を単語埋め込みにエンコードし、既存のドメイン固有モデルより優れている。
論文 参考訳(メタデータ) (2020-10-20T15:56:31Z) - Performance of Dual-Augmented Lagrangian Method and Common Spatial
Patterns applied in classification of Motor-Imagery BCI [68.8204255655161]
運動画像に基づく脳-コンピュータインタフェース(MI-BCI)は、神経リハビリテーションのための画期的な技術になる可能性がある。
使用する脳波信号のノイズの性質のため、信頼性の高いBCIシステムは特徴の最適化と抽出のために特別な手順を必要とする。
論文 参考訳(メタデータ) (2020-10-13T20:50:13Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。