論文の概要: Multi-Ontology Refined Embeddings (MORE): A Hybrid Multi-Ontology and
Corpus-based Semantic Representation for Biomedical Concepts
- arxiv url: http://arxiv.org/abs/2004.06555v1
- Date: Tue, 14 Apr 2020 14:38:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 09:41:56.202743
- Title: Multi-Ontology Refined Embeddings (MORE): A Hybrid Multi-Ontology and
Corpus-based Semantic Representation for Biomedical Concepts
- Title(参考訳): マルチオントロジー精製埋め込み(MORE) : バイオメディカル概念のためのハイブリッドマルチオントロジーとコーパスベースセマンティック表現
- Authors: Steven Jiang, Weiyi Wu, Naofumi Tomita, Craig Ganoe, Saeed Hassanpour
- Abstract要約: 本稿では,複数のオントロジからのドメイン知識を分散意味モデルに組み込むためのフレームワークであるMOREを紹介する。
我々は、MOREのコーパスベースのコンポーネントとして、RadCoreとMIMIC-IIIのフリーテキストデータセットを使用します。
コーパスベースでは,メディカル・サブジェクト・ヘッダー(MeSH)と3つの最先端の類似度尺度を用いる。
- 参考スコア(独自算出の注目度): 0.5812284760539712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective: Currently, a major limitation for natural language processing
(NLP) analyses in clinical applications is that a concept can be referenced in
various forms across different texts. This paper introduces Multi-Ontology
Refined Embeddings (MORE), a novel hybrid framework for incorporating domain
knowledge from multiple ontologies into a distributional semantic model,
learned from a corpus of clinical text.
Materials and Methods: We use the RadCore and MIMIC-III free-text datasets
for the corpus-based component of MORE. For the ontology-based part, we use the
Medical Subject Headings (MeSH) ontology and three state-of-the-art
ontology-based similarity measures. In our approach, we propose a new learning
objective, modified from the Sigmoid cross-entropy objective function.
Results and Discussion: We evaluate the quality of the generated word
embeddings using two established datasets of semantic similarities among
biomedical concept pairs. On the first dataset with 29 concept pairs, with the
similarity scores established by physicians and medical coders, MORE's
similarity scores have the highest combined correlation (0.633), which is 5.0%
higher than that of the baseline model and 12.4% higher than that of the best
ontology-based similarity measure.On the second dataset with 449 concept pairs,
MORE's similarity scores have a correlation of 0.481, with the average of four
medical residents' similarity ratings, and that outperforms the skip-gram model
by 8.1% and the best ontology measure by 6.9%.
- Abstract(参考訳): 目的: 現在, 臨床応用における自然言語処理 (NLP) 解析の大きな限界は, 概念がさまざまなテキストにまたがって様々な形で参照可能であることである。
本稿では,複数のオントロジーからのドメイン知識を臨床テキストのコーパスから学習した分布的意味モデルに組み込むための新しいハイブリッドフレームワークであるmulti-ontology refined embeddeds (more)を提案する。
材料と方法:MOREのコーパスベースコンポーネントにはRadCoreとMIMIC-IIIのフリーテキストデータセットを使用します。
オントロジーに基づく部分では,医学的対象見出し(MeSH)オントロジーと3つの最先端オントロジーに基づく類似度尺度を用いる。
本研究では,sgmoid cross-entropy objective関数から修正した新しい学習目標を提案する。
結果と考察: バイオメディカル概念ペア間のセマンティックな類似性のデータセットを2つ確立し, 単語埋め込みの品質を評価する。
On the first dataset with 29 concept pairs, with the similarity scores established by physicians and medical coders, MORE's similarity scores have the highest combined correlation (0.633), which is 5.0% higher than that of the baseline model and 12.4% higher than that of the best ontology-based similarity measure.On the second dataset with 449 concept pairs, MORE's similarity scores have a correlation of 0.481, with the average of four medical residents' similarity ratings, and that outperforms the skip-gram model by 8.1% and the best ontology measure by 6.9%.
関連論文リスト
- Unified Representation of Genomic and Biomedical Concepts through Multi-Task, Multi-Source Contrastive Learning [45.6771125432388]
言語モデル(genEREL)を用いたジェノミクス表現について紹介する。
GENERELは遺伝学と生物医学の知識基盤を橋渡しするために設計されたフレームワークである。
本実験は,SNPと臨床概念のニュアンス関係を効果的に把握するgenERELの能力を実証するものである。
論文 参考訳(メタデータ) (2024-10-14T04:19:52Z) - ISPO: An Integrated Ontology of Symptom Phenotypes for Semantic Integration of Traditional Chinese Medical Data [24.36545694430613]
本研究は,中国EMRのデータマイニングとTCM分野における実世界研究を支援するために,ISPOの統合オントロジーを構築することを目的とした。
論文 参考訳(メタデータ) (2024-07-08T15:23:50Z) - RaTEScore: A Metric for Radiology Report Generation [59.37561810438641]
本稿では,Radiological Report (Text) Evaluation (RaTEScore) として,新しい実体認識尺度を提案する。
RaTEScoreは、診断結果や解剖学的詳細などの重要な医療機関を強調し、複雑な医学的同義語に対して堅牢であり、否定表現に敏感である。
我々の評価は、RaTEScoreが既存の指標よりも人間の嗜好とより密接に一致していることを示し、確立された公開ベンチマークと、新たに提案したRaTE-Evalベンチマークの両方で検証した。
論文 参考訳(メタデータ) (2024-06-24T17:49:28Z) - Efficient Biomedical Entity Linking: Clinical Text Standardization with Low-Resource Techniques [0.0]
複数の用語は、臨床エンティティと呼ばれることができる同じコア概念を参照することができる。
UMLS(Unified Medical Language System)のようなオントロジーは、何百万もの臨床エンティティを格納するために開発・維持されている。
そこで本稿では,エンティティの曖昧さを解消するために,コンテキストベースとコンテキストレスの省力化手法を提案する。
論文 参考訳(メタデータ) (2024-05-24T01:14:33Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Exploring the In-context Learning Ability of Large Language Model for
Biomedical Concept Linking [4.8882241537236455]
本研究では,生物医学的概念リンクのための大規模モデルのコンテキスト内学習機能を活用する手法について検討する。
提案手法は2段階のレトリーブ・アンド・ランク・フレームワークを採用する。
BC5CDRの病体正規化では90.%、化学体正規化では94.7%の精度を達成した。
論文 参考訳(メタデータ) (2023-07-03T16:19:50Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - MIMICause : Defining, identifying and predicting types of causal
relationships between biomedical concepts from clinical notes [0.0]
本研究は, ガイドラインの策定, 注釈付きコーパスの開発, 臨床ノートにおけるバイオメディカル概念間の因果関係のタイプと方向を特定するためのベースラインスコアの提供を目的とする。
2018 n2c2共有タスクデータセットからサンプリングされた、合計2714の特定されていないサンプルを注釈付けし、4つの異なる言語モデルベースのアーキテクチャをトレーニングします。
臨床用テキストにおける注釈書間の高い合意は,本ガイドラインの質を示す一方で,提案されたベースラインF1は,臨床用テキストにおける物語の理解に向けた今後の研究の方向性を示す。
論文 参考訳(メタデータ) (2021-10-14T00:15:36Z) - Neural sentence embedding models for semantic similarity estimation in
the biomedical domain [6.325814141416726]
PubMed Open Accessデータセットから170万の記事に対して、さまざまなニューラル埋め込みモデルをトレーニングしました。
人手による注釈付き100の文対を含むバイオメディカル・ベンチマークを用いて評価を行った。
論文 参考訳(メタデータ) (2021-10-01T13:27:44Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。