論文の概要: Knowledge-Base Enriched Word Embeddings for Biomedical Domain
- arxiv url: http://arxiv.org/abs/2103.00479v1
- Date: Sat, 20 Feb 2021 18:18:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 10:15:25.655340
- Title: Knowledge-Base Enriched Word Embeddings for Biomedical Domain
- Title(参考訳): バイオメディカルドメインのための知識ベース強化単語埋め込み
- Authors: Kishlay Jha
- Abstract要約: 利用可能なコーポラとドメイン知識の情報を共同利用したバイオメディカルドメインのための新しい単語埋め込みモデルを提案する。
既存のアプローチとは異なり、提案手法は単純だが、ドメインリソースで利用可能な正確な知識を正しく捉えることに長けている。
- 参考スコア(独自算出の注目度): 5.086571902225929
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Word embeddings have been shown adept at capturing the semantic and syntactic
regularities of the natural language text, as a result of which these
representations have found their utility in a wide variety of downstream
content analysis tasks. Commonly, these word embedding techniques derive the
distributed representation of words based on the local context information.
However, such approaches ignore the rich amount of explicit information present
in knowledge-bases. This is problematic, as it might lead to poor
representation for words with insufficient local context such as domain
specific words. Furthermore, the problem becomes pronounced in domain such as
bio-medicine where the presence of these domain specific words are relatively
high. Towards this end, in this project, we propose a new word embedding based
model for biomedical domain that jointly leverages the information from
available corpora and domain knowledge in order to generate knowledge-base
powered embeddings. Unlike existing approaches, the proposed methodology is
simple but adept at capturing the precise knowledge available in domain
resources in an accurate way. Experimental results on biomedical concept
similarity and relatedness task validates the effectiveness of the proposed
approach.
- Abstract(参考訳): 単語の埋め込みは、自然言語テキストの意味的および構文的規則性を捉えるのに適しており、その結果、これらの表現は様々な下流コンテンツ分析タスクにおいて有用であることがわかった。
一般に、これらの単語埋め込み技術は、局所的な文脈情報に基づく単語の分散表現を導出する。
しかし、そのようなアプローチは知識ベースに存在する大量の明示的な情報を無視している。
これは問題であり、ドメイン特化語のような局所的な文脈が不十分な単語の表現不足につながる可能性がある。
さらに、これらのドメイン固有の単語の存在が比較的高いバイオメディシンのようなドメインでは、この問題が顕著になる。
この目的に向けて,本研究では,利用可能なコーパスとドメイン知識の情報を共同で活用し,知識ベースの組込みを生成するバイオメディカルドメインのための新たな単語組込みモデルを提案する。
既存のアプローチとは異なり、提案手法は単純だが、ドメインリソースで利用可能な正確な知識を正しく捉えることに長けている。
生体医学的概念の類似性と関連性タスクの実験結果は,提案手法の有効性を検証する。
関連論文リスト
- DARE: Towards Robust Text Explanations in Biomedical and Healthcare
Applications [54.93807822347193]
帰属ロバスト性評価手法を与えられたドメインに適応させ、ドメイン固有の妥当性を考慮する方法を示す。
次に,DAREが特徴とする脆さを軽減するために,対人訓練とFAR訓練の2つの方法を提案する。
最後に,確立した3つのバイオメディカル・ベンチマークを用いて実験を行い,本手法を実証的に検証した。
論文 参考訳(メタデータ) (2023-07-05T08:11:40Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - KnowPrompt: Knowledge-aware Prompt-tuning with Synergistic Optimization
for Relation Extraction [111.74812895391672]
シナジスティック最適化(KnowPrompt)を用いた知識認識型Promptチューニング手法を提案する。
関係ラベルに含まれる潜在知識をインジェクトして,学習可能な仮想型語と解答語で構築する。
論文 参考訳(メタデータ) (2021-04-15T17:57:43Z) - Integration of Domain Knowledge using Medical Knowledge Graph Deep
Learning for Cancer Phenotyping [6.077023952306772]
本稿では,医学用語からの外部知識を単語埋め込みによって捉えた文脈に統合する手法を提案する。
提案手法は,Multitask Convolutional Neural Network (MT-CNN) を用いて,900Kの癌病理所見のデータセットから6つのがん特性を抽出する。
論文 参考訳(メタデータ) (2021-01-05T03:59:43Z) - UmlsBERT: Clinical Domain Knowledge Augmentation of Contextual
Embeddings Using the Unified Medical Language System Metathesaurus [73.86656026386038]
事前学習プロセス中にドメイン知識を統合するコンテキスト埋め込みモデルであるUmlsBERTを紹介する。
これらの2つの戦略を適用することで、UmlsBERTは、臨床領域の知識を単語埋め込みにエンコードし、既存のドメイン固有モデルより優れている。
論文 参考訳(メタデータ) (2020-10-20T15:56:31Z) - On the Effects of Knowledge-Augmented Data in Word Embeddings [0.6749750044497732]
単語埋め込み学習のためのデータ拡張による言語知識注入のための新しい手法を提案する。
提案手法は,学習した埋め込みの本質的な特性を向上すると同時に,下流テキスト分類タスクにおける結果の大幅な変更は行わない。
論文 参考訳(メタデータ) (2020-10-05T02:14:13Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - On the Combined Use of Extrinsic Semantic Resources for Medical
Information Search [0.0]
本研究は,頭部医学的概念を冗長な問合せで強調・拡張する枠組みを開発する。
また、意味的に強化された逆インデックス文書も作成する。
提案手法の有効性を実証するため,CLEF 2014データセット上でいくつかの実験を行った。
論文 参考訳(メタデータ) (2020-05-17T14:18:04Z) - Evaluating Sparse Interpretable Word Embeddings for Biomedical Domain [1.3526604206343171]
解釈可能性(英: Interpretability)は、生体医学的応用において不可欠な部分である正当化の鍵となる手段である。
医療領域における単語埋め込みの解釈可能性に関する包括的研究を行い,スパース法の役割に着目した。
実験結果から, 下流タスクにおける元のベクトルの性能を保ちながら, 疎単語ベクトルの方がはるかに解釈可能性が高いことがわかった。
論文 参考訳(メタデータ) (2020-05-11T13:56:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。