論文の概要: CODER: Knowledge infused cross-lingual medical term embedding for term
normalization
- arxiv url: http://arxiv.org/abs/2011.02947v3
- Date: Tue, 18 May 2021 00:46:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 11:57:13.199416
- Title: CODER: Knowledge infused cross-lingual medical term embedding for term
normalization
- Title(参考訳): CODER:用語正規化のための言語間医療用語埋め込みの知識注入
- Authors: Zheng Yuan and Zhengyun Zhao and Haixia Sun and Jiao Li and Fei Wang
and Sheng Yu
- Abstract要約: CODERは、異なる用語に対する近接ベクトル表現を提供することにより、医療用語の正規化のために設計されている。
我々は、医用知識グラフ(KG)で対照的な学習を通じて、統一医療言語システム(Unified Medical Language System)を訓練する。
我々はCODERをゼロショット項正規化、意味的類似性、関係分類ベンチマークで評価する。
- 参考スコア(独自算出の注目度): 7.516391006265378
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes CODER: contrastive learning on knowledge graphs for
cross-lingual medical term representation. CODER is designed for medical term
normalization by providing close vector representations for different terms
that represent the same or similar medical concepts with cross-lingual support.
We train CODER via contrastive learning on a medical knowledge graph (KG) named
the Unified Medical Language System, where similarities are calculated
utilizing both terms and relation triplets from KG. Training with relations
injects medical knowledge into embeddings and aims to provide potentially
better machine learning features. We evaluate CODER in zero-shot term
normalization, semantic similarity, and relation classification benchmarks,
which show that CODERoutperforms various state-of-the-art biomedical word
embedding, concept embeddings, and contextual embeddings. Our codes and models
are available at https://github.com/GanjinZero/CODER.
- Abstract(参考訳): 本稿では, 言語間医療用語表現のための知識グラフを用いた比較学習コーダを提案する。
CODERは医療用語の正規化のために設計されており、同じまたは類似の医療概念を言語間サポートで表す異なる用語のクローズドベクター表現を提供する。
統合医療言語システム (unified medical language system) と呼ばれる医学知識グラフ (kg) 上の対比学習を通じてコーダを訓練し, kg から用語と関係の3重項を用いて類似度を計算する。
関係性のあるトレーニングは、医療知識を埋め込みに注入し、より優れた機械学習機能を提供することを目指している。
我々は,ゼロショット項正規化,意味的類似性,関係分類ベンチマークにおけるコーダの評価を行い,コーダアウトが様々な最先端の生物医学用語埋め込み,概念埋め込み,文脈埋め込みを行うことを示した。
私たちのコードとモデルはhttps://github.com/ganjinzero/coderで利用可能です。
関連論文リスト
- Contrastive Learning with Counterfactual Explanations for Radiology Report Generation [83.30609465252441]
放射線学レポート生成のためのtextbfCountertextbfFactual textbfExplanations-based framework (CoFE) を提案する。
反現実的な説明は、アルゴリズムによってなされた決定をどのように変えられるかを理解するための強力なツールとして、シナリオが何であるかを問うことによって役立ちます。
2つのベンチマークの実験では、反ファクト的な説明を活用することで、CoFEは意味的に一貫性があり、事実的に完全なレポートを生成することができる。
論文 参考訳(メタデータ) (2024-07-19T17:24:25Z) - Robust and Interpretable Medical Image Classifiers via Concept
Bottleneck Models [49.95603725998561]
本稿では,自然言語の概念を用いた堅牢で解釈可能な医用画像分類器を構築するための新しいパラダイムを提案する。
具体的には、まず臨床概念をGPT-4から検索し、次に視覚言語モデルを用いて潜在画像の特徴を明示的な概念に変換する。
論文 参考訳(メタデータ) (2023-10-04T21:57:09Z) - Knowledge Graph Embeddings for Multi-Lingual Structured Representations
of Radiology Reports [40.606143019674654]
本稿では,新しい軽量グラフベースの埋め込み手法,特に放射線学レポートのキャタリングについて紹介する。
報告書の構造と構成を考慮し、報告書の医療用語を接続する。
本稿では,X線レポートの疾患分類と画像分類という2つのタスクにこの埋め込みを組み込むことについて述べる。
論文 参考訳(メタデータ) (2023-09-02T11:46:41Z) - KnowAugNet: Multi-Source Medical Knowledge Augmented Medication
Prediction Network with Multi-Level Graph Contrastive Learning [8.71936906687061]
本稿では,マルチソース医療知識統合医薬品予測ネットワークである textbfKnowAugNet を提案する。
マルチレベルグラフコントラスト学習フレームワークを通じて、医療コード間の多様な関係をキャプチャする。
電子カルテに従って、医師が患者に通知された薬の判断を下すのを助けることができる。
論文 参考訳(メタデータ) (2022-04-25T15:47:41Z) - Automatic Biomedical Term Clustering by Learning Fine-grained Term
Representations [0.8154691566915505]
最先端の用語埋め込みは、事前訓練された言語モデルを利用して用語をエンコードし、知識グラフからの同義語と関係知識を使用して、対照的な学習を導く。
これらの埋め込みは、バイオメディカルな用語クラスタリングの失敗につながる小さなテキストの違いに敏感ではない。
この問題を軽減するため,動的ハード・ポジティと負のサンプルを提供することにより,プレトレーニング項埋め込みにおけるサンプリング戦略を調整した。
我々は提案手法をCODER++と命名し,新たにリリースされたBIOSというバイオメディカル知識グラフのバイオメディカル概念のクラスタリングに適用した。
論文 参考訳(メタデータ) (2022-04-01T12:30:58Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - Zero-shot Medical Entity Retrieval without Annotation: Learning From
Rich Knowledge Graph Semantics [5.2710726359379265]
現在のアプローチは特定の医療領域でうまく機能する傾向にあるが、目に見えないサブ分野にはあまり一般化しない。
これは、新しい医療状況や薬物治療が頻発するにつれて、公衆衛生の危機下で懸念が高まります。
医療知識グラフ(KG)は、多数の同義語を含む豊富な意味論と、そのキュレートされたグラフィカル構造を含んでいる。
論文 参考訳(メタデータ) (2021-05-26T16:53:48Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Unifying Relational Sentence Generation and Retrieval for Medical Image
Report Composition [142.42920413017163]
現在の手法は、個々のケースのデータセットバイアスにより、しばしば最も一般的な文を生成する。
テンプレート検索と文生成を一体化し、共通およびまれな異常に対処する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-09T04:33:27Z) - Auxiliary Signal-Guided Knowledge Encoder-Decoder for Medical Report
Generation [107.3538598876467]
放射線技師の動作パターンを模倣する補助信号誘導知識デコーダ(ASGK)を提案する。
ASGKは、内的特徴融合と外部医療言語情報を統合して、医療知識の伝達と学習をガイドする。
論文 参考訳(メタデータ) (2020-06-06T01:00:15Z) - Can Embeddings Adequately Represent Medical Terminology? New Large-Scale
Medical Term Similarity Datasets Have the Answer! [13.885093944392464]
医療データに基づいて訓練された埋め込みが多数出現しているが、医療用語がどの程度うまく表現されているかは定かではない。
大規模医療用語類似度データセットを複数作成する。
我々は,複数のベクトル類似度指標と単語ベクトル集約技術を比較し,新しいデータセット上での最先端の単語と文脈の埋め込みを評価した。
論文 参考訳(メタデータ) (2020-03-24T19:18:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。