論文の概要: A multi-perspective combined recall and rank framework for Chinese
procedure terminology normalization
- arxiv url: http://arxiv.org/abs/2101.09101v1
- Date: Fri, 22 Jan 2021 13:37:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 17:30:28.041999
- Title: A multi-perspective combined recall and rank framework for Chinese
procedure terminology normalization
- Title(参考訳): 中国の手続き用語正規化のための多視点的リコールとランクフレームワーク
- Authors: Ming Liang and Kui Xue and Tong Ruan
- Abstract要約: 本論文では、中国語の手続き用語正規化に焦点を当てる。
用語の表現は様々であり、医学的言及は複数の用語に関連付けられることがある。
上記の課題を解決するため、リコールとランクフレームワークを組み合わせた提案を行います。
- 参考スコア(独自算出の注目度): 11.371582109211815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical terminology normalization aims to map the clinical mention to
terminologies come from a knowledge base, which plays an important role in
analyzing Electronic Health Record(EHR) and many downstream tasks. In this
paper, we focus on Chinese procedure terminology normalization. The expression
of terminologies are various and one medical mention may be linked to multiple
terminologies. Previous study explores some methods such as multi-class
classification or learning to rank(LTR) to sort the terminologies by literature
and semantic information. However, these information is inadequate to find the
right terminologies, particularly in multi-implication cases. In this work, we
propose a combined recall and rank framework to solve the above problems. This
framework is composed of a multi-task candidate generator(MTCG), a keywords
attentive ranker(KAR) and a fusion block(FB). MTCG is utilized to predict the
mention implication number and recall candidates with semantic similarity. KAR
is based on Bert with a keywords attentive mechanism which focuses on keywords
such as procedure sites and procedure types. FB merges the similarity come from
MTCG and KAR to sort the terminologies from different perspectives. Detailed
experimental analysis shows our proposed framework has a remarkable improvement
on both performance and efficiency.
- Abstract(参考訳): 医学用語の正規化は、電子健康記録(EHR)と多くの下流タスクの分析において重要な役割を果たす知識ベースから得られた用語の臨床的言及をマッピングすることを目的としている。
本稿では,中国の手続き用語の正規化に焦点をあてる。
用語の表現は様々であり、医学的言及は複数の用語に関連付けられることがある。
文献や意味情報から用語を分類する手法として,複数クラス分類やランク付け学習(LTR)について検討した。
しかし、これらの情報は、特にマルチインプリケーションの場合、適切な用語を見つけるには不十分である。
そこで本研究では,上記の問題を解決するためのリコールとランクの組み合わせフレームワークを提案する。
このフレームワークは、マルチタスク候補生成器(mtcg)、キーワードの注意ランク付け器(kar)、および融合ブロック(fb)で構成されている。
MTCGは、参照含意数を予測し、セマンティックな類似性を持つ候補をリコールするために使用される。
KARはBertをベースにしており、プロシージャサイトやプロシージャタイプなどのキーワードに焦点を当てたキーワード注意機構を備えている。
FB は MTCG と KAR の類似性を融合させ、異なる視点から用語を分類する。
詳細な実験分析の結果,提案するフレームワークは性能と効率の両方において顕著に改善されている。
関連論文リスト
- A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.51839859852572]
我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。
英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文 参考訳(メタデータ) (2024-03-05T13:55:16Z) - MapperGPT: Large Language Models for Linking and Mapping Entities [1.5340902251924438]
MapperGPTは、大規模言語モデルを用いて、マッピングを後処理のステップとしてレビューし、洗練するアプローチである。
ハイリコール法と組み合わせることで,MapperGPTは精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2023-10-05T16:43:04Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - Token Classification for Disambiguating Medical Abbreviations [0.0]
省略は避けられないが、医療テキストの重要な部分である。
標準化されたマッピングシステムの欠如は、曖昧な省略を困難かつ時間を要するタスクにする。
論文 参考訳(メタデータ) (2022-10-05T18:06:49Z) - Automatic Biomedical Term Clustering by Learning Fine-grained Term
Representations [0.8154691566915505]
最先端の用語埋め込みは、事前訓練された言語モデルを利用して用語をエンコードし、知識グラフからの同義語と関係知識を使用して、対照的な学習を導く。
これらの埋め込みは、バイオメディカルな用語クラスタリングの失敗につながる小さなテキストの違いに敏感ではない。
この問題を軽減するため,動的ハード・ポジティと負のサンプルを提供することにより,プレトレーニング項埋め込みにおけるサンプリング戦略を調整した。
我々は提案手法をCODER++と命名し,新たにリリースされたBIOSというバイオメディカル知識グラフのバイオメディカル概念のクラスタリングに適用した。
論文 参考訳(メタデータ) (2022-04-01T12:30:58Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - Does the Magic of BERT Apply to Medical Code Assignment? A Quantitative
Study [2.871614744079523]
事前訓練されたモデルが、さらなるアーキテクチャエンジニアリングなしで医療コード予測に有用かどうかは明らかではない。
本稿では,単語間のインタラクションをキャプチャし,ラベル情報を活用する階層的な微調整アーキテクチャを提案する。
現在の傾向とは対照的に、我々は慎重に訓練された古典的なCNNは、頻繁なコードでMIMIC-IIIサブセット上の注意ベースのモデルを上回ることを実証します。
論文 参考訳(メタデータ) (2021-03-11T07:23:45Z) - UmlsBERT: Clinical Domain Knowledge Augmentation of Contextual
Embeddings Using the Unified Medical Language System Metathesaurus [73.86656026386038]
事前学習プロセス中にドメイン知識を統合するコンテキスト埋め込みモデルであるUmlsBERTを紹介する。
これらの2つの戦略を適用することで、UmlsBERTは、臨床領域の知識を単語埋め込みにエンコードし、既存のドメイン固有モデルより優れている。
論文 参考訳(メタデータ) (2020-10-20T15:56:31Z) - IMRAM: Iterative Matching with Recurrent Attention Memory for
Cross-Modal Image-Text Retrieval [105.77562776008459]
既存の手法は、注意機構を利用して、そのような対応をきめ細かな方法で探索する。
既存の手法でこのような高度な対応を最適に捉えるのは難しいかもしれない。
本稿では,複数段階のアライメントで対応を捉えるIMRAM法を提案する。
論文 参考訳(メタデータ) (2020-03-08T12:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。