論文の概要: A multi-perspective combined recall and rank framework for Chinese
procedure terminology normalization
- arxiv url: http://arxiv.org/abs/2101.09101v1
- Date: Fri, 22 Jan 2021 13:37:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 17:30:28.041999
- Title: A multi-perspective combined recall and rank framework for Chinese
procedure terminology normalization
- Title(参考訳): 中国の手続き用語正規化のための多視点的リコールとランクフレームワーク
- Authors: Ming Liang and Kui Xue and Tong Ruan
- Abstract要約: 本論文では、中国語の手続き用語正規化に焦点を当てる。
用語の表現は様々であり、医学的言及は複数の用語に関連付けられることがある。
上記の課題を解決するため、リコールとランクフレームワークを組み合わせた提案を行います。
- 参考スコア(独自算出の注目度): 11.371582109211815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical terminology normalization aims to map the clinical mention to
terminologies come from a knowledge base, which plays an important role in
analyzing Electronic Health Record(EHR) and many downstream tasks. In this
paper, we focus on Chinese procedure terminology normalization. The expression
of terminologies are various and one medical mention may be linked to multiple
terminologies. Previous study explores some methods such as multi-class
classification or learning to rank(LTR) to sort the terminologies by literature
and semantic information. However, these information is inadequate to find the
right terminologies, particularly in multi-implication cases. In this work, we
propose a combined recall and rank framework to solve the above problems. This
framework is composed of a multi-task candidate generator(MTCG), a keywords
attentive ranker(KAR) and a fusion block(FB). MTCG is utilized to predict the
mention implication number and recall candidates with semantic similarity. KAR
is based on Bert with a keywords attentive mechanism which focuses on keywords
such as procedure sites and procedure types. FB merges the similarity come from
MTCG and KAR to sort the terminologies from different perspectives. Detailed
experimental analysis shows our proposed framework has a remarkable improvement
on both performance and efficiency.
- Abstract(参考訳): 医学用語の正規化は、電子健康記録(EHR)と多くの下流タスクの分析において重要な役割を果たす知識ベースから得られた用語の臨床的言及をマッピングすることを目的としている。
本稿では,中国の手続き用語の正規化に焦点をあてる。
用語の表現は様々であり、医学的言及は複数の用語に関連付けられることがある。
文献や意味情報から用語を分類する手法として,複数クラス分類やランク付け学習(LTR)について検討した。
しかし、これらの情報は、特にマルチインプリケーションの場合、適切な用語を見つけるには不十分である。
そこで本研究では,上記の問題を解決するためのリコールとランクの組み合わせフレームワークを提案する。
このフレームワークは、マルチタスク候補生成器(mtcg)、キーワードの注意ランク付け器(kar)、および融合ブロック(fb)で構成されている。
MTCGは、参照含意数を予測し、セマンティックな類似性を持つ候補をリコールするために使用される。
KARはBertをベースにしており、プロシージャサイトやプロシージャタイプなどのキーワードに焦点を当てたキーワード注意機構を備えている。
FB は MTCG と KAR の類似性を融合させ、異なる視点から用語を分類する。
詳細な実験分析の結果,提案するフレームワークは性能と効率の両方において顕著に改善されている。
関連論文リスト
- Automatic Biomedical Term Clustering by Learning Fine-grained Term
Representations [0.8154691566915505]
最先端の用語埋め込みは、事前訓練された言語モデルを利用して用語をエンコードし、知識グラフからの同義語と関係知識を使用して、対照的な学習を導く。
これらの埋め込みは、バイオメディカルな用語クラスタリングの失敗につながる小さなテキストの違いに敏感ではない。
この問題を軽減するため,動的ハード・ポジティと負のサンプルを提供することにより,プレトレーニング項埋め込みにおけるサンプリング戦略を調整した。
我々は提案手法をCODER++と命名し,新たにリリースされたBIOSというバイオメディカル知識グラフのバイオメディカル概念のクラスタリングに適用した。
論文 参考訳(メタデータ) (2022-04-01T12:30:58Z) - Integrating Language Guidance into Vision-based Deep Metric Learning [78.18860829585182]
埋め込み空間として意味的類似性を符号化した距離空間を学習することを提案する。
これらの空間は、トレーニング中に見られるもの以外のクラスに転送可能であるべきである。
これにより、学習された埋め込み空間は不完全な意味的コンテキストを符号化し、クラス間の意味的関係を誤って表現する。
論文 参考訳(メタデータ) (2022-03-16T11:06:50Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - More Than Words: Collocation Tokenization for Latent Dirichlet
Allocation Models [71.42030830910227]
モデルが異なる環境でクラスタリングの品質を測定するための新しい指標を提案する。
マージトークンでトレーニングされたトピックは、マージされていないモデルよりも、より明確で、一貫性があり、トピックを区別する効果が高いトピックキーをもたらすことを示す。
論文 参考訳(メタデータ) (2021-08-24T14:08:19Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - Does the Magic of BERT Apply to Medical Code Assignment? A Quantitative
Study [2.871614744079523]
事前訓練されたモデルが、さらなるアーキテクチャエンジニアリングなしで医療コード予測に有用かどうかは明らかではない。
本稿では,単語間のインタラクションをキャプチャし,ラベル情報を活用する階層的な微調整アーキテクチャを提案する。
現在の傾向とは対照的に、我々は慎重に訓練された古典的なCNNは、頻繁なコードでMIMIC-IIIサブセット上の注意ベースのモデルを上回ることを実証します。
論文 参考訳(メタデータ) (2021-03-11T07:23:45Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Unsupervised Key-phrase Extraction and Clustering for Classification
Scheme in Scientific Publications [0.0]
本稿では,システムマッピング (SM) とシステムレビュー (SR) プロセスの自動化の可能性について検討する。
キーフレーズは教師なしの方法で科学文書から抽出され、対応する分類体系を構築するために使用される。
また、クラスタリングを使って関連するキーフレーズをグループ化する方法についても検討する。
論文 参考訳(メタデータ) (2021-01-25T10:17:33Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - Multidimensional scaling and linguistic theory [0.10152838128195464]
本稿では,多次元スケーリング(MDS)技術の言語研究における意味地図作成への応用について述べる。
MDSは、オブジェクトを空間内の点として表現する統計的手法であり、オブジェクト間の近接類似性は、表現内の対応するポイント間の近接距離に対応する。
論文 参考訳(メタデータ) (2020-12-09T10:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。