論文の概要: Building a Norwegian Lexical Resource for Medical Entity Recognition
- arxiv url: http://arxiv.org/abs/2004.02509v1
- Date: Mon, 6 Apr 2020 09:24:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 06:36:53.934258
- Title: Building a Norwegian Lexical Resource for Medical Entity Recognition
- Title(参考訳): 医用エンティティ認識のためのノルウェーの語彙資源の構築
- Authors: Ildik\'o Pil\'an and P{\aa}l H. Brekke and Lilja {\O}vrelid
- Abstract要約: 我々は、分類された医学用語の大規模なノルウェーの語彙資源を提示する。
このリソースは、巨大な医療データベースからの情報をマージし、ノルウェーの医学辞書から自動的に地図化された用語を含む77,000以上のユニークなエントリを含む。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a large Norwegian lexical resource of categorized medical terms.
The resource merges information from large medical databases, and contains over
77,000 unique entries, including automatically mapped terms from a Norwegian
medical dictionary. We describe the methodology behind this automatic
dictionary entry mapping based on keywords and suffixes and further present the
results of a manual evaluation performed on a subset by a domain expert. The
evaluation indicated that ca. 80% of the mappings were correct.
- Abstract(参考訳): 我々は、分類された医学用語の大規模なノルウェーの語彙資源を提示する。
このリソースは、巨大な医療データベースからの情報をマージし、ノルウェーの医学辞書から自動的に地図化された用語を含む77,000以上のユニークなエントリを含む。
本稿では,キーワードと接尾辞に基づく自動辞書エントリマッピングの手法について述べるとともに,ドメインエキスパートによるサブセット上で手作業による評価の結果についても述べる。
評価の結果はCAであった。
80%が正解であった。
関連論文リスト
- MedAlign: A Clinician-Generated Dataset for Instruction Following with
Electronic Medical Records [60.35217378132709]
大型言語モデル(LLM)は、人間レベルの流布で自然言語の指示に従うことができる。
医療のための現実的なテキスト生成タスクにおけるLCMの評価は依然として困難である。
我々は、EHRデータのための983の自然言語命令のベンチマークデータセットであるMedAlignを紹介する。
論文 参考訳(メタデータ) (2023-08-27T12:24:39Z) - Streamlining Social Media Information Extraction for Public Health
Research with Deep Learning [20.48874617775236]
ソーシャルメディアを基盤とする公衆衛生研究は、疫病の監視に不可欠である。
ほとんどの研究はキーワードマッチングで関連するコーパスを識別する。
本研究は,口語医学辞典の整理過程を合理化するシステムを開発した。
論文 参考訳(メタデータ) (2023-06-28T08:20:35Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - MedJEx: A Medical Jargon Extraction Model with Wiki's Hyperlink Span and
Contextualized Masked Language Model Score [6.208127495081593]
我々は18K+EHR注記文から専門家が注釈付けした医療用語を用いた,新規かつ公開なデータセットを提示する。
次に,既存のNLPモデルよりも優れた医療ジャーゴン抽出(MedJEx$)モデルを提案する。
論文 参考訳(メタデータ) (2022-10-12T02:27:32Z) - Using Linguistic Typology to Enrich Multilingual Lexicons: the Case of
Lexical Gaps in Kinship [4.970603969125883]
語彙的ギャップと言語固有の単語という概念を通して多様性の現象を捉えている。
我々は,198のドメイン概念,1,911のワード,37,370のギャップからなる語彙意味資源を公開している。
論文 参考訳(メタデータ) (2022-04-11T12:36:26Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - An Automated Method to Enrich Consumer Health Vocabularies Using GloVe
Word Embeddings and An Auxiliary Lexical Resource [0.0]
平民は、ドメインに共通する専門用語を理解できないため、専門家とのコミュニケーションが困難になる可能性がある。
いくつかの専門用語は、平凡な医学用語を専門的な医学用語にマッピングするために作られており、その逆も同様である。
本稿では,どのドメインの語彙にも適用可能な,平民の語彙を豊かにするための自動手法を提案する。
論文 参考訳(メタデータ) (2021-05-18T20:16:45Z) - An analysis of full-size Russian complexly NER labelled corpus of
Internet user reviews on the drugs based on deep learning and language neural
nets [94.37521840642141]
我々は、インターネットユーザーレビューのフルサイズのロシアの複雑なNERラベルコーパスを提示します。
高度なディープラーニングニューラルネットワークセットは、ロシアのテキストから薬理学的に有意義な実体を抽出するために使用される。
論文 参考訳(メタデータ) (2021-04-30T19:46:24Z) - Towards User Friendly Medication Mapping Using Entity-Boosted Two-Tower
Neural Network [12.982185912745564]
薬名推論は、ユーザフレンドリーな医薬品名をフリーフォームテキストから正規化された医薬品リストのコンセプトにマッピングするタスクである。
これは、医療専門家による医療用語の使用の違いと、一般市民からのユーザー会話の相違が原因である。
我々は,医学的推論モデル (MIM) を,最先端の結果を達成するために提案する。
論文 参考訳(メタデータ) (2020-06-17T18:56:44Z) - Word Sense Disambiguation for 158 Languages using Word Embeddings Only [80.79437083582643]
文脈における単語感覚の曖昧さは人間にとって容易であるが、自動的アプローチでは大きな課題である。
本稿では,学習前の標準単語埋め込みモデルを入力として,完全に学習した単語認識のインベントリを誘導する手法を提案する。
この手法を用いて、158の言語に対して、事前訓練されたfastText単語の埋め込みに基づいて、センスインベントリのコレクションを誘導する。
論文 参考訳(メタデータ) (2020-03-14T14:50:04Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。