論文の概要: Building a Norwegian Lexical Resource for Medical Entity Recognition
- arxiv url: http://arxiv.org/abs/2004.02509v1
- Date: Mon, 6 Apr 2020 09:24:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 06:36:53.934258
- Title: Building a Norwegian Lexical Resource for Medical Entity Recognition
- Title(参考訳): 医用エンティティ認識のためのノルウェーの語彙資源の構築
- Authors: Ildik\'o Pil\'an and P{\aa}l H. Brekke and Lilja {\O}vrelid
- Abstract要約: 我々は、分類された医学用語の大規模なノルウェーの語彙資源を提示する。
このリソースは、巨大な医療データベースからの情報をマージし、ノルウェーの医学辞書から自動的に地図化された用語を含む77,000以上のユニークなエントリを含む。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a large Norwegian lexical resource of categorized medical terms.
The resource merges information from large medical databases, and contains over
77,000 unique entries, including automatically mapped terms from a Norwegian
medical dictionary. We describe the methodology behind this automatic
dictionary entry mapping based on keywords and suffixes and further present the
results of a manual evaluation performed on a subset by a domain expert. The
evaluation indicated that ca. 80% of the mappings were correct.
- Abstract(参考訳): 我々は、分類された医学用語の大規模なノルウェーの語彙資源を提示する。
このリソースは、巨大な医療データベースからの情報をマージし、ノルウェーの医学辞書から自動的に地図化された用語を含む77,000以上のユニークなエントリを含む。
本稿では,キーワードと接尾辞に基づく自動辞書エントリマッピングの手法について述べるとともに,ドメインエキスパートによるサブセット上で手作業による評価の結果についても述べる。
評価の結果はCAであった。
80%が正解であった。
関連論文リスト
- DILA: Dictionary Label Attention for Mechanistic Interpretability in High-dimensional Multi-label Medical Coding Prediction [27.778160315671776]
医用符号化などの高次元・極端なマルチラベルの予測には、精度と解釈性の両方が必要である。
本稿では,非解釈不能な密埋め込みをスパース埋め込み空間に切り離す機械的解釈可能性モジュールを提案する。
当社のスパース埋め込みは、その密度の高い埋め込みよりも、少なくとも50%は人間に理解できることが示されています。
論文 参考訳(メタデータ) (2024-09-16T17:45:40Z) - Language Models are Surprisingly Fragile to Drug Names in Biomedical Benchmarks [10.423634924466416]
我々はRABBITSという新しいデータセットを作成し、ブランド名とジェネリックドラッグ名を取り替えた後、医療ベンチマークのパフォーマンス差を評価する。
MedQA と MedMCQA のオープンソース LLM と API ベースの LLM を比較し,一貫した性能低下が 1-10% に及んでいることを明らかにした。
論文 参考訳(メタデータ) (2024-06-17T20:09:24Z) - Sõnajaht: Definition Embeddings and Semantic Search for Reverse Dictionary Creation [0.21485350418225246]
本稿では,最新の事前学習言語モデルと近接する近傍探索アルゴリズムを用いて,情報検索に基づく逆辞書システムを提案する。
提案手法はエストニアの既存の語彙資源であるソナベブ(単語ウェブ)に適用され,セマンティック検索を利用した言語間逆辞書機能を導入して拡張・強化することを目的としている。
論文 参考訳(メタデータ) (2024-04-30T10:21:14Z) - MedAlign: A Clinician-Generated Dataset for Instruction Following with
Electronic Medical Records [60.35217378132709]
大型言語モデル(LLM)は、人間レベルの流布で自然言語の指示に従うことができる。
医療のための現実的なテキスト生成タスクにおけるLCMの評価は依然として困難である。
我々は、EHRデータのための983の自然言語命令のベンチマークデータセットであるMedAlignを紹介する。
論文 参考訳(メタデータ) (2023-08-27T12:24:39Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - Using Linguistic Typology to Enrich Multilingual Lexicons: the Case of
Lexical Gaps in Kinship [4.970603969125883]
語彙的ギャップと言語固有の単語という概念を通して多様性の現象を捉えている。
我々は,198のドメイン概念,1,911のワード,37,370のギャップからなる語彙意味資源を公開している。
論文 参考訳(メタデータ) (2022-04-11T12:36:26Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - An analysis of full-size Russian complexly NER labelled corpus of
Internet user reviews on the drugs based on deep learning and language neural
nets [94.37521840642141]
我々は、インターネットユーザーレビューのフルサイズのロシアの複雑なNERラベルコーパスを提示します。
高度なディープラーニングニューラルネットワークセットは、ロシアのテキストから薬理学的に有意義な実体を抽出するために使用される。
論文 参考訳(メタデータ) (2021-04-30T19:46:24Z) - Towards User Friendly Medication Mapping Using Entity-Boosted Two-Tower
Neural Network [12.982185912745564]
薬名推論は、ユーザフレンドリーな医薬品名をフリーフォームテキストから正規化された医薬品リストのコンセプトにマッピングするタスクである。
これは、医療専門家による医療用語の使用の違いと、一般市民からのユーザー会話の相違が原因である。
我々は,医学的推論モデル (MIM) を,最先端の結果を達成するために提案する。
論文 参考訳(メタデータ) (2020-06-17T18:56:44Z) - Word Sense Disambiguation for 158 Languages using Word Embeddings Only [80.79437083582643]
文脈における単語感覚の曖昧さは人間にとって容易であるが、自動的アプローチでは大きな課題である。
本稿では,学習前の標準単語埋め込みモデルを入力として,完全に学習した単語認識のインベントリを誘導する手法を提案する。
この手法を用いて、158の言語に対して、事前訓練されたfastText単語の埋め込みに基づいて、センスインベントリのコレクションを誘導する。
論文 参考訳(メタデータ) (2020-03-14T14:50:04Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。