論文の概要: Applying unsupervised keyphrase methods on concepts extracted from
discharge sheets
- arxiv url: http://arxiv.org/abs/2303.08928v1
- Date: Wed, 15 Mar 2023 20:55:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 18:00:55.997987
- Title: Applying unsupervised keyphrase methods on concepts extracted from
discharge sheets
- Title(参考訳): 放電シートから抽出した概念に対する教師なしキーフレーズ法の適用
- Authors: Hoda Memarzadeh, Nasser Ghadiri, Matthias Samwald, Maryam Lotfi
Shahreza
- Abstract要約: 各内容が記録されている部分を特定し、また、臨床テキストから意味を抽出するための重要な概念を特定する必要がある。
本研究では,臨床自然言語処理技術を用いて,これらの課題に対処した。
一般的な教師なしキーフレーズ抽出手法が検証され,評価されている。
- 参考スコア(独自算出の注目度): 7.102620843620572
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical notes containing valuable patient information are written by
different health care providers with various scientific levels and writing
styles. It might be helpful for clinicians and researchers to understand what
information is essential when dealing with extensive electronic medical
records. Entities recognizing and mapping them to standard terminologies is
crucial in reducing ambiguity in processing clinical notes. Although named
entity recognition and entity linking are critical steps in clinical natural
language processing, they can also result in the production of repetitive and
low-value concepts. In other hand, all parts of a clinical text do not share
the same importance or content in predicting the patient's condition. As a
result, it is necessary to identify the section in which each content is
recorded and also to identify key concepts to extract meaning from clinical
texts. In this study, these challenges have been addressed by using clinical
natural language processing techniques. In addition, in order to identify key
concepts, a set of popular unsupervised key phrase extraction methods has been
verified and evaluated. Considering that most of the clinical concepts are in
the form of multi-word expressions and their accurate identification requires
the user to specify n-gram range, we have proposed a shortcut method to
preserve the structure of the expression based on TF-IDF. In order to evaluate
the pre-processing method and select the concepts, we have designed two types
of downstream tasks (multiple and binary classification) using the capabilities
of transformer-based models. The obtained results show the superiority of
proposed method in combination with SciBERT model, also offer an insight into
the efficacy of general extracting essential phrase methods for clinical notes.
- Abstract(参考訳): 貴重な患者情報を含む臨床ノートは、様々な科学的レベルと執筆スタイルを持つ異なる医療提供者によって書かれる。
臨床医や研究者にとって、広範囲の電子カルテを扱う上で必要な情報を理解するのに役立つかもしれない。
それらを標準用語に認識し、マッピングする実体は、臨床ノートの処理における曖昧さを減らすのに不可欠である。
名前付きエンティティ認識とエンティティリンクは、臨床自然言語処理において重要なステップであるが、反復的および低価値な概念の生成をもたらすこともある。
一方、臨床テキストの全ての部分は、患者の状態を予測する上で同じ重要性や内容を共有しない。
その結果、各内容が記録された部分を特定し、臨床文書から意味を抽出するための重要な概念を特定する必要がある。
本研究では,臨床自然言語処理技術を用いて,これらの課題に対処した。
また,キー概念を識別するために,教師なしキー句抽出手法のセットが検証され,評価されている。
臨床概念の大部分がマルチワード式であり,その正確な識別には,ユーザがn-gram範囲を指定する必要があることを考慮し,TF-IDFに基づく表現構造を保存するためのショートカット手法を提案する。
プリプロセッシング法を評価し,その概念を選択するために,トランスフォーマモデルを用いたダウンストリームタスク(マルチプル分類とバイナリ分類)を2種類設計した。
以上の結果から,提案手法とscibertモデルの組み合わせが優れていることを示し,臨床ノートに対する本質的句抽出法の有用性も示唆した。
関連論文リスト
- AI-assisted summary of suicide risk Formulation [0.9224875902060083]
本研究では,人工知能(AI)の分野である高度自然言語処理(NLP)アルゴリズムの開発について述べる。
自殺リスクアセスメント(英: suicide risk Assessment)とは、個人が抱える問題の性質と発展を理解するための個別化プロセスである。
論文 参考訳(メタデータ) (2024-11-29T16:40:28Z) - SNOBERT: A Benchmark for clinical notes entity linking in the SNOMED CT clinical terminology [43.89160296332471]
本稿では,BERT モデルを用いた SNOMED CT のテキストスパンと特定の概念をリンクする手法を提案する。
本手法は, 候補選択と候補マッチングの2段階からなる。これらのモデルは, ラベル付き臨床ノートの公開データセットの中で, 最大規模で訓練された。
論文 参考訳(メタデータ) (2024-05-25T08:00:44Z) - Cross-Lingual Knowledge Transfer for Clinical Phenotyping [55.92262310716537]
本稿では,英語を使わないクリニックに対して,このタスクを実行するための言語間知識伝達戦略について検討する。
ギリシャ語とスペイン語のクリニックに対して,異なる臨床領域のクリニカルノートを活用して,これらの戦略を評価する。
以上の結果から,多言語データを用いることで,臨床表現型モデルが改善され,データの疎度を補うことが可能であることが示唆された。
論文 参考訳(メタデータ) (2022-08-03T08:33:21Z) - Assessing mortality prediction through different representation models
based on concepts extracted from clinical notes [2.707154152696381]
埋め込みの学習は、音符をそれに匹敵する形式に変換する方法である。
トランスフォーマーベースの表現モデルは、最近大きな飛躍を遂げた。
病院死亡予測の課題において,学習した埋め込みベクターの有用性を評価する実験を行った。
論文 参考訳(メタデータ) (2022-07-22T04:34:33Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - Clinical Text Summarization with Syntax-Based Negation and Semantic
Concept Identification [22.556855536939878]
我々は、人間の専門家によるバイオメディカル知識ベースを用いた計算言語学を用いて、解釈可能かつ有意義な臨床テキスト要約を実現する。
本研究の目的は, バイオメディカルオントロジーを意味情報と共に利用し, 言語階層構造, 選挙区木を活かして, 正しい臨床概念とそれに対応する否定情報を同定することである。
論文 参考訳(メタデータ) (2020-02-29T22:15:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。