論文の概要: Seeing The Whole Patient: Using Multi-Label Medical Text Classification
Techniques to Enhance Predictions of Medical Codes
- arxiv url: http://arxiv.org/abs/2004.00430v1
- Date: Sun, 29 Mar 2020 02:19:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 13:33:08.763903
- Title: Seeing The Whole Patient: Using Multi-Label Medical Text Classification
Techniques to Enhance Predictions of Medical Codes
- Title(参考訳): 患者全体を見る:多ラベル医用テキスト分類技術を用いて医療コードの予測を促進する
- Authors: Vithya Yogarajan, Jacob Montiel, Tony Smith, Bernhard Pfahringer
- Abstract要約: 18,50,155ラベルの多ラベル医療用テキスト分類問題について報告する。
不均衡なデータに対して、頻繁に発生するラベルは、埋め込みに組み込まれた追加機能から最も恩恵を受けることを示す。
この研究の高次元埋め込みは公共用途に利用可能である。
- 参考スコア(独自算出の注目度): 2.158285012874102
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning-based multi-label medical text classifications can be used
to enhance the understanding of the human body and aid the need for patient
care. We present a broad study on clinical natural language processing
techniques to maximise a feature representing text when predicting medical
codes on patients with multi-morbidity. We present results of multi-label
medical text classification problems with 18, 50 and 155 labels. We compare
several variations to embeddings, text tagging, and pre-processing. For
imbalanced data we show that labels which occur infrequently, benefit the most
from additional features incorporated in embeddings. We also show that high
dimensional embeddings pre-trained using health-related data present a
significant improvement in a multi-label setting, similarly to the way they
improve performance for binary classification. High dimensional embeddings from
this research are made available for public use.
- Abstract(参考訳): 機械学習に基づくマルチラベル医療テキスト分類は、人体の理解を深め、患者ケアの必要性を高めるために使用できる。
本稿では,マルチモルビディティ患者の医学的コードを予測する際に,テキストを表す特徴を最大化するための臨床的自然言語処理技術に関する広範な研究を行う。
18,50,155ラベルの多ラベル医療用テキスト分類問題について報告する。
組込み,テキストタグ付け,前処理など,いくつかのバリエーションを比較した。
不均衡なデータに対して、頻繁に発生するラベルは、埋め込みに組み込まれた追加機能から最も恩恵を受けることを示す。
また, 健康関連データを用いて事前学習した高次元埋め込みは, バイナリ分類の性能向上と同様に, マルチラベル設定において著しく改善することを示した。
この研究の高次元埋め込みは公共用途に利用可能である。
関連論文リスト
- DILA: Dictionary Label Attention for Mechanistic Interpretability in High-dimensional Multi-label Medical Coding Prediction [27.778160315671776]
医用符号化などの高次元・極端なマルチラベルの予測には、精度と解釈性の両方が必要である。
本稿では,非解釈不能な密埋め込みをスパース埋め込み空間に切り離す機械的解釈可能性モジュールを提案する。
当社のスパース埋め込みは、その密度の高い埋め込みよりも、少なくとも50%は人間に理解できることが示されています。
論文 参考訳(メタデータ) (2024-09-16T17:45:40Z) - MLIP: Enhancing Medical Visual Representation with Divergence Encoder
and Knowledge-guided Contrastive Learning [48.97640824497327]
本稿では、画像テキストのコントラスト学習を通じて、言語情報を視覚領域に統合するための案内信号として、ドメイン固有の医療知識を活用する新しいフレームワークを提案する。
我々のモデルには、設計した分散エンコーダによるグローバルコントラスト学習、局所トークン・知識・パッチアライメントコントラスト学習、知識誘導型カテゴリレベルのコントラスト学習、エキスパートナレッジによるコントラスト学習が含まれる。
特に、MLIPは、限られた注釈付きデータであっても最先端の手法を超越し、医療表現学習の進歩におけるマルチモーダル事前学習の可能性を強調している。
論文 参考訳(メタデータ) (2024-02-03T05:48:50Z) - Making the Most Out of the Limited Context Length: Predictive Power
Varies with Clinical Note Type and Note Section [70.37720062263176]
本研究では,高い予測力で区間を解析する枠組みを提案する。
MIMIC-IIIを用いて,(1)看護用音符と退院用音符とでは予測電力分布が異なること,(2)文脈長が大きい場合の音符の組み合わせにより性能が向上することが示唆された。
論文 参考訳(メタデータ) (2023-07-13T20:04:05Z) - Effective Medical Code Prediction via Label Internal Alignment [2.538209532048867]
臨床用テキストから医療用コードを予測するために,多視点アテンションに基づくニューラルネットワークを提案する。
提案手法は,オープンソースデータセット上で有効であることが確認された。
論文 参考訳(メタデータ) (2023-05-09T04:14:20Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Improving Predictions of Tail-end Labels using Concatenated
BioMed-Transformers for Long Medical Documents [3.0625089376654664]
本研究の目的は,多ラベル問題,特にロングテールラベルにおける低頻度ラベルのF1スコアを改善することである。
TransformerXL を用いて医療コード予測のためのSOTA (State-of-the-art) 結果を得た。
論文 参考訳(メタデータ) (2021-12-03T05:06:43Z) - Word-level Text Highlighting of Medical Texts forTelehealth Services [0.0]
本研究の目的は,異なるテキストハイライト技術が関連する医療状況をどのように捉えることができるかを示すことである。
3つの異なる単語レベルのテキストハイライト手法を実装し評価する。
実験の結果、ニューラルネットワークアプローチは医療関連用語の強調に成功していることがわかった。
論文 参考訳(メタデータ) (2021-05-21T15:13:54Z) - Does the Magic of BERT Apply to Medical Code Assignment? A Quantitative
Study [2.871614744079523]
事前訓練されたモデルが、さらなるアーキテクチャエンジニアリングなしで医療コード予測に有用かどうかは明らかではない。
本稿では,単語間のインタラクションをキャプチャし,ラベル情報を活用する階層的な微調整アーキテクチャを提案する。
現在の傾向とは対照的に、我々は慎重に訓練された古典的なCNNは、頻繁なコードでMIMIC-IIIサブセット上の注意ベースのモデルを上回ることを実証します。
論文 参考訳(メタデータ) (2021-03-11T07:23:45Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。