論文の概要: Medical Segment Coloring of Clinical Notes
- arxiv url: http://arxiv.org/abs/2101.11477v1
- Date: Tue, 26 Jan 2021 09:49:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-13 20:04:13.149410
- Title: Medical Segment Coloring of Clinical Notes
- Title(参考訳): 臨床ノートの医療セグメントカラー化
- Authors: Maha Alkhairy
- Abstract要約: 本稿では,icd-9カテゴリに対応する臨床ノートのセグメントを識別する深層学習に基づく手法を提案する。
提案された医療セグメントカラーラー(MSC)アーキテクチャは、単語分類、(2)フレーズ割り当て、(3)文書分類の3つの段階で動作するパイプラインフレームワークである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a deep learning-based method to identify the segments of
a clinical note corresponding to ICD-9 broad categories which are further
color-coded with respect to 17 ICD-9 categories. The proposed Medical Segment
Colorer (MSC) architecture is a pipeline framework that works in three stages:
(1) word categorization, (2) phrase allocation, and (3) document
classification. MSC uses gated recurrent unit neural networks (GRUs) to map
from an input document to word multi-labels to phrase allocations, and uses
statistical median to map phrase allocation to document multi-label. We compute
variable length segment coloring from overlapping phrase allocation
probabilities. These cross-level bidirectional contextual links identify
adaptive context and then produce segment coloring. We train and evaluate MSC
using the document labeled MIMIC-III clinical notes. Training is conducted
solely using document multi-labels without any information on phrases,
segments, or words. In addition to coloring a clinical note, MSC generates as
byproducts document multi-labeling and word tagging -- creation of ICD9
category keyword lists based on segment coloring. Performance comparison of MSC
byproduct document multi-labels versus methods whose purpose is to produce
justifiable document multi-labels is 64% vs 52.4% micro-average F1-score
against the CAML (CNN attention multi label) method. For evaluation of MSC
segment coloring results, medical practitioners independently assigned the
colors to broad ICD9 categories given a sample of 40 colored notes and a sample
of 50 words related to each category based on the word tags. Binary scoring of
this evaluation has a median value of 83.3% and mean of 63.7%.
- Abstract(参考訳): 本稿では,ICD-9の幅広いカテゴリに対応する臨床ノートのセグメントを同定し,さらに17のICD-9カテゴリについてカラーコードする深層学習手法を提案する。
提案された医療セグメントカラーラー(MSC)アーキテクチャは、(1)単語分類、(2)フレーズ割り当て、(3)文書分類の3つの段階で動作するパイプラインフレームワークである。
MSCは、ゲートリカレントユニットニューラルネットワーク(GRU)を使用して、入力文書から単語マルチラベル、フレーズアロケーションまでをマッピングし、統計的なメディアンを使用してフレーズアロケーションを文書マルチラベルにマップします。
重なり合うフレーズ割り当て確率から可変長セグメントカラー化を計算する。
これらの双方向コンテキストリンクは適応的コンテキストを識別し、セグメントカラー化を生成する。
MIMIC-IIIの臨床診断書を用いてMSCを訓練・評価します。
トレーニングは、フレーズ、セグメント、または単語に関する情報なしで文書のマルチラベルのみを使用して行われます。
臨床メモの着色に加えて、MSCは副産物文書のマルチラベルと単語タグ付け -- セグメントカラー化に基づくICD9カテゴリキーワードリストの作成 -- を生成する。
MSCの副産物文書マルチラベルと、正当な文書マルチラベルを作成するための方法の比較は、64%対52.4%のマイクロ平均F1スコアであり、CAML(CNNの注意マルチラベル)法である。
臨床医はMSCセグメントカラー化結果を評価するために,40種類の色付き音符と50種類の単語の単語を単語タグに基づいて比較し,それぞれ独立に色をICD9カテゴリに割り当てた。
この評価のバイナリスコアリングの中央値は83.3%、平均は63.7%である。
関連論文リスト
- Exploiting Conjugate Label Information for Multi-Instance Partial-Label Learning [61.00359941983515]
MIPL(Multi-instance partial-label Learning)は、各トレーニングサンプルが1つの真のラベルといくつかの偽陽性を含む候補ラベルセットに関連付けられたマルチインスタンスバッグとして表現されるシナリオに対処する。
ELIMIPLは共役ラベル情報を利用して曖昧性を改善する。
論文 参考訳(メタデータ) (2024-08-26T15:49:31Z) - Diagnosis extraction from unstructured Dutch echocardiogram reports using span- and document-level characteristic classification [0.0]
本研究は,非構造オランダ心エコー図による自動スパンレベル診断と文書レベル診断の有用性について検討した。
本研究では,重み付きおよびマクロF1スコア,精度,性能評価のためのリコールを用いて,スパンレベルと文書レベルの両方で自動ラベリング手法を開発し,試験した。
SpanCategorizerとMedRoBERTa$.$nlモデルは、他のすべてのスパンと文書分類器よりも優れていた。
論文 参考訳(メタデータ) (2024-08-13T14:33:32Z) - Improving Large-Scale k-Nearest Neighbor Text Categorization with Label
Autoencoders [0.0]
本稿では,大規模文書コレクションの自動セマンティックインデックス処理を扱うために,多ラベル遅延学習手法を提案する。
提案手法は従来のk-Nearest Neighborsアルゴリズムの進化である。
我々は,MEDLINEバイオメディカル文書コレクションの大部分において提案提案を評価した。
論文 参考訳(メタデータ) (2024-02-03T00:11:29Z) - Text2Tree: Aligning Text Representation to the Label Tree Hierarchy for
Imbalanced Medical Classification [9.391704905671476]
本稿では、医療用テキストにおけるデータ課題を再考し、Text2Treeと呼ばれるフレームワークに依存しない新しいアルゴリズムを提案する。
ラベルのICDコードツリー構造をカスケードアテンションモジュールに組み込んで階層型ラベル表現を学習する。
異なるラベルのサンプルを再利用・識別することでテキスト分類を向上させるために,2つの新しい学習手法であるSimisity Surrogate Learning (SSL) とDissimilarity Mixup Learning (DML) が考案された。
論文 参考訳(メタデータ) (2023-11-28T10:02:08Z) - Many-Class Text Classification with Matching [65.74328417321738]
textbfText textbfClassification をテキストとラベル間のtextbfMatching 問題として定式化し,TCM というシンプルなフレームワークを提案する。
従来のテキスト分類手法と比較して、TCMは分類ラベルのきめ細かい意味情報を活用している。
論文 参考訳(メタデータ) (2022-05-23T15:51:19Z) - Metadata-Induced Contrastive Learning for Zero-Shot Multi-Label Text
Classification [27.33039900612395]
大規模多ラベルテキスト分類のための新しいメタデータ誘導コントラスト学習法(MICoL)を提案する。
MICoLは、Web上で広く利用可能なドキュメントメタデータを利用して、同様のドキュメントとドキュメントのペアを導き出す。
我々は,MICoLが強いゼロショットテキスト分類と対照的な学習ベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2022-02-11T23:22:17Z) - Out-of-Category Document Identification Using Target-Category Names as
Weak Supervision [64.671654559798]
Out-of-category Detection は、文書が不適格(またはターゲット)カテゴリと意味的関連性に応じて区別することを目的としている。
対象のカテゴリの1つに属する文書の信頼性を効果的に測定する,カテゴリ外検出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-24T21:01:25Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - Multi-label Few/Zero-shot Learning with Knowledge Aggregated from
Multiple Label Graphs [8.44680447457879]
本稿では,異なる意味的ラベル関係をコードする複数のラベルグラフから知識を融合する,シンプルな多グラフ集約モデルを提案する。
本研究は,多グラフ知識集約を用いた手法が,少数・ゼロショットラベルのほとんどすべてにおいて,大幅な性能向上を実現していることを示す。
論文 参考訳(メタデータ) (2020-10-15T01:15:43Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z) - Unsupervised Person Re-identification via Multi-label Classification [55.65870468861157]
本稿では,教師なしのReIDを多ラベル分類タスクとして定式化し,段階的に真のラベルを求める。
提案手法は,まず,各人物画像に単一クラスラベルを割り当てることから始まり,ラベル予測のために更新されたReIDモデルを活用することで,多ラベル分類へと進化する。
マルチラベル分類におけるReIDモデルのトレーニング効率を高めるために,メモリベースマルチラベル分類損失(MMCL)を提案する。
論文 参考訳(メタデータ) (2020-04-20T12:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。