論文の概要: Adaptation of Autoencoder for Sparsity Reduction From Clinical Notes
Representation Learning
- arxiv url: http://arxiv.org/abs/2209.12831v1
- Date: Mon, 26 Sep 2022 16:37:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 15:03:45.286594
- Title: Adaptation of Autoencoder for Sparsity Reduction From Clinical Notes
Representation Learning
- Title(参考訳): 臨床ノート表現学習からのスパーシティ低減のためのオートエンコーダの適応
- Authors: Thanh-Dung Le, Rita Noumeir, Jerome Rambaud, Guillaume Sans, and
Philippe Jouvet
- Abstract要約: 本稿では,臨床ノート表現の空間的縮小を生かしたオートエンコーダ学習アルゴリズムを提案する。
その動機は, 臨床注記表現特徴空間の次元を小さくすることで, スパースな高次元データを圧縮する方法を決定することである。
提案手法により,評価毎に最大3%の性能向上が得られた。
- 参考スコア(独自算出の注目度): 0.19573380763700707
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: When dealing with clinical text classification on a small dataset recent
studies have confirmed that a well-tuned multilayer perceptron outperforms
other generative classifiers, including deep learning ones. To increase the
performance of the neural network classifier, feature selection for the
learning representation can effectively be used. However, most feature
selection methods only estimate the degree of linear dependency between
variables and select the best features based on univariate statistical tests.
Furthermore, the sparsity of the feature space involved in the learning
representation is ignored. Goal: Our aim is therefore to access an alternative
approach to tackle the sparsity by compressing the clinical representation
feature space, where limited French clinical notes can also be dealt with
effectively. Methods: This study proposed an autoencoder learning algorithm to
take advantage of sparsity reduction in clinical note representation. The
motivation was to determine how to compress sparse, high-dimensional data by
reducing the dimension of the clinical note representation feature space. The
classification performance of the classifiers was then evaluated in the trained
and compressed feature space. Results: The proposed approach provided overall
performance gains of up to 3% for each evaluation. Finally, the classifier
achieved a 92% accuracy, 91% recall, 91% precision, and 91% f1-score in
detecting the patient's condition. Furthermore, the compression working
mechanism and the autoencoder prediction process were demonstrated by applying
the theoretic information bottleneck framework.
- Abstract(参考訳): 近年の小さなデータセットで臨床テキスト分類を扱う際、十分に調整された多層パーセプトロンは、ディープラーニングを含む他の生成的分類器よりも優れていることが確認されている。
ニューラルネットワーク分類器の性能を向上させるために、学習表現の特徴選択を効果的に使用できる。
しかし,ほとんどの特徴選択法は,変数間の線形依存性の程度を推定し,一変量統計テストに基づいて最適な特徴を選択するのみである。
さらに、学習表現に関わる特徴空間の空間性も無視する。
目的: 本研究の目的は, 臨床像の特徴空間を圧縮することにより, スパーシネスに対処するための代替アプローチにアクセスすることであり, 限られた臨床記録も効果的に扱えるようにすることである。
方法: 本研究は, 臨床ノート表現のスパーシティ低減を利用した自動エンコーダ学習アルゴリズムを提案する。
その動機は, 臨床注記表現特徴空間の次元を小さくすることで, スパース高次元データの圧縮方法を決定することである。
分類器の分類性能は、訓練および圧縮された特徴空間で評価された。
結果: 提案手法により, 評価毎に最大3%の性能向上が得られた。
最後に、分類器は患者の状態を検出するために92%の精度、91%のリコール、91%の精度、91%のf1-scoreを達成した。
さらに,理論情報ボトルネックフレームワークを適用し,圧縮作業機構とオートエンコーダ予測プロセスを実証した。
関連論文リスト
- Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8257151788923]
低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文 参考訳(メタデータ) (2023-10-09T08:07:04Z) - ALLSH: Active Learning Guided by Local Sensitivity and Hardness [98.61023158378407]
本稿では,局所感度と硬度認識獲得機能を備えたラベル付きサンプルの検索を提案する。
本手法は,様々な分類タスクにおいてよく用いられるアクティブラーニング戦略よりも一貫した利得が得られる。
論文 参考訳(メタデータ) (2022-05-10T15:39:11Z) - Learning Debiased and Disentangled Representations for Semantic
Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。
各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。
提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文 参考訳(メタデータ) (2021-10-31T16:15:09Z) - Machine Learning Based on Natural Language Processing to Detect Cardiac
Failure in Clinical Narratives [0.2936007114555107]
この研究の目的は、患者が心不全または健康な状態を有するかどうかを自動的に検出する機械学習アルゴリズムを開発することである。
bag-of-word (BoW), term frequency inverse document frequency (TFIDF), and neural word embeddeddings (word2vec) を用いて単語表現学習を行った。
提案されたフレームワークは、ac、pre、rec、f1がそれぞれ84%、82%、85%、83%の全体的な分類性能を達成した。
論文 参考訳(メタデータ) (2021-04-08T17:28:43Z) - Detecting of a Patient's Condition From Clinical Narratives Using
Natural Language Representation [0.3149883354098941]
本稿では,臨床自然言語表現学習と教師付き分類フレームワークを提案する。
この新しいフレームワークは、文脈的臨床物語入力から分布構文と潜在意味論(表現学習)を共同で発見する。
提案手法では, 精度, 再現性, 精度をそれぞれ89 %, 88 %, 89 %とした総合分類性能が得られる。
論文 参考訳(メタデータ) (2021-04-08T17:16:04Z) - Multiclass Burn Wound Image Classification Using Deep Convolutional
Neural Networks [0.0]
創傷専門家が管理プロトコルのより正確な診断と最適化を可能にするためには、継続的な創傷監視が重要です。
本研究では, 深層学習による傷傷画像の分類を, 傷の状況に応じて2、3つのカテゴリに分類する。
論文 参考訳(メタデータ) (2021-03-01T23:54:18Z) - Sickle-cell disease diagnosis support selecting the most appropriate
machinelearning method: Towards a general and interpretable approach for
cellmorphology analysis from microscopy images [0.0]
本稿では,最先端技術に基づく分類手法と特徴の選択手法を提案する。
当科では,他の研究例に応用できる病原体疾患のサンプルを用いて検討した。
論文 参考訳(メタデータ) (2020-10-09T11:46:38Z) - Deep Semi-supervised Knowledge Distillation for Overlapping Cervical
Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。
摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。
実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-21T13:27:09Z) - An Efficient Framework for Automated Screening of Clinically Significant
Macular Edema [0.41998444721319206]
本研究は,臨床上重要な黄斑浮腫(CSME)の自動スクリーニングのための新しいアプローチを提案する。
提案手法は、トレーニング済みのディープニューラルネットワークとメタヒューリスティックな特徴選択を組み合わせたものである。
スクイードデータセットの効果を克服するために、機能領域のオーバーサンプリング技術が使用されている。
論文 参考訳(メタデータ) (2020-01-20T07:34:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。