論文の概要: Rediscovery of CNN's Versatility for Text-based Encoding of Raw
Electronic Health Records
- arxiv url: http://arxiv.org/abs/2303.08290v1
- Date: Wed, 15 Mar 2023 00:37:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 15:14:46.899403
- Title: Rediscovery of CNN's Versatility for Text-based Encoding of Raw
Electronic Health Records
- Title(参考訳): テキストによる電子健康記録の符号化におけるCNNの妥当性の再検討
- Authors: Eunbyeol Cho, Min Jae Lee, Kyunghoon Hur, Jiyoun Kim, Jinsung Yoon,
Edward Choi
- Abstract要約: 我々は,大容量データを管理可能なサイズに縮小するだけでなく,多種多様な臨床業務を行う患者の中核情報を適切に保存する多目的エンコーダを探索する。
階層的に構造化された畳み込みニューラルネットワーク(CNN)は、多種多様なタスクにおける最先端モデルよりも優れていることが判明した。
- 参考スコア(独自算出の注目度): 22.203204279166496
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Making the most use of abundant information in electronic health records
(EHR) is rapidly becoming an important topic in the medical domain. Recent work
presented a promising framework that embeds entire features in raw EHR data
regardless of its form and medical code standards. The framework, however, only
focuses on encoding EHR with minimal preprocessing and fails to consider how to
learn efficient EHR representation in terms of computation and memory usage. In
this paper, we search for a versatile encoder not only reducing the large data
into a manageable size but also well preserving the core information of
patients to perform diverse clinical tasks. We found that hierarchically
structured Convolutional Neural Network (CNN) often outperforms the
state-of-the-art model on diverse tasks such as reconstruction, prediction, and
generation, even with fewer parameters and less training time. Moreover, it
turns out that making use of the inherent hierarchy of EHR data can boost the
performance of any kind of backbone models and clinical tasks performed.
Through extensive experiments, we present concrete evidence to generalize our
research findings into real-world practice. We give a clear guideline on
building the encoder based on the research findings captured while exploring
numerous settings.
- Abstract(参考訳): 電子健康記録(EHR)に豊富な情報を最大限に活用することは、医療分野において急速に重要なトピックになりつつある。
最近の研究は、フォームや医療コード標準に関係なく、すべての機能を生のEHRデータに組み込む有望なフレームワークを提示した。
しかし、このフレームワークは、最小限の事前処理で EHR を符号化することのみに焦点を当てており、計算とメモリ使用量の観点から効率的な EHR 表現の学習方法を考えることができない。
本稿では,大容量データを管理可能なサイズに縮小するだけでなく,多種多様な臨床業務を行う患者の中核情報を適切に保存する多目的エンコーダを探索する。
階層的に構成された畳み込みニューラルネットワーク(cnn)は,パラメータが少なく,トレーニング時間が短い場合でも,再構成や予測,生成といったさまざまなタスクにおいて,最先端のモデルを上回ることが多かった。
さらに, EHRデータ固有の階層構造を利用することで, バックボーンモデルや臨床作業のパフォーマンスが向上することが判明した。
本研究の成果を実世界の実践に一般化するための具体的な証拠を提示する。
我々は、多くの設定を探索しながら得られた研究結果に基づいて、エンコーダを構築するための明確なガイドラインを示す。
関連論文リスト
- CorpusBrain: Pre-train a Generative Retrieval Model for
Knowledge-Intensive Language Tasks [62.22920673080208]
単一ステップ生成モデルは、検索プロセスを劇的に単純化し、エンドツーエンドで最適化することができる。
我々は、事前学習された生成検索モデルをCorpsBrainと名付け、コーパスに関する全ての情報が、追加のインデックスを構築することなく、そのパラメータにエンコードされる。
論文 参考訳(メタデータ) (2022-08-16T10:22:49Z) - UniHPF : Universal Healthcare Predictive Framework with Zero Domain
Knowledge [7.312345319231457]
Universal Healthcare Predictive Framework (UniHPF)は、大規模なEHRモデルを構築することができる。
我々のフレームワークは、マルチソース学習タスクにおいてベースラインモデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-07-20T12:46:26Z) - DrugOOD: Out-of-Distribution (OOD) Dataset Curator and Benchmark for
AI-aided Drug Discovery -- A Focus on Affinity Prediction Problems with Noise
Annotations [90.27736364704108]
我々は、AI支援薬物発見のための体系的なOODデータセットキュレーターおよびベンチマークであるTarmOODを提案する。
DrugOODには、ベンチマークプロセスを完全に自動化するオープンソースのPythonパッケージが付属している。
我々は、薬物標的結合親和性予測という、AIDDにおける最も重要な問題の1つに焦点を当てる。
論文 参考訳(メタデータ) (2022-01-24T12:32:48Z) - Simple Recurrent Neural Networks is all we need for clinical events
predictions using EHR data [22.81278657120305]
リカレントニューラルネットワーク(Recurrent Neural Network, RNN)は、EHRに基づく臨床イベント予測モデルのための一般的なアーキテクチャである。
心不全の発症リスクと入院早期入院のリスクの2つの予測課題を用いた。
GRUやLSTMなどの単純なゲート付きRNNモデルでは,ベイズ最適化を適切に調整した場合に,しばしば競合する結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-10-03T13:07:23Z) - Self-Supervised Graph Learning with Hyperbolic Embedding for Temporal
Health Event Prediction [13.24834156675212]
本稿では,情報フローを組み込んだハイパーボリック埋め込み手法を提案する。
我々は、これらの事前学習された表現をグラフニューラルネットワークに組み込んで、疾患の合併症を検出する。
本稿では,EHRデータを完全に活用する自己教師付き学習フレームワークに,階層型で強化された履歴予測代行タスクを提案する。
論文 参考訳(メタデータ) (2021-06-09T00:42:44Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Domain Generalization for Medical Imaging Classification with
Linear-Dependency Regularization [59.5104563755095]
本稿では,医用画像分類分野におけるディープニューラルネットワークの一般化能力向上のための,シンプルだが効果的なアプローチを提案する。
医用画像の領域変数がある程度コンパクトであることに感銘を受けて,変分符号化による代表的特徴空間の学習を提案する。
論文 参考訳(メタデータ) (2020-09-27T12:30:30Z) - Multimodal Learning for Cardiovascular Risk Prediction using EHR Data [0.9805331696863404]
本稿では,医療用テキストと構造化臨床情報を統合した循環神経モデルを提案する。
BiLSTMモデルは、最後の完全に接続されたニューラルネットワークに適用する前に、単語の埋め込みを古典的な臨床予測者に埋め込む。
明らかな血管疾患または高リスクの心血管疾患を有する実世界の患者のデータセットで評価する。
論文 参考訳(メタデータ) (2020-08-27T08:09:02Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。