論文の概要: Mining Electronic Health Records to Investigate Effectiveness of Ensemble Deep Clustering
- arxiv url: http://arxiv.org/abs/2604.07085v1
- Date: Wed, 08 Apr 2026 13:40:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.558882
- Title: Mining Electronic Health Records to Investigate Effectiveness of Ensemble Deep Clustering
- Title(参考訳): 電子健康記録のマイニングによる深層集成の有効性の検討
- Authors: Manar D. Samad, Yina Hou, Shrabani Ghosh,
- Abstract要約: 本稿では,心不全患者コホートにおける従来型,ハイブリッド型,深層学習法の有効性について,実データを用いて検討する。
従来のクラスタリング手法は、ディープラーニングアプローチが特にイメージクラスタリング用に設計されているため、堅牢に機能する。
複数の埋め込み次元から得られたクラスタ割り当てを集約するアンサンブルベースのディープクラスタリング手法を導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In electronic health records (EHRs), clustering patients and distinguishing disease subtypes are key tasks to elucidate pathophysiology and aid clinical decision-making. However, clustering in healthcare informatics is still based on traditional methods, especially K-means, and has achieved limited success when applied to embedding representations learned by autoencoders as hybrid methods. This paper investigates the effectiveness of traditional, hybrid, and deep learning methods in heart failure patient cohorts using real EHR data from the All of Us Research Program. Traditional clustering methods perform robustly because deep learning approaches are specifically designed for image clustering, a task that differs substantially from the tabular EHR data setting. To address the shortcomings of deep clustering, we introduce an ensemble-based deep clustering approach that aggregates cluster assignments obtained from multiple embedding dimensions, rather than relying on a single fixed embedding space. When combined with traditional clustering in a novel ensemble framework, the proposed ensemble embedding for deep clustering delivers the best overall performance ranking across 14 diverse clustering methods and multiple patient cohorts. This paper underscores the importance of biological sex-specific clustering of EHR data and the advantages of combining traditional and deep clustering approaches over a single method.
- Abstract(参考訳): 電子健康記録(EHR)では、患者をクラスタリングし、疾患のサブタイプを区別することが、病態を解明し、臨床的意思決定を支援する重要なタスクである。
しかしながら、医療情報学におけるクラスタリングは、現在でも伝統的な手法、特にK平均に基づいており、オートエンコーダが学習した埋め込み表現をハイブリッド手法として適用することで、限られた成功を収めている。
本稿では, 心不全患者コホートにおける従来型, ハイブリッド型, ディープラーニング手法の有効性を, オール・オブ・ユース・リサーチ・プログラムの実際のEHRデータを用いて検討した。
従来のクラスタリング手法は、ディープラーニングアプローチが特に画像クラスタリングのために設計されているため、堅牢に機能する。
ディープクラスタリングの欠点に対処するため,複数の埋め込み次元から得られたクラスタ割り当てを,単一の固定埋め込み空間に頼るのではなく集約するアンサンブルベースのディープクラスタリング手法を導入する。
新たなアンサンブルフレームワークにおける従来のクラスタリングと組み合わせることで、深層クラスタリングのためのアンサンブル埋め込みは、14の多様なクラスタリングメソッドと複数の患者コホートで最高のパフォーマンスランキングを提供する。
本稿では, EHRデータの生物学的性特化クラスタリングの重要性と, 従来のクラスタリング手法と深層クラスタリング手法を組み合わせる利点について述べる。
関連論文リスト
- Federated unsupervised random forest for privacy-preserving patient
stratification [0.4499833362998487]
教師なしランダムフォレストを用いた新しいマルチオミクスクラスタリング手法を提案する。
我々は、機械学習ベンチマークデータセットとThe Cancer Genome Atlasのがんデータに対するアプローチを検証する。
本手法は病気のサブタイプに関して最先端の手法と競合するが,同時にクラスタの解釈可能性も大幅に向上する。
論文 参考訳(メタデータ) (2024-01-29T12:04:14Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Simple and Scalable Algorithms for Cluster-Aware Precision Medicine [0.0]
共同クラスタリングと埋め込みに対するシンプルでスケーラブルなアプローチを提案する。
この新しいクラスタ対応の埋め込みアプローチは、現在の共同埋め込みとクラスタリング法の複雑さと限界を克服する。
当社のアプローチでは,ユーザが希望するクラスタ数を選択する必要はなく,階層的にクラスタ化された埋め込みの解釈可能なデンドログラムを生成する。
論文 参考訳(メタデータ) (2022-11-29T19:27:26Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and
Future Directions [48.97008907275482]
クラスタリングは、文献で広く研究されている基本的な機械学習タスクである。
ディープクラスタリング(Deep Clustering)、すなわち表現学習とクラスタリングを共同で最適化する手法が提案され、コミュニティで注目を集めている。
深層クラスタリングの本質的なコンポーネントを要約し、深層クラスタリングと深層クラスタリングの相互作用を設計する方法によって既存の手法を分類する。
論文 参考訳(メタデータ) (2022-06-15T15:05:13Z) - Siloed Federated Learning for Multi-Centric Histopathology Datasets [0.17842332554022694]
本稿では,医学領域における深層学習アーキテクチャのための新しいフェデレーション学習手法を提案する。
局所統計バッチ正規化(BN)層が導入され、協調的に訓練されるが中心に固有のモデルが作られる。
本研究では,Camelyon16およびCamelyon17データセットから抽出した腫瘍組織像の分類法についてベンチマークを行った。
論文 参考訳(メタデータ) (2020-08-17T15:49:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。