論文の概要: Data-Driven Discovery of Feature Groups in Clinical Time Series
- arxiv url: http://arxiv.org/abs/2511.08260v1
- Date: Wed, 12 Nov 2025 01:49:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.723422
- Title: Data-Driven Discovery of Feature Groups in Clinical Time Series
- Title(参考訳): 臨床時系列における特徴群のデータ駆動発見
- Authors: Fedor Sergeev, Manuel Burger, Polina Leshetkina, Vincent Fortuin, Gunnar Rätsch, Rita Kuznetsova,
- Abstract要約: 予測タスクの類似性と関連性に基づく機能のグループ化は,ディープラーニングアーキテクチャの性能向上に寄与することが示されている。
本稿では,特徴群を階層化することで特徴群を学習する手法を提案する。
提案手法は, 合成データに対する静的クラスタリング手法よりも優れ, 実世界の医療データに対する専門家定義グループに匹敵する性能を実現する。
- 参考スコア(独自算出の注目度): 11.418915308804822
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical time series data are critical for patient monitoring and predictive modeling. These time series are typically multivariate and often comprise hundreds of heterogeneous features from different data sources. The grouping of features based on similarity and relevance to the prediction task has been shown to enhance the performance of deep learning architectures. However, defining these groups a priori using only semantic knowledge is challenging, even for domain experts. To address this, we propose a novel method that learns feature groups by clustering weights of feature-wise embedding layers. This approach seamlessly integrates into standard supervised training and discovers the groups that directly improve downstream performance on clinically relevant tasks. We demonstrate that our method outperforms static clustering approaches on synthetic data and achieves performance comparable to expert-defined groups on real-world medical data. Moreover, the learned feature groups are clinically interpretable, enabling data-driven discovery of task-relevant relationships between variables.
- Abstract(参考訳): 臨床時系列データは、患者のモニタリングと予測モデリングに重要である。
これらの時系列は典型的には多変量であり、しばしば異なるデータソースから数百の異種特徴から構成される。
予測タスクの類似性や関連性に基づく機能のグループ化は,ディープラーニングアーキテクチャの性能向上に寄与することが示されている。
しかし、ドメインの専門家であっても、これらのグループを意味的な知識のみを用いた優先順位として定義することは困難である。
そこで本稿では,特徴層を重み付けすることで特徴群を学習する手法を提案する。
このアプローチは、標準的な教師付きトレーニングにシームレスに統合され、臨床的に関係のあるタスクにおいて、下流のパフォーマンスを直接改善するグループを発見する。
提案手法は, 合成データに対する静的クラスタリング手法よりも優れ, 実世界の医療データに対する専門家定義グループに匹敵する性能を実現する。
さらに、学習した特徴群は臨床的に解釈可能であり、変数間のタスク関連関係をデータ駆動で発見することができる。
関連論文リスト
- ProMedTS: A Self-Supervised, Prompt-Guided Multimodal Approach for Integrating Medical Text and Time Series [27.70300880284899]
大規模言語モデル (LLM) は、視覚の細かいタスクにおいて顕著な性能を示してきたが、医療分野におけるそれらの応用はいまだに探索されていない。
ProMedTSは、データ型を統一するために、プロンプト誘導学習を利用する、新しい自己教師型マルチモーダルフレームワークである。
実世界のデータセットを用いた診断タスクにおけるProMedTSの評価を行い,本手法が常に最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-02-19T07:56:48Z) - Two Is Better Than One: Aligned Representation Pairs for Anomaly Detection [56.57122939745213]
異常検出は、標準から逸脱するサンプルを特定することに焦点を当てる。
近年の自己教師型手法は, 異常に関する事前知識を用いて, トレーニング中に合成外れ値を生成することによって, それらの表現をうまく学習している。
この制限は、通常のサンプルにおける対称性に関する事前の知識を活用して、異なるコンテキストでデータを観測する、新しいアプローチであるCon$で対処する。
論文 参考訳(メタデータ) (2024-05-29T07:59:06Z) - On the Importance of Step-wise Embeddings for Heterogeneous Clinical
Time-Series [1.3285222309805063]
近年のシークエンス・モデリングの深層学習の進歩は、電子健康記録から時系列を扱うタスクに完全に移行していない。
特に、ICU(Intensive Care Unit)に関わる問題では、木に基づく手法で表形式でシーケンス分類に取り組むことが現状である。
論文 参考訳(メタデータ) (2023-11-15T12:18:15Z) - Clustering individuals based on multivariate EMA time-series data [2.0824228840987447]
エコロジー・モメンタリー・アセスメント(EMA)の方法論は、時間集約的、反復的、個人内測定の新たな機会を提供する。
高度な機械学習(ML)手法は、データ特性を理解し、基礎となる複雑な心理的プロセスに関する意味のある関係を明らかにするために必要である。
論文 参考訳(メタデータ) (2022-12-02T13:33:36Z) - LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。
タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。
クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文 参考訳(メタデータ) (2022-04-12T12:25:05Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - ExpertNet: A Symbiosis of Classification and Clustering [22.324813752423044]
ExpertNetは、クラスタ化された潜在表現を学習し、クラスタ固有の分類器を効果的に組み合わせてそれらを活用するために、新しいトレーニング戦略を使用している。
本研究では,6つの大規模臨床データセットの最先端手法に対するExpertNetの優位性を実証する。
論文 参考訳(メタデータ) (2022-01-17T11:00:30Z) - Representation Matters: Assessing the Importance of Subgroup Allocations
in Training Data [85.43008636875345]
訓練データにおける多様な表現は,サブグループのパフォーマンス向上と集団レベルの目標達成の鍵である。
分析と実験は、データセット構成がパフォーマンスにどのように影響するかを説明し、既存のデータにおけるトレンドとドメイン知識を用いて、意図的かつ客観的なデータセット設計を導くのに役立つ構成結果を提供する。
論文 参考訳(メタデータ) (2021-03-05T00:27:08Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。