論文の概要: Predicting Survival Outcomes in the Presence of Unlabeled Data
- arxiv url: http://arxiv.org/abs/2210.13891v1
- Date: Tue, 25 Oct 2022 10:19:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 13:03:12.615533
- Title: Predicting Survival Outcomes in the Presence of Unlabeled Data
- Title(参考訳): ラベルなしデータの有無による生存率予測
- Authors: Fateme Nateghi Haredasht, Celine Vens
- Abstract要約: このようなラベルのないデータインスタンスを組み込むことで、正確な生存時間を予測できるかどうかを検討する。
本研究は, この新たな設定に対処するための3つのアプローチを提案し, 実生活臨床および遺伝子発現生存データセットを比較検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many clinical studies require the follow-up of patients over time. This is
challenging: apart from frequently observed drop-out, there are often also
organizational and financial challenges, which can lead to reduced data
collection and, in turn, can complicate subsequent analyses. In contrast, there
is often plenty of baseline data available of patients with similar
characteristics and background information, e.g., from patients that fall
outside the study time window. In this article, we investigate whether we can
benefit from the inclusion of such unlabeled data instances to predict accurate
survival times. In other words, we introduce a third level of supervision in
the context of survival analysis, apart from fully observed and censored
instances, we also include unlabeled instances. We propose three approaches to
deal with this novel setting and provide an empirical comparison over fifteen
real-life clinical and gene expression survival datasets. Our results
demonstrate that all approaches are able to increase the predictive performance
over independent test data. We also show that integrating the partial
supervision provided by censored data in a semi-supervised wrapper approach
generally provides the best results, often achieving high improvements,
compared to not using unlabeled data.
- Abstract(参考訳): 多くの臨床研究は、時間の経過とともに患者の追跡を必要とする。
頻繁に観察されるドロップアウトとは別に、しばしば組織的および財政的な課題があり、それによってデータ収集が減少し、その結果、その後の分析が複雑になる。
対照的に、同様の特徴を持つ患者、例えば、学習時間窓の外に落下する患者から得られる背景情報など、多くのベースラインデータが存在する。
本稿では,このようなラベルのないデータインスタンスを組み込むことで正確な生存時間を予測できるかどうかについて検討する。
言い換えれば、完全に観察され検閲されたインスタンスとは別に、生存分析の文脈において第3のレベルの監督を導入する。
本研究は, この新たな設定に対処する3つのアプローチを提案し, 実生活における臨床および遺伝子発現生存データセットを比較検討する。
以上の結果から, 独立テストデータよりも予測性能が向上することが示唆された。
また, 半教師付きラッパーアプローチにおいて, 検閲データによる部分的監視を組み込むことは, ラベル付きデータを使用しない場合に比べて, 多くの場合, 高い改善が期待できることを示す。
関連論文リスト
- Multi-modal Data Binding for Survival Analysis Modeling with Incomplete Data and Annotations [19.560652381770243]
我々は、モダリティと検閲されたサバイバルラベルにまたがる不完全なデータを同時に扱う新しいフレームワークを導入する。
我々のアプローチでは、高度な基礎モデルを用いて個々のモダリティを符号化し、それらを普遍的な表現空間に整列させる。
提案手法は,2つのサバイバル分析タスクにおいて,両者が適用したデータセットの予測精度に優れることを示す。
論文 参考訳(メタデータ) (2024-07-25T02:55:39Z) - SurvTimeSurvival: Survival Analysis On The Patient With Multiple
Visits/Records [26.66492761632773]
近年の人工知能の進歩にもかかわらず、重症疾患患者の生存時間の正確な予測は重要な課題である。
本研究は「SurvTimeSurvival: Survival Analysis on patients with Multiple visits/Records」を紹介する。
論文 参考訳(メタデータ) (2023-11-16T12:30:14Z) - Contrastive Learning of Temporal Distinctiveness for Survival Analysis
in Electronic Health Records [10.192973297290136]
本稿では,オントロジーを意識したテンポラリティに基づくコントラシブ・サバイバル(OTCSurv)分析フレームワークを提案する。
OTCSurvは、検閲されたデータと観察されたデータの両方から生存期間を使い、時間的特異性を定義する。
急性腎障害(AKI)を発症する危険のある入院患者のリスクを予測するために,大規模なEHRデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2023-08-24T22:36:22Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Leveraging Unlabelled Data in Multiple-Instance Learning Problems for
Improved Detection of Parkinsonian Tremor in Free-Living Conditions [80.88681952022479]
本稿では,半教師付き学習とマルチスタンス学習を組み合わせた新しい手法を提案する。
本研究は,454被験者の非競合データを活用することにより,物体ごとの震動検出において大きな性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2023-04-29T12:25:10Z) - A Deep Variational Approach to Clustering Survival Data [5.871238645229228]
変分深層クラスタリングにおけるクラスタサバイバルデータに対する新しい確率的アプローチを提案する。
提案手法は,説明変数と潜在的に検閲された生存時間の両方の分布を明らかにするために,深い生成モデルを用いている。
論文 参考訳(メタデータ) (2021-06-10T14:10:25Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z) - Enabling Counterfactual Survival Analysis with Balanced Representations [64.17342727357618]
生存データは様々な医学的応用、すなわち薬物開発、リスクプロファイリング、臨床試験で頻繁に見られる。
本稿では,生存結果に適用可能な対実的推論のための理論的基盤を持つ統一的枠組みを提案する。
論文 参考訳(メタデータ) (2020-06-14T01:15:00Z) - Overly Optimistic Prediction Results on Imbalanced Data: a Case Study of
Flaws and Benefits when Applying Over-sampling [13.463035357173045]
データを相互に排他的なトレーニングとテストセットに分割する前にオーバーサンプリングを適用する。
この結果が,2つの人工データセットを用いて偏りを生じさせ,この欠陥が同定された研究結果を再現することを示す。
論文 参考訳(メタデータ) (2020-01-15T12:53:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。