論文の概要: Prediction approaches for partly missing multi-omics covariate data: A
literature review and an empirical comparison study
- arxiv url: http://arxiv.org/abs/2302.03991v1
- Date: Wed, 8 Feb 2023 10:58:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-09 16:48:47.800472
- Title: Prediction approaches for partly missing multi-omics covariate data: A
literature review and an empirical comparison study
- Title(参考訳): 部分的に欠落したマルチオミクス変量データの予測手法:文献レビューと経験的比較研究
- Authors: Roman Hornung, Frederik Ludwigs, Jonas Hagenberg, Anne-Laure
Boulesteix
- Abstract要約: 高次元分子データは、ゲノミクス、トランスクリプトーム、またはプロテオミクスデータのようないくつかのタイプから構成される。
それぞれのオミクスタイプはユニークな情報を提供し、単一のオミクスデータタイプを使用する場合と比較して予測を改善する可能性がある。
しかし、トレーニングデータと自動予測ルールを適用するべきデータでは、すべての患者に異なるオミクスデータ型が利用できるわけではない。
- 参考スコア(独自算出の注目度): 1.2043574473965317
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the availability of omics data has increased in the last few years, more
multi-omics data have been generated, that is, high-dimensional molecular data
consisting of several types such as genomic, transcriptomic, or proteomic data,
all obtained from the same patients. Such data lend themselves to being used as
covariates in automatic outcome prediction because each omics type may
contribute unique information, possibly improving predictions compared to using
only one omics data type. Frequently, however, in the training data and the
data to which automatic prediction rules should be applied, the test data, the
different omics data types are not available for all patients. We refer to this
type of data as block-wise missing multi-omics data. First, we provide a
literature review on existing prediction methods applicable to such data.
Subsequently, using a collection of 13 publicly available multi-omics data
sets, we compare the predictive performances of several of these approaches for
different block-wise missingness patterns. Finally, we discuss the results of
this empirical comparison study and draw some tentative conclusions.
- Abstract(参考訳): ここ数年でomicsデータの可用性が高まるにつれて、ゲノム、転写学、プロテオミクスといった複数のタイプからなる高次元の分子データが、同じ患者から得られる、より多くのマルチオミクスデータを生成するようになった。
このようなデータは、それぞれのオミクスタイプがユニークな情報に寄与する可能性があるため、自動結果予測において共変量として使用されるのに役立つ。
しかしながら、自動予測ルールを適用するべきトレーニングデータやデータでは、テストデータでは、すべての患者に対して異なるオミクスデータ型が利用できないことが多い。
この種のデータをブロックワイズに欠落したマルチオミクスデータと呼ぶ。
まず,このようなデータに適用可能な既存の予測手法について文献レビューを行う。
その後、利用可能な13個のマルチオミクスデータセットの集合を用いて、これらのアプローチの予測性能をブロック単位の欠点パターンで比較した。
最後に,本実験の結果について検討し,仮結論を導出する。
関連論文リスト
- Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Mean Estimation with User-level Privacy under Data Heterogeneity [54.07947274508013]
異なるユーザーは、非常に多くの異なるデータポイントを持っているかもしれない。
すべてのユーザが同じディストリビューションからサンプルを採取していると仮定することはできない。
本研究では,データの分布と量の両方でユーザデータが異なる異質なユーザデータの単純なモデルを提案する。
論文 参考訳(メタデータ) (2023-07-28T23:02:39Z) - Utility Assessment of Synthetic Data Generation Methods [0.0]
完全合成データを生成する方法が,その実用性に相違があるかどうかを考察する。
ボード上の他の方法よりもパフォーマンスがよい方法がいくつかあります。
機械学習モデルのトレーニングに合成データを使用する場合、分類タスクに対して有望な結果が得られる。
論文 参考訳(メタデータ) (2022-11-23T11:09:52Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Mixture Model Framework for Traumatic Brain Injury Prognosis Using
Heterogeneous Clinical and Outcome Data [3.7363119896212478]
TBIに関連する大きな異種データ型をモデル化する手法を開発する。
このモデルは、人口統計、血液ベースのバイオマーカー、画像検出など、さまざまなデータタイプを含むデータセットでトレーニングされます。
教師なしの学習環境で患者を別々のグループに成層するために使用されます。
論文 参考訳(メタデータ) (2020-12-22T19:31:03Z) - Two-step penalised logistic regression for multi-omic data with an
application to cardiometabolic syndrome [62.997667081978825]
我々は,各層で変数選択を行うマルチオミックロジスティック回帰に対する2段階のアプローチを実装した。
私たちのアプローチは、可能な限り多くの関連する予測子を選択することを目標とすべきです。
提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
論文 参考訳(メタデータ) (2020-08-01T10:36:27Z) - Impact of Medical Data Imprecision on Learning Results [9.379890125442333]
医療応用におけるインプレクションが予測結果に与える影響について検討した。
トレーニング済みのモデルを用いて、患者の甲状腺機能亢進症の将来状態を予測する。
論文 参考訳(メタデータ) (2020-07-24T06:54:57Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - Large-scale benchmark study of survival prediction methods using
multi-omics data [2.204918347869259]
生存時間などの疾患結果の予測には,マルチオミクスデータの有用性が疑問視されている。
我々は,実データを用いた大規模ベンチマーク研究により,いくつかの回答を提供することを目指している。
論文 参考訳(メタデータ) (2020-03-07T18:03:17Z) - Overly Optimistic Prediction Results on Imbalanced Data: a Case Study of
Flaws and Benefits when Applying Over-sampling [13.463035357173045]
データを相互に排他的なトレーニングとテストセットに分割する前にオーバーサンプリングを適用する。
この結果が,2つの人工データセットを用いて偏りを生じさせ,この欠陥が同定された研究結果を再現することを示す。
論文 参考訳(メタデータ) (2020-01-15T12:53:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。