論文の概要: Variable Selection Methods for Multivariate, Functional, and Complex Biomedical Data in the AI Age
- arxiv url: http://arxiv.org/abs/2501.06868v1
- Date: Sun, 12 Jan 2025 16:33:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 14:27:15.570694
- Title: Variable Selection Methods for Multivariate, Functional, and Complex Biomedical Data in the AI Age
- Title(参考訳): AI時代の多変量・機能・複雑生物医学データに対する可変選択法
- Authors: Marcos Matabuena,
- Abstract要約: 本研究は,多変量式,関数式,およびさらに一般的な結果に対する最適化に基づく変数選択法を,ベストサブセット選択に基づく計量空間において提案する。
本フレームワークは, 線形, 量子化, あるいは非パラメトリック加法モデルなどの回帰モデルに適用し, 広範囲のランダム応答に適用する。
分析の結果,提案手法は最先端の手法よりも精度が高く,特に競争相手よりも数桁の精度向上を実現していることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Many problems within personalized medicine and digital health rely on the analysis of continuous-time functional biomarkers and other complex data structures emerging from high-resolution patient monitoring. In this context, this work proposes new optimization-based variable selection methods for multivariate, functional, and even more general outcomes in metrics spaces based on best-subset selection. Our framework applies to several types of regression models, including linear, quantile, or non parametric additive models, and to a broad range of random responses, such as univariate, multivariate Euclidean data, functional, and even random graphs. Our analysis demonstrates that our proposed methodology outperforms state-of-the-art methods in accuracy and, especially, in speed-achieving several orders of magnitude improvement over competitors across various type of statistical responses as the case of mathematical functions. While our framework is general and is not designed for a specific regression and scientific problem, the article is self-contained and focuses on biomedical applications. In the clinical areas, serves as a valuable resource for professionals in biostatistics, statistics, and artificial intelligence interested in variable selection problem in this new technological AI-era.
- Abstract(参考訳): パーソナライズされた医療とデジタルヘルスにおける多くの問題は、高解像度の患者モニタリングから生じる、継続的機能的バイオマーカーやその他の複雑なデータ構造の分析に依存している。
この文脈では、最適部分集合選択に基づく計量空間における多変量、汎関数およびさらに一般的な結果に対する最適化に基づく新しい変数選択法を提案する。
我々のフレームワークは、線形、量子、あるいは非パラメトリック加法モデルを含むいくつかの回帰モデルに適用され、ユニバリケート、多変量ユークリッドデータ、関数、およびランダムグラフのような広範囲のランダム応答に適用される。
解析の結果,提案手法は精度,特に数桁の精度向上に優れており,数理関数の場合のように,様々な種類の統計応答の競合よりも高速であることがわかった。
我々のフレームワークは汎用的で、特定の回帰と科学的問題のために設計されていないが、この記事は自己完結型であり、バイオメディカルな応用に焦点を当てている。
臨床分野では、バイオ統計学、統計学、人工知能の専門家にとって、この新しいAI時代における可変選択問題に関心のある貴重なリソースとして機能する。
関連論文リスト
- Dynamic feature selection in medical predictive monitoring by reinforcement learning [4.967941028121525]
多くの既存特徴選択手法は時系列情報を効果的に活用するには不十分である。
我々は、最大限のコスト制約の下でポリシーを最適化するために強化学習を採用する。
我々の手法は、微分不可能な予測モデルとシームレスに統合できる。
論文 参考訳(メタデータ) (2024-05-30T06:21:11Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Dual-stage optimizer for systematic overestimation adjustment applied to
multi-objective genetic algorithms for biomarker selection [0.18648070031379424]
特徴選択法を用いたバイオマーカー同定は,特徴数における予測能力とパシモニーのトレードオフを伴う多目的問題として扱うことができる。
提案するDOSA-MOは多目的最適化ラッパーアルゴリズムで,元の推定値,分散度,および解の特徴セットサイズが過大評価を予測する。
論文 参考訳(メタデータ) (2023-12-27T16:13:14Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Flexible variable selection in the presence of missing data [0.0]
本稿では,非パラメトリックな変数選択アルゴリズムと多重計算を組み合わせることで,非ランダムなデータが存在する場合のフレキシブルなパネルの開発を行う。
提案手法の動作特性は良好であり,より高い分類性能と可変選択性能を有するパネルが得られた。
論文 参考訳(メタデータ) (2022-02-25T21:41:03Z) - Machine Learning for Multi-Output Regression: When should a holistic
multivariate approach be preferred over separate univariate ones? [62.997667081978825]
ランダムフォレストのような木に基づくアンサンブルは、統計学の手法の中で近代的な古典である。
これらの手法を広範囲なシミュレーションで比較し,多変量アンサンブル技術を用いた場合の主問題に答える。
論文 参考訳(メタデータ) (2022-01-14T08:44:25Z) - The Medkit-Learn(ing) Environment: Medical Decision Modelling through
Simulation [81.72197368690031]
医用シーケンシャルな意思決定に特化して設計された新しいベンチマークスイートを提案する。
Medkit-Learn(ing) Environmentは、高忠実度合成医療データに簡単かつ簡単にアクセスできるPythonパッケージである。
論文 参考訳(メタデータ) (2021-06-08T10:38:09Z) - Variable selection with missing data in both covariates and outcomes:
Imputation and machine learning [1.0333430439241666]
欠落したデータ問題は、健康研究で普遍的です。
機械学習はパラメトリックな仮定を弱める。
XGBoostとBARTは、さまざまな設定で最高のパフォーマンスを発揮します。
論文 参考訳(メタデータ) (2021-04-06T20:18:29Z) - Data-Driven Logistic Regression Ensembles With Applications in Genomics [0.0]
本稿では,正規化とアンサンブルのアイデアを組み合わせた高次元二項分類問題に対する新しいアプローチを提案する。
がん,多発性硬化症,乾皮症などの共通疾患を含むいくつかの医学的データセットを用いて,バイオマーカーの予測精度と同定の点で,本手法の優れた性能を実証した。
論文 参考訳(メタデータ) (2021-02-17T05:57:26Z) - Generalized Matrix Factorization: efficient algorithms for fitting
generalized linear latent variable models to large data arrays [62.997667081978825]
一般化線形潜在変数モデル(GLLVM)は、そのような因子モデルを非ガウス応答に一般化する。
GLLVMのモデルパラメータを推定する現在のアルゴリズムは、集約的な計算を必要とし、大規模なデータセットにスケールしない。
本稿では,GLLVMを高次元データセットに適用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-06T04:28:19Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。