論文の概要: Non-stationary Gaussian process discriminant analysis with variable
selection for high-dimensional functional data
- arxiv url: http://arxiv.org/abs/2109.14171v1
- Date: Wed, 29 Sep 2021 03:35:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 00:28:54.975037
- Title: Non-stationary Gaussian process discriminant analysis with variable
selection for high-dimensional functional data
- Title(参考訳): 高次元機能データのための可変選択型非定常ガウス過程判別解析
- Authors: W Yu, S Wade, H D Bondell, L Azizi
- Abstract要約: 高次元分類と特徴選択は、最近のデータ取得技術の進歩とともに至るところで行われている。
これらの構造は、主に変数の選択と分類を別々に行う2段階のアプローチに依存する一般的な手法に、さらなる課題をもたらす。
本稿では、これらのステップを統一されたフレームワークで組み合わせた、新しいガウス過程判別分析(GPDA)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-dimensional classification and feature selection tasks are ubiquitous
with the recent advancement in data acquisition technology. In several
application areas such as biology, genomics and proteomics, the data are often
functional in their nature and exhibit a degree of roughness and
non-stationarity. These structures pose additional challenges to commonly used
methods that rely mainly on a two-stage approach performing variable selection
and classification separately. We propose in this work a novel Gaussian process
discriminant analysis (GPDA) that combines these steps in a unified framework.
Our model is a two-layer non-stationary Gaussian process coupled with an Ising
prior to identify differentially-distributed locations. Scalable inference is
achieved via developing a variational scheme that exploits advances in the use
of sparse inverse covariance matrices. We demonstrate the performance of our
methodology on simulated datasets and two proteomics datasets: breast cancer
and SARS-CoV-2. Our approach distinguishes itself by offering explainability as
well as uncertainty quantification in addition to low computational cost, which
are crucial to increase trust and social acceptance of data-driven tools.
- Abstract(参考訳): 近年のデータ取得技術の進歩に伴い,高次元分類や特徴選択タスクが普及している。
生物学、ゲノム学、プロテオミクスなどのいくつかの応用分野において、データはその性質において機能し、粗さや非定常性を示すことが多い。
これらの構造は、変数の選択と分類を別々に行う2段階のアプローチに主に依存する一般的な手法にさらに挑戦する。
本稿では,これらのステップを統一的な枠組みで組み合わせた新しいガウス過程判別分析(GPDA)を提案する。
我々のモデルは二層非定常ガウス過程とイジングを結合して微分分散した位置を同定する。
スケーラブルな推論は、スパース逆共分散行列の使用の進歩を利用する変分スキームの開発によって実現される。
シミュレーションデータセットと2つのプロテオミクスデータセット(乳がんとsars-cov-2)における手法の性能を示す。
提案手法は,データ駆動ツールの信頼性向上と社会的受容に不可欠である低計算コストに加えて,説明可能性や不確実性定量化を提供することによって,自らを区別する。
関連論文リスト
- Few-shot learning for COVID-19 Chest X-Ray Classification with
Imbalanced Data: An Inter vs. Intra Domain Study [49.5374512525016]
医療画像データセットは、コンピュータ支援診断、治療計画、医学研究に使用される訓練モデルに不可欠である。
データ分散のばらつき、データの不足、ジェネリックイメージから事前トレーニングされたモデルを使用する場合の転送学習の問題などである。
本稿では,データ不足と分散不均衡の影響を軽減するために,一連の手法を統合したシームズニューラルネットワークに基づく手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T16:59:27Z) - Joint Distributional Learning via Cramer-Wold Distance [0.7614628596146602]
高次元データセットの共分散学習を容易にするために,クレーマー-ウォルド距離正規化を導入し,クレーマー-ウォルド距離正規化法を提案する。
また、フレキシブルな事前モデリングを可能にする2段階学習手法を導入し、集約後と事前分布のアライメントを改善する。
論文 参考訳(メタデータ) (2023-10-25T05:24:23Z) - Heterogeneous Multi-Task Gaussian Cox Processes [61.67344039414193]
異種相関タスクを共同でモデル化するためのマルチタスクガウスコックスプロセスの新たな拡張を提案する。
MOGPは、分類、回帰、ポイントプロセスタスクの専用可能性のパラメータに先行して、異種タスク間の情報の共有を容易にする。
モデルパラメータを推定するための閉形式反復更新を実現する平均場近似を導出する。
論文 参考訳(メタデータ) (2023-08-29T15:01:01Z) - Score-based Causal Representation Learning with Interventions [54.735484409244386]
本稿では,潜在因果変数を間接的に観察する際の因果表現学習問題について検討する。
目的は、 (i) 未知の線形変換(スケーリングまで)を回復し、 (ii) 潜在変数の下の有向非巡回グラフ(DAG)を決定することである。
論文 参考訳(メタデータ) (2023-01-19T18:39:48Z) - Learning Causal Representations of Single Cells via Sparse Mechanism
Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。
これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文 参考訳(メタデータ) (2022-11-07T15:47:40Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Scalable Regularised Joint Mixture Models [2.0686407686198263]
多くの応用において、データは異なる基底分布を持つ潜在群にまたがるという意味で不均一である。
我々は,(i)明示的多変量特徴分布,(ii)高次元回帰モデル,(iii)潜在群ラベルの連成学習を可能にする異種データに対するアプローチを提案する。
このアプローチは明らかに高次元において有効であり、計算効率のためのデータ削減と、特徴数が大きければ鍵信号を保持する再重み付けスキームを組み合わせる。
論文 参考訳(メタデータ) (2022-05-03T13:38:58Z) - Linear Discriminant Analysis with High-dimensional Mixed Variables [10.774094462083843]
本稿では,混合変数を用いた高次元観測の分類手法を提案する。
データを指数関数的に多くのセルに分割するという課題を克服する。
推定精度と誤分類率に関する結果が確立される。
論文 参考訳(メタデータ) (2021-12-14T03:57:56Z) - Meta Learning Low Rank Covariance Factors for Energy-Based Deterministic
Uncertainty [58.144520501201995]
ニューラルネットワーク層のBi-Lipschitz正規化は、各レイヤの特徴空間におけるデータインスタンス間の相対距離を保存する。
注意セットエンコーダを用いて,タスク固有の共分散行列を効率的に構築するために,対角的,対角的,低ランクな要素のメタ学習を提案する。
また,最終的な予測分布を達成するために,スケールしたエネルギーを利用する推論手法を提案する。
論文 参考訳(メタデータ) (2021-10-12T22:04:19Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。