Fugu-MT 論文翻訳(概要): Non-stationary Gaussian process discriminant analysis with variable selection for high-dimensional functional data

論文の概要: Non-stationary Gaussian process discriminant analysis with variable selection for high-dimensional functional data

arxiv url: http://arxiv.org/abs/2109.14171v1
Date: Wed, 29 Sep 2021 03:35:49 GMT
ステータス: 翻訳完了
システム内更新日: 2021-10-01 00:28:54.975037
Title: Non-stationary Gaussian process discriminant analysis with variable selection for high-dimensional functional data
Title（参考訳）: 高次元機能データのための可変選択型非定常ガウス過程判別解析
Authors: W Yu, S Wade, H D Bondell, L Azizi
Abstract要約: 高次元分類と特徴選択は、最近のデータ取得技術の進歩とともに至るところで行われている。これらの構造は、主に変数の選択と分類を別々に行う2段階のアプローチに依存する一般的な手法に、さらなる課題をもたらす。本稿では、これらのステップを統一されたフレームワークで組み合わせた、新しいガウス過程判別分析(GPDA)を提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: High-dimensional classification and feature selection tasks are ubiquitous with the recent advancement in data acquisition technology. In several application areas such as biology, genomics and proteomics, the data are often functional in their nature and exhibit a degree of roughness and non-stationarity. These structures pose additional challenges to commonly used methods that rely mainly on a two-stage approach performing variable selection and classification separately. We propose in this work a novel Gaussian process discriminant analysis (GPDA) that combines these steps in a unified framework. Our model is a two-layer non-stationary Gaussian process coupled with an Ising prior to identify differentially-distributed locations. Scalable inference is achieved via developing a variational scheme that exploits advances in the use of sparse inverse covariance matrices. We demonstrate the performance of our methodology on simulated datasets and two proteomics datasets: breast cancer and SARS-CoV-2. Our approach distinguishes itself by offering explainability as well as uncertainty quantification in addition to low computational cost, which are crucial to increase trust and social acceptance of data-driven tools.
Abstract（参考訳）: 近年のデータ取得技術の進歩に伴い,高次元分類や特徴選択タスクが普及している。生物学、ゲノム学、プロテオミクスなどのいくつかの応用分野において、データはその性質において機能し、粗さや非定常性を示すことが多い。これらの構造は、変数の選択と分類を別々に行う2段階のアプローチに主に依存する一般的な手法にさらに挑戦する。本稿では,これらのステップを統一的な枠組みで組み合わせた新しいガウス過程判別分析(GPDA)を提案する。我々のモデルは二層非定常ガウス過程とイジングを結合して微分分散した位置を同定する。スケーラブルな推論は、スパース逆共分散行列の使用の進歩を利用する変分スキームの開発によって実現される。シミュレーションデータセットと2つのプロテオミクスデータセット(乳がんとsars-cov-2)における手法の性能を示す。提案手法は,データ駆動ツールの信頼性向上と社会的受容に不可欠である低計算コストに加えて,説明可能性や不確実性定量化を提供することによって,自らを区別する。

関連論文リスト

On the Interconnections of Calibration, Quantification, and Classifier Accuracy Prediction under Dataset Shift [58.91436551466064]
本稿では,データセットシフト条件下でのキャリブレーションと定量化の3つの基本問題間の相互接続について検討する。これらのタスクのいずれか1つに対するオラクルへのアクセスは、他の2つのタスクの解決を可能にすることを示す。本稿では,他の分野から借用した高度に確立された手法の直接適応に基づく各問題に対する新しい手法を提案する。
論文参考訳（メタデータ） (2025-05-16T15:42:55Z)
Enhanced ECG Arrhythmia Detection Accuracy by Optimizing Divergence-Based Data Fusion [5.575308369829893]
ケルネル密度推定(KDE)とクルバック・リーブラー(KL)の発散を利用した特徴量に基づく融合アルゴリズムを提案する。健常者2000名, 病人2000名から収集した心電図による社内データセットを用いて, PTB-XLデータセットを用いて本手法の検証を行った。その結果, 本手法は, 統合データセットにおける異常心電図症例の特徴に基づく分類精度を大幅に向上させることを示した。
論文参考訳（メタデータ） (2025-03-19T12:16:48Z)
High-Dimensional Markov-switching Ordinary Differential Processes [23.17395115394655]
まず, 離散サンプルから連続サンプル経路を復元し, プロセスのパラメータを推定する2段階アルゴリズムを開発した。我々は,その過程が$beta$-mixingである場合の統計的誤差と線形収束保証に関する新しい理論的知見を提供する。本モデルを用いて,ADHD群と正常制御群における静止状態脳ネットワークの差異について検討する。
論文参考訳（メタデータ） (2024-12-30T18:41:28Z)
GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。 GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文参考訳（メタデータ） (2024-06-01T08:01:05Z)
Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文参考訳（メタデータ） (2024-04-24T09:04:36Z)
PULASki: Learning inter-rater variability using statistical distances to improve probabilistic segmentation [35.34932609930401]
本研究は,バイオメディカルイメージセグメンテーションのための計算効率の良い生成ツールとしてのPULASki法を提案する。専門家のアノテーションでは、小さなデータセットであっても、変数をキャプチャする。また,3次元パッチと従来の2次元スライスを用いた複雑なジオメトリーの計算可能セグメンテーションについて比較検討した。
論文参考訳（メタデータ） (2023-12-25T10:31:22Z)
Joint Distributional Learning via Cramer-Wold Distance [0.7614628596146602]
高次元データセットの共分散学習を容易にするために,クレーマー-ウォルド距離正規化を導入し,クレーマー-ウォルド距離正規化法を提案する。また、フレキシブルな事前モデリングを可能にする2段階学習手法を導入し、集約後と事前分布のアライメントを改善する。
論文参考訳（メタデータ） (2023-10-25T05:24:23Z)
Heterogeneous Multi-Task Gaussian Cox Processes [61.67344039414193]
異種相関タスクを共同でモデル化するためのマルチタスクガウスコックスプロセスの新たな拡張を提案する。 MOGPは、分類、回帰、ポイントプロセスタスクの専用可能性のパラメータに先行して、異種タスク間の情報の共有を容易にする。モデルパラメータを推定するための閉形式反復更新を実現する平均場近似を導出する。
論文参考訳（メタデータ） (2023-08-29T15:01:01Z)
Learning Causal Representations of Single Cells via Sparse Mechanism Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文参考訳（メタデータ） (2022-11-07T15:47:40Z)
Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文参考訳（メタデータ） (2022-07-18T19:16:56Z)
Scalable Regularised Joint Mixture Models [2.0686407686198263]
多くの応用において、データは異なる基底分布を持つ潜在群にまたがるという意味で不均一である。我々は,(i)明示的多変量特徴分布,(ii)高次元回帰モデル,(iii)潜在群ラベルの連成学習を可能にする異種データに対するアプローチを提案する。このアプローチは明らかに高次元において有効であり、計算効率のためのデータ削減と、特徴数が大きければ鍵信号を保持する再重み付けスキームを組み合わせる。
論文参考訳（メタデータ） (2022-05-03T13:38:58Z)
Linear Discriminant Analysis with High-dimensional Mixed Variables [10.774094462083843]
本稿では,混合変数を用いた高次元観測の分類手法を提案する。データを指数関数的に多くのセルに分割するという課題を克服する。推定精度と誤分類率に関する結果が確立される。
論文参考訳（メタデータ） (2021-12-14T03:57:56Z)
Meta Learning Low Rank Covariance Factors for Energy-Based Deterministic Uncertainty [58.144520501201995]
ニューラルネットワーク層のBi-Lipschitz正規化は、各レイヤの特徴空間におけるデータインスタンス間の相対距離を保存する。注意セットエンコーダを用いて,タスク固有の共分散行列を効率的に構築するために,対角的,対角的,低ランクな要素のメタ学習を提案する。また,最終的な予測分布を達成するために,スケールしたエネルギーを利用する推論手法を提案する。
論文参考訳（メタデータ） (2021-10-12T22:04:19Z)
Learning while Respecting Privacy and Robustness to Distributional Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文参考訳（メタデータ） (2020-07-07T18:25:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。