論文の概要: Guiding adaptive shrinkage by co-data to improve regression-based prediction and feature selection
- arxiv url: http://arxiv.org/abs/2405.04917v1
- Date: Wed, 8 May 2024 09:38:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-09 13:35:11.513106
- Title: Guiding adaptive shrinkage by co-data to improve regression-based prediction and feature selection
- Title(参考訳): 回帰に基づく予測と特徴選択を改善するコデータによる適応縮小の誘導
- Authors: Mark A. van de Wiel, Wessel N. van Wieringen,
- Abstract要約: 特徴の相補的データである「コデータ」が結果を改善することは広く認識されている。
このようなコデータは、公開リポジトリが利用できるため、ゲノム設定においてユビキタスである。
本稿では,コデータを用いた回帰学習者のクラスである適応縮小法について概説する。
- 参考スコア(独自算出の注目度): 0.3867363075280544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The high dimensional nature of genomics data complicates feature selection, in particular in low sample size studies - not uncommon in clinical prediction settings. It is widely recognized that complementary data on the features, `co-data', may improve results. Examples are prior feature groups or p-values from a related study. Such co-data are ubiquitous in genomics settings due to the availability of public repositories. Yet, the uptake of learning methods that structurally use such co-data is limited. We review guided adaptive shrinkage methods: a class of regression-based learners that use co-data to adapt the shrinkage parameters, crucial for the performance of those learners. We discuss technical aspects, but also the applicability in terms of types of co-data that can be handled. This class of methods is contrasted with several others. In particular, group-adaptive shrinkage is compared with the better-known sparse group-lasso by evaluating feature selection. Finally, we demonstrate the versatility of the guided shrinkage methodology by showing how to `do-it-yourself': we integrate implementations of a co-data learner and the spike-and-slab prior for the purpose of improving feature selection in genetics studies.
- Abstract(参考訳): ゲノムデータの高次元的性質は、特に低サンプルサイズの研究において特徴選択を複雑にし、臨床予測設定では珍しくない。
特徴の補完データである‘co-data’が結果を改善することは広く認識されている。
例えば、関連する研究の前の特徴群やp値がある。
このようなコデータは、公開リポジトリが利用できるため、ゲノム設定においてユビキタスである。
しかし,このようなデータ構造を用いた学習手法の習得は限られている。
本稿では,適応型縮小法について概説する:回帰型学習者のクラスで,コデータを用いて縮小パラメータを適応し,それらの学習者のパフォーマンスに欠かせない手法である。
技術的側面だけでなく、扱うことのできるコデータの種類についても適用性についても論じる。
この手法は他のいくつかの方法と対比される。
特に,群適応縮小は,特徴選択を評価することにより,よく知られたスパース群ラッソと比較される。
最後に、遺伝的研究における特徴選択の改善を目的として、共用データ学習者とスパイク・アンド・スラブの実装を統合した「do-it-yourself」の方法を示すことによって、ガイド付き縮小手法の汎用性を実証する。
関連論文リスト
- IGANN Sparse: Bridging Sparsity and Interpretability with Non-linear Insight [4.010646933005848]
IGANN Sparseは、一般化された加法モデルのファミリーから生まれた、新しい機械学習モデルである。
トレーニング中の非線形特徴選択プロセスを通じて、スパシティを促進する。
これにより、予測性能を犠牲にすることなく、モデル空間の改善による解釈可能性を保証する。
論文 参考訳(メタデータ) (2024-03-17T22:44:36Z) - Experiment Planning with Function Approximation [49.50254688629728]
本研究では,文脈的帯域幅問題における関数近似を用いた実験計画の問題点について検討する。
本稿では,関数近似に適合する2つの実験計画戦略を提案する。
そこで, 均一サンプリング器は, 動作数が少ない設定において, 競合最適性を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-10T14:40:23Z) - Active Learning in Genetic Programming: Guiding Efficient Data
Collection for Symbolic Regression [2.4633342801625213]
本稿では,遺伝的プログラミングにおける能動的学習のための不確実性と多様性の計算方法について検討する。
遺伝的プログラミングにおけるモデル個体群は、不確実性指標と組み合わせたモデルアンサンブルを用いて、情報的訓練データポイントを選択するために利用することができることがわかった。
論文 参考訳(メタデータ) (2023-07-31T14:37:20Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Intra-class Adaptive Augmentation with Neighbor Correction for Deep
Metric Learning [99.14132861655223]
深層学習のためのクラス内適応拡張(IAA)フレームワークを提案する。
クラスごとのクラス内変動を合理的に推定し, 適応型合成試料を生成し, 硬質試料の採掘を支援する。
本手法は,検索性能の最先端手法を3%~6%向上させる。
論文 参考訳(メタデータ) (2022-11-29T14:52:38Z) - Feature Weaken: Vicinal Data Augmentation for Classification [1.7013938542585925]
モデルトレーニングと同一のコサイン類似性を持つビジナルデータ分布を構築するためにFeature Weakenを用いている。
この研究は、モデルの分類性能と一般化を改善するだけでなく、モデルの訓練を安定させ、モデルの収束を加速させる。
論文 参考訳(メタデータ) (2022-11-20T11:00:23Z) - Parallel feature selection based on the trace ratio criterion [4.30274561163157]
本研究は,PFSTを用いた並列特徴選択という,新しい並列特徴選択手法を提案する。
提案手法は,Fisher's Discriminant Analysisで用いられるクラス分離性の尺度であるトレース基準を用いて特徴的有用性を評価する。
実験により,本手法は,比較対象の他の手法による時間的差のごく一部で,少数の特徴セットを生成できることが確認された。
論文 参考訳(メタデータ) (2022-03-03T10:50:33Z) - Invariance Learning in Deep Neural Networks with Differentiable Laplace
Approximations [76.82124752950148]
我々はデータ拡張を選択するための便利な勾配法を開発した。
我々はKronecker-factored Laplace近似を我々の目的とする限界確率に近似する。
論文 参考訳(メタデータ) (2022-02-22T02:51:11Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Flexible co-data learning for high-dimensional prediction [0.0]
データが高次元である場合、臨床予測は難しいが、ドメイン知識のような追加情報は、予測を改善するのに役立つかもしれない。
提案手法は,複数データソースを多種多様なデータソースに利用して予測を改善する。
がんゲノム学の2つの応用でこれを実証し、他の高密度および同相の予後モデルの性能を向上させる可能性があることを示す。
論文 参考訳(メタデータ) (2020-05-08T13:04:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。