論文の概要: Feature Selection via the Intervened Interpolative Decomposition and its
Application in Diversifying Quantitative Strategies
- arxiv url: http://arxiv.org/abs/2209.14532v1
- Date: Thu, 29 Sep 2022 03:36:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 18:15:21.071414
- Title: Feature Selection via the Intervened Interpolative Decomposition and its
Application in Diversifying Quantitative Strategies
- Title(参考訳): 補間補間分解による特徴選択と定量戦略の多様化への応用
- Authors: Jun Lu, Joerg Osterrieder
- Abstract要約: 本稿では,観測行列の各列がそれぞれの優先度や重要性を持つ補間分解(ID)を計算するための確率論的モデルを提案する。
提案したモデルを,中国A株10株を含む実世界のデータセット上で評価した。
- 参考スコア(独自算出の注目度): 4.913248451323163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose a probabilistic model for computing an
interpolative decomposition (ID) in which each column of the observed matrix
has its own priority or importance, so that the end result of the decomposition
finds a set of features that are representative of the entire set of features,
and the selected features also have higher priority than others. This approach
is commonly used for low-rank approximation, feature selection, and extracting
hidden patterns in data, where the matrix factors are latent variables
associated with each data dimension. Gibbs sampling for Bayesian inference is
applied to carry out the optimization. We evaluate the proposed models on
real-world datasets, including ten Chinese A-share stocks, and demonstrate that
the proposed Bayesian ID algorithm with intervention (IID) produces comparable
reconstructive errors to existing Bayesian ID algorithms while selecting
features with higher scores or priority.
- Abstract(参考訳): 本稿では,観測行列の各列の優先度や重要性がそれぞれ異なる補間分解(interpolative decomposition, id)を計算する確率モデルを提案する。
このアプローチは、低ランク近似、特徴選択、データ内の隠れパターンの抽出によく使われ、行列因子は各データ次元に関連づけられた潜在変数である。
ベイズ推定のためのギブサンプリングを適用して最適化を行う。
本研究では,中国のaシェア株10株を含む実世界のデータセットにおける提案モデルを評価し,提案するベイズidアルゴリズム(iid)が既存のベイズidアルゴリズムと同等の再構成誤差を発生させ,スコアや優先度の高い特徴を選択できることを示す。
関連論文リスト
- Bayesian Estimation and Tuning-Free Rank Detection for Probability Mass Function Tensors [17.640500920466984]
本稿では,関節のPMFを推定し,そのランクを観測データから自動的に推定する新しい枠組みを提案する。
我々は、様々なモデルパラメータの後方分布を近似するために、変分推論(VI)に基づく決定論的解を導出し、さらに、変分推論(SVI)を利用して、VVIベースのアプローチのスケーラブルバージョンを開発する。
合成データと実映画レコメンデーションデータの両方を含む実験は、推定精度、自動ランク検出、計算効率の点で、VVIおよびSVIベースの手法の利点を示している。
論文 参考訳(メタデータ) (2024-10-08T20:07:49Z) - Enhancing Neural Subset Selection: Integrating Background Information into Set Representations [53.15923939406772]
対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。
これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
論文 参考訳(メタデータ) (2024-02-05T16:09:35Z) - Regression with Label Differential Privacy [64.21020761920322]
与えられた回帰損失関数の下で最適なラベルDPランダム化機構を導出する。
我々は、最適メカニズムが「ビンのランダム化応答」の形をとることを証明した。
論文 参考訳(メタデータ) (2022-12-12T17:41:32Z) - Comparative Study of Inference Methods for Interpolative Decomposition [4.913248451323163]
補間分解(ID)学習のための自動関係決定(ARD)を用いた確率モデルを提案する。
CCLE $EC50$, CCLE $IC50$, Gene Body Methylation, promoteder Methylation datasets with different size, and dimensions。
論文 参考訳(メタデータ) (2022-06-29T11:37:05Z) - Bayesian Low-Rank Interpolative Decomposition for Complex Datasets [4.913248451323163]
本稿では,特徴選択,低ランク近似,データ中の隠れパターンの同定によく用いられる補間分解(ID)の確率モデルを提案する。
我々は,CCLE EC50,CCLE IC50,CTRP EC50,MovieLens 100Kデータセットなど,さまざまな実世界のデータセット上でモデルを評価した。
論文 参考訳(メタデータ) (2022-05-30T03:06:48Z) - Towards Deterministic Diverse Subset Sampling [14.236193187116049]
本稿では,k-DPPのグリーディ決定論的適応について論じる。
画像検索作業におけるモデルの有用性を示す。
論文 参考訳(メタデータ) (2021-05-28T16:05:58Z) - Auto-weighted Multi-view Feature Selection with Graph Optimization [90.26124046530319]
グラフ学習に基づく新しい教師なしマルチビュー特徴選択モデルを提案する。
1) 特徴選択過程において, 異なる視点で共有されたコンセンサス類似度グラフが学習される。
各種データセットを用いた実験により,提案手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-11T03:25:25Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Information-theoretic Feature Selection via Tensor Decomposition and
Submodularity [38.05393186002834]
本稿では,全ての変数の結合PMFの低ランクテンソルモデルを導入し,複雑性を緩和し,与えられた特徴量の分類性能を最大化する手法として間接的ターゲットを提案する。
原目標変数の代わりにネイブベイズモデルの潜伏変数を間接的に予測することにより、濃度制約を受ける単調部分モジュラ函数として特徴選択問題を定式化することができる。
論文 参考訳(メタデータ) (2020-10-30T10:36:46Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。