論文の概要: Sparse Covariance Estimation in Logit Mixture Models
- arxiv url: http://arxiv.org/abs/2001.05034v1
- Date: Tue, 14 Jan 2020 20:19:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 13:28:32.799091
- Title: Sparse Covariance Estimation in Logit Mixture Models
- Title(参考訳): ロジット混合モデルにおけるスパース共分散推定
- Authors: Youssef M Aboutaleb, Mazen Danaf, Yifei Xie, and Moshe Ben-Akiva
- Abstract要約: 本稿では,ロジット混合モデルにおけるランダム係数のスパース共分散行列を推定するための新しいデータ駆動手法を提案する。
我々の目的は、共分散を推定する相関係数の最適部分集合を見つけることである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a new data-driven methodology for estimating sparse
covariance matrices of the random coefficients in logit mixture models.
Researchers typically specify covariance matrices in logit mixture models under
one of two extreme assumptions: either an unrestricted full covariance matrix
(allowing correlations between all random coefficients), or a restricted
diagonal matrix (allowing no correlations at all). Our objective is to find
optimal subsets of correlated coefficients for which we estimate covariances.
We propose a new estimator, called MISC, that uses a mixed-integer optimization
(MIO) program to find an optimal block diagonal structure specification for the
covariance matrix, corresponding to subsets of correlated coefficients, for any
desired sparsity level using Markov Chain Monte Carlo (MCMC) posterior draws
from the unrestricted full covariance matrix. The optimal sparsity level of the
covariance matrix is determined using out-of-sample validation. We demonstrate
the ability of MISC to correctly recover the true covariance structure from
synthetic data. In an empirical illustration using a stated preference survey
on modes of transportation, we use MISC to obtain a sparse covariance matrix
indicating how preferences for attributes are related to one another.
- Abstract(参考訳): 本稿では,ロジット混合モデルにおけるランダム係数のスパース共分散行列を推定するための新しいデータ駆動手法を提案する。
研究者はロジット混合モデルにおいて、非制限完全共分散行列(すべてのランダム係数間の相関を許す)または制限対角行列(全く相関を許さない)という2つの極端な仮定の下で共分散行列を指定するのが一般的である。
我々の目的は、共分散を推定する相関係数の最適部分集合を見つけることである。
マルコフ連鎖モンテカルロ(mcmc)を非制限完全共分散行列から後方引き出すことにより,任意の所望のスパーシティレベルに対して相関係数のサブセットに対応する共分散行列の最適ブロック対角構造仕様を求めるために,misc(mixed-integer optimization)プログラムを用いた新しい推定器を提案する。
共分散行列の最適スパーシリティレベルは、サンプル外検証を用いて決定される。
合成データから真の共分散構造を正確に復元するMISCの能力を実証する。
移動モードに関する所定の選好調査を用いた経験的な例では、miscを用いて属性の選好が相互にどのように関連しているかを示すスパース共分散行列を得る。
関連論文リスト
- Statistical Inference For Noisy Matrix Completion Incorporating Auxiliary Information [3.9748528039819977]
本稿では,半教師付きモデルにおける雑音行列補完の統計的推測について検討する。
検討した文脈において,反復最小二乗(LS)推定手法を適用した。
提案手法は数回の反復しか必要とせず、結果として得られる低ランク行列と係数行列のエントリーワイズ推定器は正規分布を持つことが保証されている。
論文 参考訳(メタデータ) (2024-03-22T01:06:36Z) - Entropic covariance models [0.7614628596146602]
共分散行列の異なる変換に対する線形制限に関する一般的な枠組みを提案する。
提案手法は凸問題を解き,$M$-estimatorを出力する。
論文 参考訳(メタデータ) (2023-06-06T11:25:05Z) - Learning Graphical Factor Models with Riemannian Optimization [70.13748170371889]
本稿では,低ランク構造制約下でのグラフ学習のためのフレキシブルなアルゴリズムフレームワークを提案する。
この問題は楕円分布のペナルティ化された最大推定値として表される。
楕円モデルによく適合する正定行列と定ランクの正半定行列のジオメトリを利用する。
論文 参考訳(メタデータ) (2022-10-21T13:19:45Z) - Equivariance Discovery by Learned Parameter-Sharing [153.41877129746223]
データから解釈可能な等価性を発見する方法について検討する。
具体的には、モデルのパラメータ共有方式に対する最適化問題として、この発見プロセスを定式化する。
また,ガウスデータの手法を理論的に解析し,研究された発見スキームとオラクルスキームの間の平均2乗ギャップを限定する。
論文 参考訳(メタデータ) (2022-04-07T17:59:19Z) - Test Set Sizing Via Random Matrix Theory [91.3755431537592]
本稿ではランダム行列理論の手法を用いて、単純な線形回帰に対して理想的なトレーニング-テストデータ分割を求める。
それは「理想」を整合性計量を満たすものとして定義し、すなわち経験的モデル誤差は実際の測定ノイズである。
本論文は,任意のモデルのトレーニングとテストサイズを,真に最適な方法で解決した最初の論文である。
論文 参考訳(メタデータ) (2021-12-11T13:18:33Z) - Optimal Clustering in Anisotropic Gaussian Mixture Models [3.5590836605011047]
異方性ガウス混合モデルに基づくクラスタリング作業について検討する。
クラスタ中心における信号対雑音比の依存性を特徴づける。
論文 参考訳(メタデータ) (2021-01-14T00:31:52Z) - Coupled regularized sample covariance matrix estimator for multiple
classes [14.41703014203756]
正規化のための2つの異なるターゲット行列を結合した多クラス問題に対する正規化SCM (RSCM) 推定器を検討する。
推定器のMSE最適チューニングパラメータを導出し,その推定法を提案する。
提案した結合RSCMのMSE性能をシミュレーションおよび実データに基づく正規化判別分析(RDA)分類で評価する。
論文 参考訳(メタデータ) (2020-11-09T10:39:53Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - Covariance Estimation for Matrix-valued Data [9.739753590548796]
本研究では,高次元行列データに対する分布自由正規化共分散推定法を提案する。
我々は、バンド可能な共分散を推定するための統一的な枠組みを定式化し、ランク1の制約のないクロネッカー積近似に基づく効率的なアルゴリズムを導入する。
格子状温度異常データセットとS&P 500ストックデータ解析によるシミュレーションと実応用を用いて,本手法の優れた有限サンプル性能を実証した。
論文 参考訳(メタデータ) (2020-04-11T02:15:26Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。