論文の概要: An Efficient Data Analysis Method for Big Data using Multiple-Model
Linear Regression
- arxiv url: http://arxiv.org/abs/2308.12691v1
- Date: Thu, 24 Aug 2023 10:20:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-25 14:26:31.518348
- Title: An Efficient Data Analysis Method for Big Data using Multiple-Model
Linear Regression
- Title(参考訳): 多モデル線形回帰を用いたビッグデータの効率的なデータ解析法
- Authors: Bohan Lyu and Jianzhong Li
- Abstract要約: 本稿では,Multiple Model linear regression (MMLR) と呼ばれる新たに定義された回帰モデルを用いて,ビッグデータの新しいデータ解析手法を提案する。
提案手法は,他の回帰法よりも効率的かつ柔軟であることが示されている。
- 参考スコア(独自算出の注目度): 4.085654010023149
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a new data analysis method for big data using a newly
defined regression model named multiple model linear regression(MMLR), which
separates input datasets into subsets and construct local linear regression
models of them. The proposed data analysis method is shown to be more efficient
and flexible than other regression based methods. This paper also proposes an
approximate algorithm to construct MMLR models based on
$(\epsilon,\delta)$-estimator, and gives mathematical proofs of the correctness
and efficiency of MMLR algorithm, of which the time complexity is linear with
respect to the size of input datasets. This paper also empirically implements
the method on both synthetic and real-world datasets, the algorithm shows to
have comparable performance to existing regression methods in many cases, while
it takes almost the shortest time to provide a high prediction accuracy.
- Abstract(参考訳): 本稿では,入力データセットをサブセットに分離し,その局所線形回帰モデルを構築するmultiple model linear regression(mmlr)という,新たに定義された回帰モデルを用いたビッグデータデータ解析手法を提案する。
提案手法は他の回帰分析法よりも効率的で柔軟であることが示されている。
本稿ではまた,$(\epsilon,\delta)$-推定子に基づくmmlrモデルを構築する近似アルゴリズムを提案し,入力データセットのサイズに対して時間複雑性が線形であるmmlrアルゴリズムの正確性と効率を数学的に証明する。
本論文は合成データと実世界のデータの両方で実験的にこの手法を実装し、アルゴリズムは既存の回帰法に匹敵する性能を示すが、高い予測精度を提供するには最短の時間を要する。
関連論文リスト
- Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Multivariate regression modeling in integrative analysis via sparse
regularization [0.0]
統合分析は、複数の独立したデータセットから有用な情報をプールする効果的な方法である。
この積分は、変数とグループ選択を実行するスパース推定によって達成される。
提案手法の性能をモンテカルロシミュレーションおよび微生物測定による排水処理データの解析により実証した。
論文 参考訳(メタデータ) (2023-04-15T02:27:51Z) - An adaptive shortest-solution guided decimation approach to sparse
high-dimensional linear regression [2.3759847811293766]
ASSDは最短解誘導アルゴリズムから適応され、ASSDと呼ばれる。
ASSDは、実世界の応用で遭遇する高度に相関した測定行列を持つ線形回帰問題に特に適している。
論文 参考訳(メタデータ) (2022-11-28T04:29:57Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Easy Differentially Private Linear Regression [16.325734286930764]
本研究では,指数関数機構を用いて,非プライベート回帰モデルの集合からタキー深度の高いモデルを選択するアルゴリズムについて検討する。
このアルゴリズムは、データリッチな設定において、強い経験的性能を得る。
論文 参考訳(メタデータ) (2022-08-15T17:42:27Z) - Test Set Sizing Via Random Matrix Theory [91.3755431537592]
本稿ではランダム行列理論の手法を用いて、単純な線形回帰に対して理想的なトレーニング-テストデータ分割を求める。
それは「理想」を整合性計量を満たすものとして定義し、すなわち経験的モデル誤差は実際の測定ノイズである。
本論文は,任意のモデルのトレーニングとテストサイズを,真に最適な方法で解決した最初の論文である。
論文 参考訳(メタデータ) (2021-12-11T13:18:33Z) - Evaluation of Tree Based Regression over Multiple Linear Regression for
Non-normally Distributed Data in Battery Performance [0.5735035463793008]
本研究では,機械学習モデル構築におけるデータ正規性の影響について検討する。
木に基づく回帰モデルと複数の線形回帰モデルは、それぞれ高度に歪んだ非正規データセットから構築される。
論文 参考訳(メタデータ) (2021-11-03T20:28:24Z) - Piecewise linear regression and classification [0.20305676256390928]
本稿では,線形予測器を用いた多変量回帰と分類問題の解法を提案する。
本論文で記述されたアルゴリズムのpython実装は、http://cse.lab.imtlucca.it/bemporad/parcで利用可能である。
論文 参考訳(メタデータ) (2021-03-10T17:07:57Z) - A Hypergradient Approach to Robust Regression without Correspondence [85.49775273716503]
本稿では,入力データと出力データとの対応が不十分な回帰問題について考察する。
ほとんどの既存手法はサンプルサイズが小さい場合にのみ適用できる。
シャッフル回帰問題に対する新しい計算フレームワークであるROBOTを提案する。
論文 参考訳(メタデータ) (2020-11-30T21:47:38Z) - Generalized Matrix Factorization: efficient algorithms for fitting
generalized linear latent variable models to large data arrays [62.997667081978825]
一般化線形潜在変数モデル(GLLVM)は、そのような因子モデルを非ガウス応答に一般化する。
GLLVMのモデルパラメータを推定する現在のアルゴリズムは、集約的な計算を必要とし、大規模なデータセットにスケールしない。
本稿では,GLLVMを高次元データセットに適用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-06T04:28:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。