論文の概要: Monte Carlo simulation studies on Python using the sstudy package with
SQL databases as storage
- arxiv url: http://arxiv.org/abs/2004.14479v3
- Date: Mon, 20 Jul 2020 12:49:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 06:15:49.495202
- Title: Monte Carlo simulation studies on Python using the sstudy package with
SQL databases as storage
- Title(参考訳): Monte Carlo シミュレーションによる SQL データベースをストレージとした sstudy パッケージを用いた Python のシミュレーション
- Authors: Marco H A In\'acio
- Abstract要約: sstudyは、シミュレーション研究の準備を簡単にするために設計されたPythonパッケージである。
そこで本研究では,シミュレーション研究の手順を統計的に簡潔に記述し,推定対象を簡易に説明する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Performance assessment is a key issue in the process of proposing new machine
learning/statistical estimators. A possible method to complete such task is by
using simulation studies, which can be defined as the procedure of estimating
and comparing properties (such as predictive power) of estimators (and other
statistics) by averaging over many replications given a true distribution;
i.e.: generating a dataset, fitting the estimator, calculating and storing the
predictive power, and then repeating the procedure many times and finally
averaging over the stored predictive powers. Given that, in this paper, we
present sstudy: a Python package designed to simplify the preparation of
simulation studies using SQL database engines as the storage system; more
specifically, we present its basic features, usage examples and references to
the its documentation. We also present a short statistical description of the
simulation study procedure with a simplified explanation of what is being
estimated by it, as well as some examples of applications.
- Abstract(参考訳): パフォーマンスアセスメントは、新しい機械学習/統計推定器を提案するプロセスにおける重要な問題である。
そのようなタスクを完了するための可能な方法は、真の分布が与えられた多くの複製を平均化することで、推定器(および他の統計)の特性(予測力など)を推定・比較する手順として、シミュレーション研究を用いて定義できる。
本稿では,ストレージシステムとしてsqlデータベースエンジンを用いたシミュレーション研究の簡易化を目的としたpythonパッケージであるsstudyについて述べる。
また,シミュレーション研究の手順を統計的に簡潔に記述し,それによる推定を簡易に説明するとともに,いくつかの応用例を示す。
関連論文リスト
- Simulation-based inference with the Python Package sbijax [0.7499722271664147]
sbijaxは、ニューラルネットワークベースの推論に様々な最先端のメソッドを実装するPythonパッケージである。
このパッケージはベイズ近似計算の機能を提供し、モデル診断を計算し、自動的に要約統計を推定する。
論文 参考訳(メタデータ) (2024-09-28T18:47:13Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Likelihood-based inference and forecasting for trawl processes: a
stochastic optimization approach [0.0]
実数値トロール過程を推定するための第1の可能性に基づく手法を開発した。
本稿では,新しい決定的および確率的予測手法を提案する。
トロールプロセスの大規模なクラスに適合するために使用可能なPythonライブラリをリリースしています。
論文 参考訳(メタデータ) (2023-08-30T15:37:48Z) - Learning to be a Statistician: Learned Estimator for Number of Distinct
Values [54.629042119819744]
列内の異なる値の数(NDV)を推定することは、データベースシステムにおける多くのタスクに有用である。
本研究では、ランダム(オンライン/オフライン)サンプルから正確なNDV推定を導出する方法に焦点を当てる。
教師付き学習フレームワークにおいて,NDV推定タスクを定式化し,モデルを推定対象として学習することを提案する。
論文 参考訳(メタデータ) (2022-02-06T15:42:04Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Efficient and Accurate In-Database Machine Learning with SQL Code
Generation in Python [0.0]
Jinja2のテンプレートマクロを用いたPythonのデータベース内機械学習(IDBML)の新しい手法について説明します。
提案手法は,1つのインメモリデータセットの2~3倍の精度で,現在の最先端手法(決定木とランダム林)よりも2~3%低かった。
論文 参考訳(メタデータ) (2021-04-07T16:23:19Z) - Efficient nonparametric statistical inference on population feature
importance using Shapley values [7.6146285961466]
本稿では,SPVIM(Shapley Population Variable Importance Measure)を用いた統計的推定手法を提案する。
真の SPVIM の計算複雑性は変数数とともに指数関数的に増大するが, ランダムサンプリングのみに基づく推定器を提案する。
提案手法はシミュレーションにおける有限サンプル性能が良好であり, 異なる機械学習アルゴリズムを適用した場合, ホスピタル内予測タスクでも同様の変数重要度推定が可能である。
論文 参考訳(メタデータ) (2020-06-16T19:47:11Z) - Real-Time Regression with Dividing Local Gaussian Processes [62.01822866877782]
局所ガウス過程は、ガウス過程の回帰に基づく新しい、計算効率の良いモデリング手法である。
入力空間の反復的データ駆動分割により、実際にはトレーニングポイントの総数において、サブ線形計算複雑性が達成される。
実世界のデータセットに対する数値的な評価は、予測と更新の速度だけでなく、精度の点で他の最先端手法よりも有利であることを示している。
論文 参考訳(メタデータ) (2020-06-16T18:43:31Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z) - CONSAC: Robust Multi-Model Fitting by Conditional Sample Consensus [62.86856923633923]
我々は,同じ形状の複数のパラメトリックモデルを雑音測定に適合させる頑健な推定器を提案する。
複数のモデル検出のための手作り検索戦略を利用する従来の研究とは対照的に,データから検索戦略を学習する。
探索の自己教師付き学習において,提案したアルゴリズムをマルチホログラフィー推定で評価し,最先端手法よりも優れた精度を示す。
論文 参考訳(メタデータ) (2020-01-08T17:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。