論文の概要: Monte Carlo simulation studies on Python using the sstudy package with
SQL databases as storage
- arxiv url: http://arxiv.org/abs/2004.14479v3
- Date: Mon, 20 Jul 2020 12:49:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 06:15:49.495202
- Title: Monte Carlo simulation studies on Python using the sstudy package with
SQL databases as storage
- Title(参考訳): Monte Carlo シミュレーションによる SQL データベースをストレージとした sstudy パッケージを用いた Python のシミュレーション
- Authors: Marco H A In\'acio
- Abstract要約: sstudyは、シミュレーション研究の準備を簡単にするために設計されたPythonパッケージである。
そこで本研究では,シミュレーション研究の手順を統計的に簡潔に記述し,推定対象を簡易に説明する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Performance assessment is a key issue in the process of proposing new machine
learning/statistical estimators. A possible method to complete such task is by
using simulation studies, which can be defined as the procedure of estimating
and comparing properties (such as predictive power) of estimators (and other
statistics) by averaging over many replications given a true distribution;
i.e.: generating a dataset, fitting the estimator, calculating and storing the
predictive power, and then repeating the procedure many times and finally
averaging over the stored predictive powers. Given that, in this paper, we
present sstudy: a Python package designed to simplify the preparation of
simulation studies using SQL database engines as the storage system; more
specifically, we present its basic features, usage examples and references to
the its documentation. We also present a short statistical description of the
simulation study procedure with a simplified explanation of what is being
estimated by it, as well as some examples of applications.
- Abstract(参考訳): パフォーマンスアセスメントは、新しい機械学習/統計推定器を提案するプロセスにおける重要な問題である。
そのようなタスクを完了するための可能な方法は、真の分布が与えられた多くの複製を平均化することで、推定器(および他の統計)の特性(予測力など)を推定・比較する手順として、シミュレーション研究を用いて定義できる。
本稿では,ストレージシステムとしてsqlデータベースエンジンを用いたシミュレーション研究の簡易化を目的としたpythonパッケージであるsstudyについて述べる。
また,シミュレーション研究の手順を統計的に簡潔に記述し,それによる推定を簡易に説明するとともに,いくつかの応用例を示す。
関連論文リスト
- Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:04:39Z) - Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - Simulation-based inference with the Python Package sbijax [0.7499722271664147]
sbijaxは、ニューラルネットワークベースの推論に様々な最先端のメソッドを実装するPythonパッケージである。
このパッケージはベイズ近似計算の機能を提供し、モデル診断を計算し、自動的に要約統計を推定する。
論文 参考訳(メタデータ) (2024-09-28T18:47:13Z) - Likelihood-based inference and forecasting for trawl processes: a
stochastic optimization approach [0.0]
実数値トロール過程を推定するための第1の可能性に基づく手法を開発した。
本稿では,新しい決定的および確率的予測手法を提案する。
トロールプロセスの大規模なクラスに適合するために使用可能なPythonライブラリをリリースしています。
論文 参考訳(メタデータ) (2023-08-30T15:37:48Z) - Learning to be a Statistician: Learned Estimator for Number of Distinct
Values [54.629042119819744]
列内の異なる値の数(NDV)を推定することは、データベースシステムにおける多くのタスクに有用である。
本研究では、ランダム(オンライン/オフライン)サンプルから正確なNDV推定を導出する方法に焦点を当てる。
教師付き学習フレームワークにおいて,NDV推定タスクを定式化し,モデルを推定対象として学習することを提案する。
論文 参考訳(メタデータ) (2022-02-06T15:42:04Z) - Efficient and Accurate In-Database Machine Learning with SQL Code
Generation in Python [0.0]
Jinja2のテンプレートマクロを用いたPythonのデータベース内機械学習(IDBML)の新しい手法について説明します。
提案手法は,1つのインメモリデータセットの2~3倍の精度で,現在の最先端手法(決定木とランダム林)よりも2~3%低かった。
論文 参考訳(メタデータ) (2021-04-07T16:23:19Z) - Efficient nonparametric statistical inference on population feature
importance using Shapley values [7.6146285961466]
本稿では,SPVIM(Shapley Population Variable Importance Measure)を用いた統計的推定手法を提案する。
真の SPVIM の計算複雑性は変数数とともに指数関数的に増大するが, ランダムサンプリングのみに基づく推定器を提案する。
提案手法はシミュレーションにおける有限サンプル性能が良好であり, 異なる機械学習アルゴリズムを適用した場合, ホスピタル内予測タスクでも同様の変数重要度推定が可能である。
論文 参考訳(メタデータ) (2020-06-16T19:47:11Z) - Real-Time Regression with Dividing Local Gaussian Processes [62.01822866877782]
局所ガウス過程は、ガウス過程の回帰に基づく新しい、計算効率の良いモデリング手法である。
入力空間の反復的データ駆動分割により、実際にはトレーニングポイントの総数において、サブ線形計算複雑性が達成される。
実世界のデータセットに対する数値的な評価は、予測と更新の速度だけでなく、精度の点で他の最先端手法よりも有利であることを示している。
論文 参考訳(メタデータ) (2020-06-16T18:43:31Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z) - CONSAC: Robust Multi-Model Fitting by Conditional Sample Consensus [62.86856923633923]
我々は,同じ形状の複数のパラメトリックモデルを雑音測定に適合させる頑健な推定器を提案する。
複数のモデル検出のための手作り検索戦略を利用する従来の研究とは対照的に,データから検索戦略を学習する。
探索の自己教師付き学習において,提案したアルゴリズムをマルチホログラフィー推定で評価し,最先端手法よりも優れた精度を示す。
論文 参考訳(メタデータ) (2020-01-08T17:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。