論文の概要: StatWhy: Formal Verification Tool for Statistical Hypothesis Testing Programs
- arxiv url: http://arxiv.org/abs/2405.17492v2
- Date: Fri, 01 Nov 2024 16:16:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-04 14:33:35.449362
- Title: StatWhy: Formal Verification Tool for Statistical Hypothesis Testing Programs
- Title(参考訳): 統計的仮説テストプログラムのための形式検証ツールStatWhy
- Authors: Yusuke Kawamoto, Kentaro Kobayashi, Kohei Suenaga,
- Abstract要約: 本稿では,統計的プログラムの正当性を正式に特定し,自動検証する手法を提案する。
プログラマは、統計プログラムのソースコードに、これらのメソッドの要件をアノテートする必要がある。
我々のソフトウェアツールStatWhyは、プログラマが統計手法の要件を適切に指定したかどうかを自動的にチェックする。
- 参考スコア(独自算出の注目度): 0.9886108751871757
- License:
- Abstract: Statistical methods have been widely misused and misinterpreted in various scientific fields, raising significant concerns about the integrity of scientific research. To mitigate this problem, we propose a new method for formally specifying and automatically verifying the correctness of statistical programs. In this method, programmers are required to annotate the source code of the statistical programs with the requirements for these methods. Through this annotation, they are reminded to check the requirements for statistical methods, including those that cannot be formally verified, such as the distribution of the unknown true population. Our software tool StatWhy automatically checks whether programmers have properly specified the requirements for the statistical methods, thereby identifying any missing requirements that need to be addressed. This tool is implemented using the Why3 platform to verify the correctness of OCaml programs that conduct statistical hypothesis testing. We demonstrate how StatWhy can be used to avoid common errors in various popular statistical hypothesis testing programs.
- Abstract(参考訳): 統計学的手法は様々な科学分野において広く誤用され、誤解され、科学的研究の完全性に関する重大な懸念が提起されている。
この問題を軽減するために,統計的プログラムの正当性を正式に特定し,自動検証する手法を提案する。
本手法では,プログラムのソースコードにこれらの手法の要件を付加してアノテートする必要がある。
このアノテーションを通じて、未知の真の集団の分布など、正式な検証ができないものを含む統計手法の要件を確認するよう促される。
我々のソフトウェアツールStatWhyは、プログラマが統計手法の要件を適切に指定したかどうかを自動的にチェックし、対処すべき不足要件を特定します。
このツールは、統計的仮説テストを行うOCamlプログラムの正当性を検証するために、Why3プラットフォームを用いて実装されている。
様々な統計仮説テストプログラムにおいて, StatWhyを用いて一般的な誤りを回避できることを実証する。
関連論文リスト
- Leveraging Machine Learning for Official Statistics: A Statistical Manifesto [0.0]
統計的厳密な機械学習を適用することは、公式統計生産にとって重要である。
The Total Machine Learning Error (TMLE)は、調査手法で使用されるTotal Survey Error Modelに類似したフレームワークとして提示される。
論文 参考訳(メタデータ) (2024-09-06T15:57:25Z) - Treatment of Statistical Estimation Problems in Randomized Smoothing for Adversarial Robustness [0.0]
ランダムな平滑化のための統計的推定問題について検討し,計算負担の有無を確かめる。
本稿では,標準手法と同じ統計的保証を享受する信頼度系列を用いた推定手法を提案する。
厳密な認証を行うために,Clopper-Pearson信頼区間のランダム化版を提供する。
論文 参考訳(メタデータ) (2024-06-25T14:00:55Z) - Evaluating the Effectiveness of Index-Based Treatment Allocation [42.040099398176665]
リソースが不足している場合には、リソースを誰が受け取るかを決定するためにアロケーションポリシーが必要である。
本稿では、ランダム化制御試験のデータを用いて、インデックスベースのアロケーションポリシーを評価する手法を提案する。
論文 参考訳(メタデータ) (2024-02-19T01:55:55Z) - User-defined Event Sampling and Uncertainty Quantification in Diffusion
Models for Physical Dynamical Systems [49.75149094527068]
拡散モデルを用いて予測を行い,カオス力学系に対する不確かさの定量化が可能であることを示す。
本研究では,雑音レベルが低下するにつれて真の分布に収束する条件付きスコア関数の確率的近似法を開発する。
推論時に非線形ユーザ定義イベントを条件付きでサンプリングすることができ、分布の尾部からサンプリングした場合でもデータ統計と一致させることができる。
論文 参考訳(メタデータ) (2023-06-13T03:42:03Z) - Applications of statistical causal inference in software engineering [2.969705152497174]
本稿では,統計的因果推論手法を適用したソフトウェア工学における既存の研究を概観する。
その結果,統計的因果推論手法の適用は比較的最近であり,それに対応する研究コミュニティは比較的断片的であることがわかった。
論文 参考訳(メタデータ) (2022-11-21T14:16:55Z) - Canary in a Coalmine: Better Membership Inference with Ensembled
Adversarial Queries [53.222218035435006]
私たちは、差別的で多様なクエリを最適化するために、逆ツールを使用します。
我々の改善は既存の方法よりもはるかに正確な会員推定を実現している。
論文 参考訳(メタデータ) (2022-10-19T17:46:50Z) - Deep Feature Statistics Mapping for Generalized Screen Content Image Quality Assessment [60.88265569998563]
我々は,SCIの質を効果的に決定できる指標に基づいて,SCIの統計を学習するための最初の試みを行う。
統計的偏差が品質評価に有効に活用できることを実証的に示す。
論文 参考訳(メタデータ) (2022-09-12T15:26:13Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Online Bootstrap Inference For Policy Evaluation in Reinforcement
Learning [90.59143158534849]
近年の強化学習の出現は、頑健な統計的推論手法の需要を生み出している。
オンライン学習における統計的推論の既存の方法は、独立してサンプリングされた観察を含む設定に限られる。
オンラインブートストラップは線形近似アルゴリズムにおける統計的推測のための柔軟で効率的な手法であるが、マルコフノイズを含む設定における有効性はまだ検討されていない。
論文 参考訳(メタデータ) (2021-08-08T18:26:35Z) - Efficient statistical validation with edge cases to evaluate Highly
Automated Vehicles [6.198523595657983]
自動運転車の大規模展開は、まだ解決されていない多くの安全上の課題にもかかわらず、差し迫っているようだ。
既存の標準は、検証が要求をカバーするテストケースのセットだけを必要とする決定論的プロセスに焦点を当てています。
本稿では, 自動生成テストケースを最悪のシナリオに偏り付け, システムの挙動の統計的特性を計算するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-04T04:35:22Z) - The empirical duality gap of constrained statistical learning [115.23598260228587]
本研究では,制約付き統計学習問題(制約なし版)について,ほぼ全ての現代情報処理のコアとなる研究を行った。
本稿では, 有限次元パラメータ化, サンプル平均, 双対性理論を利用して, 無限次元, 未知分布, 制約を克服する制約付き統計問題に取り組むことを提案する。
フェアラーニングアプリケーションにおいて,この制約付き定式化の有効性と有用性を示す。
論文 参考訳(メタデータ) (2020-02-12T19:12:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。