論文の概要: Sound and Relatively Complete Belief Hoare Logic for Statistical
Hypothesis Testing Programs
- arxiv url: http://arxiv.org/abs/2208.07074v1
- Date: Mon, 15 Aug 2022 08:42:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-16 13:39:55.061896
- Title: Sound and Relatively Complete Belief Hoare Logic for Statistical
Hypothesis Testing Programs
- Title(参考訳): 統計的仮説テストプログラムのための音響的および相対的完全信奉論理
- Authors: Yusuke Kawamoto, Tetsuya Sato, Kohei Suenaga
- Abstract要約: 仮説テストによって得られた統計的信念を形式化し、推論するための信念 Hoare logic (BHL) を定義した。
このプログラム論理は、仮説テストのためのクリプキモデルに対して、健全で比較的完全である。
- 参考スコア(独自算出の注目度): 1.662966122370634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a new approach to formally describing the requirement for
statistical inference and checking whether a program uses the statistical
method appropriately. Specifically, we define belief Hoare logic (BHL) for
formalizing and reasoning about the statistical beliefs acquired via hypothesis
testing. This program logic is sound and relatively complete with respect to a
Kripke model for hypothesis tests. We demonstrate by examples that BHL is
useful for reasoning about practical issues in hypothesis testing. In our
framework, we clarify the importance of prior beliefs in acquiring statistical
beliefs through hypothesis testing, and discuss the whole picture of the
justification of statistical inference inside and outside the program logic.
- Abstract(参考訳): 本稿では,統計的推論の要件を形式的に記述し,プログラムが統計的手法を適切に利用するかどうかを確認するための新しい手法を提案する。
具体的には,仮説検定によって得られた統計的信念を形式化・推論するために,信念ホーア論理(bhl)を定義する。
このプログラム論理は、仮説テストのためのクリプキモデルに対して健全で比較的完全である。
本稿では,BHLが仮説テストの実践的問題に対する推論に有用であることを実例で示す。
本稿では,仮説検定による統計的信念獲得における先行的信念の重要性を明らかにし,プログラム論理内外における統計的推論の正当化の全体像について考察する。
関連論文リスト
- Lean-STaR: Learning to Interleave Thinking and Proving [53.923617816215774]
証明の各ステップに先立って,非公式な思考を生成するために,言語モデルをトレーニングするフレームワークであるLean-STaRを紹介します。
Lean-STaRは、Lean定理証明環境内のminiF2F-testベンチマークで最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-07-14T01:43:07Z) - A Sampling-based Framework for Hypothesis Testing on Large Attributed Graphs [31.06382090300305]
本研究では,属性グラフにおけるノード,エッジ,パス仮説を定式化する。
既存の仮説に依存しないグラフサンプリング手法に対応可能な,サンプリングベースの仮説テストフレームワークを開発した。
実データを用いた実験では,提案フレームワークが一般的なグラフサンプリング手法を仮説テストに活用できることが示されている。
論文 参考訳(メタデータ) (2024-03-20T03:56:22Z) - A unified Bayesian framework for interval hypothesis testing in clinical
trials [4.911220423050305]
アメリカ統計協会(ASA)は統計学者に対して、従来のP値のみに基づいて科学的決定を行うことを警告した。
ベイズ因子に基づく試験と併用した場合, 区間零仮説の枠組みがP値の重要な問題を周航する上で有効であることを示す。
論文 参考訳(メタデータ) (2024-02-21T16:01:06Z) - A Simple Generative Model of Logical Reasoning and Statistical Learning [0.6853165736531939]
統計的学習と論理的推論は、AIの2つの主要な分野であり、人間のようなマシンインテリジェンスに統一されることが期待されている。
本稿では、論理的推論と統計的学習の単純なベイズモデルを提案する。
我々は、形式論理におけるその満足度の観点から、データがどのように象徴的知識を引き起こすかをモデル化する。
論文 参考訳(メタデータ) (2023-05-18T16:34:51Z) - Logical Satisfiability of Counterfactuals for Faithful Explanations in
NLI [60.142926537264714]
本稿では, 忠実度スルー・カウンタファクトの方法論について紹介する。
これは、説明に表される論理述語に基づいて、反実仮説を生成する。
そして、そのモデルが表現された論理と反ファクトの予測が一致しているかどうかを評価する。
論文 参考訳(メタデータ) (2022-05-25T03:40:59Z) - On the Paradox of Learning to Reason from Data [86.13662838603761]
BERTは,同じ問題空間上での他のデータ分布への一般化に失敗しながら,分布内テスト例に対してほぼ完全な精度が得られることを示す。
このパラドックスは、正しい推論関数をエミュレートする学習ではなく、論理的推論問題に本質的に存在する統計的特徴を実際に学習している。
論文 参考訳(メタデータ) (2022-05-23T17:56:48Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Observing Interventions: A logic for thinking about experiments [62.997667081978825]
本稿では,実験から学ぶ論理への第一歩について述べる。
我々のアプローチにとって重要なことは、介入の概念が(現実的または仮説的な)実験の形式的表現として使用できるという考えである。
提案された全ての論理系に対して、健全で完全な公理化を提供する。
論文 参考訳(メタデータ) (2021-11-25T09:26:45Z) - L2R2: Leveraging Ranking for Abductive Reasoning [65.40375542988416]
学習システムの帰納的推論能力を評価するために,帰納的自然言語推論タスク(alpha$NLI)を提案する。
新たな$L2R2$アプローチは、Learning-to-rankフレームワークの下で提案されている。
ARTデータセットの実験は、公開リーダボードの最先端に到達します。
論文 参考訳(メタデータ) (2020-05-22T15:01:23Z) - Witnessing Entanglement in Experiments with Correlated Noise [1.1246250197597698]
そこで我々は,各状態が任意に相関する雑音を受けることのできる目撃実験を解析するための2つの手法を提案する。
第1の方法は拒絶実験であり、実験が分離可能な状態しか生成できないという仮説を否定することで絡み合いの生成を認証する。
第2の方法は推定実験であり、平均的な目撃者値に対する信頼区間を推定し、構成する。
論文 参考訳(メタデータ) (2020-02-27T19:23:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。