論文の概要: ProbTest: Unit Testing for Probabilistic Programs (Extended Version)
- arxiv url: http://arxiv.org/abs/2509.02012v1
- Date: Tue, 02 Sep 2025 06:59:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.929845
- Title: ProbTest: Unit Testing for Probabilistic Programs (Extended Version)
- Title(参考訳): ProbTest: 確率的プログラムのためのユニットテスト(拡張バージョン)
- Authors: Katrine Christensen, Mahsa Varshosaz, Raúl Pardo,
- Abstract要約: 本研究では,確率的プログラムの結果をテストするための新しいブラックボックス単体テスト手法ProbTestを提案する。
我々は、pythonプログラム用のよく知られたユニットテストツールであるPyTest用のプラグインを実装している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Testing probabilistic programs is non-trivial due to their stochastic nature. Given an input, the program may produce different outcomes depending on the underlying stochastic choices in the program. This means testing the expected outcomes of probabilistic programs requires repeated test executions unlike deterministic programs where a single execution may suffice for each test input. This raises the following question: how many times should we run a probabilistic program to effectively test it? This work proposes a novel black-box unit testing method, ProbTest, for testing the outcomes of probabilistic programs. Our method is founded on the theory surrounding a well-known combinatorial problem, the coupon collector's problem. Using this method, developers can write unit tests as usual without extra effort while the number of required test executions is determined automatically with statistical guarantees for the results. We implement ProbTest as a plug-in for PyTest, a well-known unit testing tool for python programs. Using this plug-in, developers can write unit tests similar to any other Python program and the necessary test executions are handled automatically. We evaluate the method on case studies from the Gymnasium reinforcement learning library and a randomized data structure.
- Abstract(参考訳): 確率的プログラムのテストは確率的な性質のため、簡単ではない。
入力が与えられた場合、プログラムはプログラムの基盤となる確率的選択によって異なる結果を生成する。
これは、確率的プログラムの期待される結果をテストするには、各テスト入力に対してひとつの実行が十分である決定論的プログラムとは異なり、繰り返しテストを実行する必要があることを意味する。
効果的にテストするための確率的プログラムを何回実行すべきなのか?
本研究では,確率的プログラムの結果をテストするための新しいブラックボックス単体テスト手法ProbTestを提案する。
本手法は,クーポンコレクター問題という,よく知られた組合せ問題を取り巻く理論に基づいている。
この方法を使うと、開発者は余分な労力を要さずに単体テストを書くことができ、必要なテストの実行回数は結果の統計的保証とともに自動的に決定される。
私たちは、pythonプログラム用のよく知られたユニットテストツールであるPyTestのプラグインとしてProbTestを実装しました。
このプラグインを使うことで、開発者は他のPythonプログラムと同様の単体テストを書くことができ、必要なテスト実行は自動的に処理される。
本稿では,ギムナシウム強化学習ライブラリとランダム化データ構造からケーススタディを評価する。
関連論文リスト
- Bounding Random Test Set Size with Computational Learning Theory [0.2999888908665658]
私たちは、この質問に答えるための確率論的アプローチが、テストコンテキストにどのように適用できるかを示します。
私たちは、ソースコードのカバレッジターゲットの数だけを知ることで、これを最初に実現しています。
大規模なJavaユニットと自律運転システムで、この境界を検証します。
論文 参考訳(メタデータ) (2024-05-27T10:15:16Z) - Fine-Grained Assertion-Based Test Selection [6.9290255098776425]
回帰テスト選択技術は、コードの変更によって影響を受けるテストのみを選択することで、テスト実行時間を短縮することを目的としている。
既存のテクニックでは、テストクラスのような粗い粒度のテストエンティティを選択しており、不正確なテストの選択や影響のないテストの実行を引き起こす。
本稿では,文レベルでのテストコードを分析し,テストアサーションを選択の単位として扱うことによって,選択精度を高める新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-24T04:07:30Z) - FlaPy: Mining Flaky Python Tests at Scale [14.609208863749831]
FlaPyは、研究者がテストスイートを再実行することによって、与えられた、あるいは自動的にサンプルされたPythonプロジェクトの集合で、不安定なテストをマイニングするためのフレームワークである。
FlaPyはコンテナ化と新しい実行環境を使用してテスト実行を分離し、実際のCI条件をシミュレートする。
FlaPyはSLURMを使ってテスト実行の並列化をサポートしており、数千のプロジェクトをスキャンしてテストのフレキネスをスキャンすることができる。
論文 参考訳(メタデータ) (2023-05-08T15:48:57Z) - Fault-Aware Neural Code Rankers [64.41888054066861]
サンプルプログラムの正しさを予測できる故障認識型ニューラルネットワークローダを提案する。
我々のフォールト・アウェア・ローダは、様々なコード生成モデルのpass@1精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-06-04T22:01:05Z) - Exact Paired-Permutation Testing for Structured Test Statistics [67.71280539312536]
構造化されたテスト統計群のペア置換テストに対して,効率的な正確なアルゴリズムを提案する。
我々の正確なアルゴリズムはモンテカルロ近似よりも10ドル速く、共通のデータセットに20000ドルのサンプルがある。
論文 参考訳(メタデータ) (2022-05-03T11:00:59Z) - Automated Support for Unit Test Generation: A Tutorial Book Chapter [21.716667622896193]
単体テストは、システムの他の部分と独立してテストできる最小のコードセグメントをテストする段階である。
単体テストは通常実行可能なコードとして書かれ、Pythonのpytestのような単体テストフレームワークが提供する形式で書かれる。
本章では,検索に基づく単体テスト生成の概念を紹介する。
論文 参考訳(メタデータ) (2021-10-26T11:13:40Z) - Group Testing with Non-identical Infection Probabilities [59.96266198512243]
そこで我々は,集合形成法を用いた適応型グループテストアルゴリズムを開発した。
提案アルゴリズムは, エントロピー下界に近い性能を示す。
論文 参考訳(メタデータ) (2021-08-27T17:53:25Z) - Test-Agnostic Long-Tailed Recognition by Test-Time Aggregating Diverse
Experts with Self-Supervision [85.07855130048951]
本研究では,テスト非依存型ロングテール認識(test-agnostic long-tailed recognition)と呼ばれる,より実践的なタスク設定について検討する。
本稿では,多種多様な専門家に異なるテスト分布を扱うように訓練するTADE(Test-time Aggregating Diverse Experts)と呼ばれる新しい手法を提案する。
理論的には,提案手法は未知のテストクラス分布をシミュレートできることを示す。
論文 参考訳(メタデータ) (2021-07-20T04:10:31Z) - Optimal Testing of Discrete Distributions with High Probability [49.19942805582874]
高確率状態に着目して離散分布を試験する問題について検討する。
一定の要素でサンプル最適である近接性および独立性テストのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-14T16:09:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。