Fugu-MT 論文翻訳(概要): Tuning Random Generators: Property-Based Testing as Probabilistic Programming

論文の概要: Tuning Random Generators: Property-Based Testing as Probabilistic Programming

arxiv url: http://arxiv.org/abs/2508.14394v1
Date: Wed, 20 Aug 2025 03:45:13 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-21 16:52:41.330857
Title: Tuning Random Generators: Property-Based Testing as Probabilistic Programming
Title（参考訳）: ランダムジェネレータのチューニング:確率的プログラミングとしてのプロパティベースのテスト
Authors: Ryan Tjoa, Poorva Garg, Harrison Goldstein, Todd Millstein, Benjamin Pierce, Guy Van den Broeck,
Abstract要約: プロパティベースのテスト(PBT)は、ランダムに生成された入力に基づいてソフトウェアを評価することで、実行可能な仕様に対してソフトウェアを検証する。 PBTユーザがテストインプットを生成する標準的な方法は、ランダムな選択を通じてテストインプットをサンプルする方法を記述するジェネレータ経由である。発電機の自動およびオフラインチューニングのための技術を開発する。
参考スコア（独自算出の注目度）: 19.843056237039516
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Property-based testing validates software against an executable specification by evaluating it on randomly generated inputs. The standard way that PBT users generate test inputs is via generators that describe how to sample test inputs through random choices. To achieve a good distribution over test inputs, users must tune their generators, i.e., decide on the weights of these individual random choices. Unfortunately, it is very difficult to understand how to choose individual generator weights in order to achieve a desired distribution, so today this process is tedious and limits the distributions that can be practically achieved. In this paper, we develop techniques for the automatic and offline tuning of generators. Given a generator with undetermined symbolic weights and an objective function, our approach automatically learns values for these weights that optimize for the objective. We describe useful objective functions that allow users to (1) target desired distributions and (2) improve the diversity and validity of their test cases. We have implemented our approach in a novel discrete probabilistic programming system, Loaded Dice, that supports differentiation and parameter learning, and use it as a language for generators. We empirically demonstrate that our approach is effective at optimizing generator distributions according to the specified objective functions. We also perform a thorough evaluation on PBT benchmarks, demonstrating that, when automatically tuned for diversity and validity, the generators exhibit a 3.1-7.4x speedup in bug finding.
Abstract（参考訳）: プロパティベースのテストは、ランダムに生成された入力でソフトウェアを評価することで、実行可能な仕様に対してソフトウェアを検証する。 PBTユーザがテストインプットを生成する標準的な方法は、ランダムな選択を通じてテストインプットをサンプルする方法を記述するジェネレータ経由である。テスト入力に対する優れた分布を達成するには、ユーザーはジェネレータを調整し、すなわち、これらの個々のランダム選択の重みを決定する必要がある。残念ながら、所望の分布を達成するために個々の発電機の重量をどうやって選ぶかを理解することは非常に困難であり、今日ではこのプロセスは面倒であり、実際に達成できる分布を制限している。本稿では,ジェネレータの自動およびオフラインチューニング技術を開発する。非決定的な記号的重みと目的関数を持つジェネレータが与えられた場合、本手法は目的のために最適化されたこれらの重みの値を自動的に学習する。本稿では,(1)所望の分布を目標とし,(2)テストケースの多様性と妥当性を向上させるための有用な目的関数について述べる。我々は、微分とパラメータ学習をサポートする新しい離散確率的プログラミングシステムであるLoaded Diceにアプローチを実装し、ジェネレータの言語として利用した。提案手法は, 対象関数に応じて生成元分布の最適化に有効であることを示す。 PBTベンチマークの徹底的な評価を行い、多様性と妥当性を自動調整すると、ジェネレータはバグ発見において3.1-7.4倍のスピードアップを示すことを示した。

関連論文リスト

$V_1$: Unifying Generation and Self-Verification for Parallel Reasoners [69.66089681814013]
$V_$は、効率的なペアワイドランキングを通じて生成と検証を統合するフレームワークである。 V_$-Inferはポイントワイド検証でPass@1を最大10%改善する。 V_$-PairRLは、標準のRLとポイントワイドのジョイントトレーニングよりも、テストタイムのスケーリングが7ドル--9%で向上する。
論文参考訳（メタデータ） (2026-03-04T17:22:16Z)
Scaling Agentic Verifier for Competitive Coding [66.11758166379092]
大規模言語モデル(LLM)は強力なコーディング能力を示しているが、1回の試行で競合するプログラミング問題を正しく解くのに苦戦している。実行ベースの再ランク付けは、有望なテスト時間スケーリング戦略を提供するが、既存のメソッドは、難しいテストケースの生成または非効率的なランダム入力サンプリングによって制約される。本稿では,プログラムの動作を積極的に推論し,高い差別性のあるテスト入力を検索するエージェント検証手法を提案する。
論文参考訳（メタデータ） (2026-02-04T06:30:40Z)
How to Select Datapoints for Efficient Human Evaluation of NLG Models? [57.60407340254572]
我々は,人間の評価に最も有用なデータポイントを得るために,セレクタスイートを開発し,分析する。本研究では,自動測定値の分散に基づくセレクタ,モデル出力の多様性,項目応答理論がランダム選択より優れていることを示す。特に,情報源に基づく推定手法を導入し,情報源のテキストに基づいて人体評価に有用な項目を推定する。
論文参考訳（メタデータ） (2025-01-30T10:33:26Z)
Learning test generators for cyber-physical systems [2.4171019220503402]
サイバー物理システムに対するブラックボックス実行時検証手法は、入力と出力が時間とともに信号として表現されるシステムにおけるエラーを発見するために用いられる。既存の方法、例えば要求のファルシフィケーションは、システム正当性に対する反例である単一の入力を見つけることに集中することが多い。テストジェネレータの作成方法を示し、単一の要件に対して、複数の多種多様な反例を生成する。
論文参考訳（メタデータ） (2024-10-04T07:34:02Z)
Test-Time Model Adaptation with Only Forward Passes [68.11784295706995]
テストタイム適応は、トレーニング済みのモデルを、潜在的に分布シフトのある未確認テストサンプルに適応させるのに有効であることが証明されている。テスト時間フォワード最適化適応法(FOA)を提案する。 FOAは量子化された8ビットのViTで動作し、32ビットのViTで勾配ベースのTENTより優れ、ImageNet-Cで最大24倍のメモリ削減を実現する。
論文参考訳（メタデータ） (2024-04-02T05:34:33Z)
A Block Metropolis-Hastings Sampler for Controllable Energy-based Text Generation [78.81021361497311]
我々は,大規模言語モデルの反復的プロンプトを通じて,各ステップにおけるシーケンス全体の書き直しを提案する新しいメトロポリス・ハスティングス(MH)サンプリング器を開発した。対象分布からより効率的かつ正確なサンプリングが可能となり, (b) 事前に固定するのではなく, サンプリング手順により生成長を決定することが可能となった。
論文参考訳（メタデータ） (2023-12-07T18:30:15Z)
Insights into Closed-form IPM-GAN Discriminator Guidance for Diffusion Modeling [11.68361062474064]
本稿では,GAN判別器がLangevinに基づくサンプリングに与える影響を理論的に解析する枠組みを提案する。提案手法は既存の加速拡散技術と組み合わせて潜在空間画像生成を改善することができることを示す。
論文参考訳（メタデータ） (2023-06-02T16:24:07Z)
A Robust Classifier Under Missing-Not-At-Random Sample Selection Bias [15.628927478079913]
統計学において、グリーンの手法は、このタイプのサンプル選択を予測モデルとしてロジスティック回帰を用いて定式化する。元のトレーニングセットを変更することでグリーンの手法を改善するアルゴリズムであるBiasCorrを提案する。グリーン法よりもバイアスの偏りを解析し,BiasCorrの改良を理論的に保証する。
論文参考訳（メタデータ） (2023-05-25T01:39:51Z)
Learning Probabilistic Models from Generator Latent Spaces with Hat EBM [81.35199221254763]
本研究では、エネルギーベースモデル(EBM)の基礎として、任意のジェネレータネットワークを使用する方法を提案する。 128x128解像度の非条件画像ネット合成,(2)既存の生成装置の出力の精細化,(3)非確率的生成装置を組み込んだ学習用EMMにおいて,提案手法の強い性能を示す。
論文参考訳（メタデータ） (2022-10-29T03:55:34Z)
Mode Penalty Generative Adversarial Network with adapted Auto-encoder [0.15229257192293197]
本稿では,事前学習した自動エンコーダと組み合わされたモードペナルティGANを提案する。提案手法をGANに適用することにより, ジェネレータの最適化がより安定し, 実験による収束が早くなることを示す。
論文参考訳（メタデータ） (2020-11-16T03:39:53Z)
Sampling-Decomposable Generative Adversarial Recommender [84.05894139540048]
サンプル分解可能な生成逆数レコメンダ(SD-GAR)を提案する。本フレームワークでは, 自己正規化重要度サンプリングにより, 生成元と最適値とのばらつきを補償する。提案アルゴリズムを5つの実世界のレコメンデーションデータセットを用いて広範囲に評価する。
論文参考訳（メタデータ） (2020-11-02T13:19:10Z)
Uncertainty Inspired RGB-D Saliency Detection [70.50583438784571]
本稿では,データラベリングプロセスから学習することで,RGB-D値検出の不確実性を利用した最初のフレームワークを提案する。そこで本研究では,確率的RGB-Dサリエンシ検出を実現するために,サリエンシデータラベリングプロセスにインスパイアされた生成アーキテクチャを提案する。 6つの挑戦的RGB-Dベンチマークデータセットの結果から,サリエンシマップの分布を学習する際のアプローチの優れた性能が示された。
論文参考訳（メタデータ） (2020-09-07T13:01:45Z)
A Search for Good Pseudo-random Number Generators : Survey and Empirical Studies [0.0]
これまで開発されたPRNGのジャンルは,線形連続生成器ベース,線形フィードバックシフトレジスタベース,セルオートマトンベースという3つのグループに分類されてきた。全体として30ドルのPRNGは、Diehardバッテリテストによるブラインド統計テスト、TestU01ライブラリのバッテリエマビット、NIST統計テストスイートの2種類の経験的テストを行う方法として選択されている。
論文参考訳（メタデータ） (2018-11-03T07:32:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。