論文の概要: Etna: An Evaluation Platform for Property-Based Testing
- arxiv url: http://arxiv.org/abs/2603.27002v1
- Date: Fri, 27 Mar 2026 21:24:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.731385
- Title: Etna: An Evaluation Platform for Property-Based Testing
- Title(参考訳): Etna: プロパティベースのテストのための評価プラットフォーム
- Authors: Alperen Keles, Jessica Shi, Nikhil Kamath, Tin Nam Liu, Ceren Mert, Harrison Goldstein, Benjamin C. Pierce, Leonidas Lampropoulos,
- Abstract要約: PBT手法の実証的評価と比較のためのプラットフォームであるETNAを提案する。
ETNAを使って、Rocq、Haskell、OCaml、Racket、Rustで人気のあるPBTアプローチの実験を行います。
- 参考スコア(独自算出の注目度): 2.681337160999227
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Property-based testing is a mainstay of functional programming, boasting a rich literature, an enthusiastic user community, and an abundance of tools~ -- so many, indeed, that new users may have difficulty choosing. Moreover, any given framework may support a variety of strategies for generating test inputs; even experienced users may wonder which are better in any given situation. Sadly, the PBT literature, though long on creativity, is short on rigorous comparisons to help answer such questions. We present ETNA, a platform for empirical evaluation and comparison of PBT techniques. ETNA incorporates a number of popular PBT frameworks and testing workloads from the literature, and its extensible architecture makes adding new ones easy, while handling the technical drudgery of performance measurement. To illustrate its benefits, we use ETNA to carry out several experiments with popular PBT approaches in Rocq, Haskell, OCaml, Racket, and Rust, allowing users to more clearly understand best practices and tradeoffs.
- Abstract(参考訳): プロパティベースのテストは関数型プログラミングの主要な柱であり、豊富な文献、熱心なユーザコミュニティ、そして豊富なツールを誇っている。
さらに、どのようなフレームワークでも、テストインプットを生成するためのさまざまな戦略をサポートすることができる。
残念ながら、PBTの文献は創造性に長けているが、そのような質問に答えるために厳格な比較に乏しい。
PBT手法の実証的評価と比較のためのプラットフォームであるETNAを提案する。
ETNAには、文献から人気のPBTフレームワークやテストワークロードが数多く含まれており、その拡張可能なアーキテクチャにより、パフォーマンス測定の技術的負債を処理しながら、新しいものを簡単に追加できる。
そのメリットを説明するために、ETNAを使用して、Rocq、Haskell、OCaml、Racket、Rustで人気のあるPBTアプローチを使ったいくつかの実験を実施しました。
関連論文リスト
- Programmable Property-Based Testing [1.0276024900942875]
遅延バインディング抽象構文(deferred binding abstract syntax)と呼ぶ混合埋め込みに基づく、より深いプロパティのための新しい言語を提案する。
私たちはこの言語をRocqとRacketで実装し、依存型と動的型のパワーを活用しています。
論文 参考訳(メタデータ) (2026-02-20T16:52:03Z) - Exploring Recommender System Evaluation: A Multi-Modal User Agent Framework for A/B Testing [54.456400601801704]
A/Bテストのためのマルチモーダルユーザエージェント(A/Bエージェント)を提案する。
具体的には、A/Bテストのためのレコメンデーションサンドボックス環境を構築し、マルチモーダルおよびマルチページインタラクションを実現する。
モデル,データ,機能という3つの観点から,従来のA/Bテストに代わるエージェントの可能性を検証する。
論文 参考訳(メタデータ) (2026-01-08T03:33:43Z) - BPL: Bias-adaptive Preference Distillation Learning for Recommender System [61.916973366625285]
本稿では,BPL(Bias-Adaptive Preference distillation Learning)と呼ばれる新たな学習フレームワークを導入し,ユーザの嗜好を徐々に明らかにする。
BPLは、収集したフィードバックに合わせた正確な好みの知識を保持し、実際のテストで高いパフォーマンスをもたらす。
信頼性フィルタリングによる自己蒸留により、BPLはトレーニングプロセスを通してその知識を反復的に洗練する。
論文 参考訳(メタデータ) (2025-10-17T11:09:04Z) - Benchmarking Predictive Coding Networks -- Made Simple [48.652114040426625]
機械学習における予測符号化ネットワーク(PCN)の効率性とスケーラビリティの問題に取り組む。
そこで我々は,PCXと呼ばれる,パフォーマンスと簡易性を重視したライブラリを提案する。
我々は,PCNの既存アルゴリズムと,生物工学的な深層学習コミュニティで普及している他の手法を併用して,このようなベンチマークを広範囲に実施する。
論文 参考訳(メタデータ) (2024-07-01T10:33:44Z) - COTS: Connected OpenAPI Test Synthesis for RESTful Applications [0.0]
OpenAPI仕様のための(i)ドメイン固有言語を導入し、(ii)方法論をサポートするツールを導入します。
私たちのツールはCOTSと呼ばれ、(ランダムに)モデルベースのテスト実行を生成し、ソフトウェア欠陥を報告します。
論文 参考訳(メタデータ) (2024-04-30T15:12:31Z) - An Experimental Design Framework for Label-Efficient Supervised Finetuning of Large Language Models [55.01592097059969]
命令データセットの監視された微調整は、目覚ましいゼロショットの一般化能力を達成する上で重要な役割を担っている。
アクティブラーニングは、未ラベルのプールからアノテートするサンプルの有用なサブセットを特定するのに効果的である。
本研究では,能動学習の計算ボトルネックを回避するための実験設計を提案する。
論文 参考訳(メタデータ) (2024-01-12T16:56:54Z) - AXNav: Replaying Accessibility Tests from Natural Language [14.131076040673351]
大規模言語モデル(LLM)は、UIの自動化を含む様々なタスクに使用されている。
本稿では,自然言語ベースのアクセシビリティテストワークフローの要件について検討する。
手動アクセシビリティテスト(例えばVoiceOver''のショー検索)を入力として、LLMとピクセルベースのUI理解モデルを組み合わせてテストを実行するシステムを構築します。
論文 参考訳(メタデータ) (2023-10-03T20:37:58Z) - Can Large Language Models Write Good Property-Based Tests? [5.671039991090038]
プロパティベースのテスト(PBT)は、現実世界のソフトウェアではいまだにあまり使われていない。
2つのプロンプト手法を用いて,近代言語モデルを用いてPSTを自動的に合成する。
最適なモデルとプロンプトアプローチにより,有効かつ健全なPBTを平均2.4サンプルで合成できることが判明した。
論文 参考訳(メタデータ) (2023-07-10T05:09:33Z) - Dynamic Causal Effects Evaluation in A/B Testing with a Reinforcement
Learning Framework [68.96770035057716]
A/Bテスト(A/B Testing)は、新しい製品を製薬、技術、伝統産業の古い製品と比較するビジネス戦略である。
本稿では,オンライン実験においてA/Bテストを実施するための強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-05T10:25:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。