論文の概要: Mica: Automated Differential Testing for OCaml Modules
- arxiv url: http://arxiv.org/abs/2408.14561v1
- Date: Mon, 26 Aug 2024 18:22:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-28 17:40:47.435686
- Title: Mica: Automated Differential Testing for OCaml Modules
- Title(参考訳): Mica: OCamlモジュールの自動微分テスト
- Authors: Ernest Ng, Harrison Goldstein, Benjamin C. Pierce,
- Abstract要約: 我々はOCamlモジュールの観測等価性をテストするための自動ツールであるMicaを紹介する。
MicaはPPXコンパイラ拡張として実装されており、ユーザーはモジュールシグネチャに最小限のアノテーションを供給できる。
- 参考スコア(独自算出の注目度): 0.5939858158928474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Suppose we are given two OCaml modules implementing the same signature. How do we check that they are observationally equivalent -- that is, that they behave the same on all inputs? One established technique is to use a property-based testing (PBT) tool such as QuickCheck. Currently, however, this can require significant amounts of boilerplate code and ad-hoc test harnesses. To address this issue, we present Mica, an automated tool for testing observational equivalence of OCaml modules. Mica is implemented as a PPX compiler extension, allowing users to supply minimal annotations to a module signature. These annotations guide Mica to automatically derive specialized PBT code that checks observational equivalence. We discuss the design of Mica and demonstrate its efficacy as a testing tool on various modules taken from real-world OCaml libraries.
- Abstract(参考訳): 同じシグネチャを実装する2つのOCamlモジュールが与えられるとします。
それらが観察的に等価であること、つまりすべての入力で同じように振る舞うことをどうやって確認しますか?
確立されたテクニックのひとつは、QuickCheckのようなプロパティベースのテスト(PBT)ツールを使用することだ。
しかし現時点では、大量のボイラープレートコードとアドホックなテストハーネスが必要になる。
この問題に対処するため,OCamlモジュールの観測等価性をテストする自動ツールであるMicaを提案する。
MicaはPPXコンパイラ拡張として実装されており、ユーザーはモジュールシグネチャに最小限のアノテーションを供給できる。
これらのアノテーションは、ミカに観察等価性をチェックする特別なPBTコードを自動的に導出するように誘導する。
我々は,Micaの設計について論じ,実世界のOCamlライブラリから取得した様々なモジュールの試験ツールとしての有効性を実証する。
関連論文リスト
- Learning to Generate Unit Tests for Automated Debugging [52.63217175637201]
ユニットテスト(UT)は、コードの正確性を評価するだけでなく、大きな言語モデル(LLM)へのフィードバックを提供する上でも重要な役割を果たします。
提案するUTGenは,LLMに対して,予測出力とともにエラーを示す単体テスト入力を生成することを教える。
UTGenがUT生成ベースラインを7.59%向上させることを示す。
論文 参考訳(メタデータ) (2025-02-03T18:51:43Z) - Automated Test-Case Generation for REST APIs Using Model Inference Search Heuristic [15.625240669567479]
EvoMasterは進化的アルゴリズム(EA)を使用して、REST APIのテストケースを自動的に生成するツールである。
本稿では、リアルタイム自動学習を用いて自動テストケース生成プロセスのガイドを行う新しい検索(MISH)を提案する。
MISHはシステム全体の振る舞いの表現を学び、推論される経路に基づいてテストケースの適合度を定義する。
論文 参考訳(メタデータ) (2024-12-04T16:00:14Z) - Commit0: Library Generation from Scratch [77.38414688148006]
Commit0は、AIエージェントにスクラッチからライブラリを書くよう促すベンチマークである。
エージェントには、ライブラリのAPIを概説する仕様文書と、インタラクティブなユニットテストスイートが提供されている。
Commit0はまた、モデルが生成したコードに対して静的解析と実行フィードバックを受け取る、インタラクティブな環境も提供する。
論文 参考訳(メタデータ) (2024-12-02T18:11:30Z) - $\textit{X}^2$-DFD: A framework for e${X}$plainable and e${X}$tendable Deepfake Detection [52.14468236527728]
3つのコアモジュールからなる新しいフレームワークX2$-DFDを提案する。
最初のモジュールであるモデル特徴評価(MFA)は、MLLMに固有の偽機能の検出能力を計測し、これらの機能の下位ランキングを提供する。
第2のモジュールであるStrong Feature Strengthening (SFS)は、上位機能に基づいて構築されたデータセット上でMLLMを微調整することで、検出と説明機能を強化する。
第3のモジュールであるWak Feature Supplementing (WFS)は、外部専用の機能を統合することで、低階機能における微調整MLLMの機能を改善する。
論文 参考訳(メタデータ) (2024-10-08T15:28:33Z) - OpenFactCheck: A Unified Framework for Factuality Evaluation of LLMs [64.25176233153657]
OpenFactCheckは、大規模な言語モデルのためのオープンソースのファクトチェックフレームワークである。
ユーザーは自動的にファクトチェックシステムを簡単にカスタマイズできる。
また、そのシステムを用いて、入力文書におけるすべてのクレームの事実性を評価する。
論文 参考訳(メタデータ) (2024-08-06T15:49:58Z) - Type-level Property Based Testing [0.0]
本稿では,ソフトウェア仕様と依存型付けモデル,コンパイル時の実装の結合を統一する自動フレームワークを提案する。
いくつかの興味深いシステムやネットワークプロトコルをモデル化し、型チェッカーで実装が指定された動作であることを検証し、モデルが仕様のセマンティクスにマッチしていることをテストすることができます。
論文 参考訳(メタデータ) (2024-07-17T16:43:41Z) - GPT-HateCheck: Can LLMs Write Better Functional Tests for Hate Speech Detection? [50.53312866647302]
HateCheckは、合成データに対してきめ細かいモデル機能をテストするスイートである。
GPT-HateCheckは,スクラッチからより多彩で現実的な機能テストを生成するフレームワークである。
クラウドソースのアノテーションは、生成されたテストケースが高品質であることを示しています。
論文 参考訳(メタデータ) (2024-02-23T10:02:01Z) - Prompting Code Interpreter to Write Better Unit Tests on Quixbugs
Functions [0.05657375260432172]
単体テストは、ソフトウェア工学において、記述されたコードの正確性と堅牢性をテストするために一般的に使用されるアプローチである。
本研究では,コードインタプリタが生成する単体テストの品質に及ぼす異なるプロンプトの影響について検討する。
生成した単体テストの品質は、提供されたプロンプトのマイナーな詳細の変更に敏感ではないことがわかった。
論文 参考訳(メタデータ) (2023-09-30T20:36:23Z) - Less Power for More Learning: Restricting OCaml Features for Effective
Teaching [0.0]
我々は,OCamlプログラミング言語の特徴をサンドボックス化し,制限するフレームワークを提案する。
与えられたエクササイズを解決するのに使用すべきでない言語やライブラリ機能を無効にする方法を説明します。
論文 参考訳(メタデータ) (2023-09-08T07:49:40Z) - Crucible: Graphical Test Cases for Alloy Models [0.76146285961466]
この記事では、AUnitのテストケースをグラフィカルに作成できるCrucibleを紹介します。
Crucibleは、構造化された価値あるテストケースを確実に作成するために、ユーザに自動ガイダンスを提供する。
論文 参考訳(メタデータ) (2023-07-13T17:43:12Z) - Pseudo-IoU: Improving Label Assignment in Anchor-Free Object Detection [60.522877583407904]
現在のアンカーフリー物体検出器は非常に単純で有効であるが、正確なラベル割り当て方法がない。
Pseudo-Intersection-over-Union(Pseudo-IoU): アンカーフリーなオブジェクト検出フレームワークに、より標準化され、正確な割り当てルールをもたらす単純なメトリックである。
本手法はベルやホイッスルを使わずに最新のアンカーフリー手法と同等の性能を実現する。
論文 参考訳(メタデータ) (2021-04-29T02:48:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。