Fugu-MT 論文翻訳(概要): Mica: Automated Differential Testing for OCaml Modules

論文の概要: Mica: Automated Differential Testing for OCaml Modules

arxiv url: http://arxiv.org/abs/2408.14561v1
Date: Mon, 26 Aug 2024 18:22:18 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-28 17:40:47.435686
Title: Mica: Automated Differential Testing for OCaml Modules
Title（参考訳）: Mica: OCamlモジュールの自動微分テスト
Authors: Ernest Ng, Harrison Goldstein, Benjamin C. Pierce,
Abstract要約: 我々はOCamlモジュールの観測等価性をテストするための自動ツールであるMicaを紹介する。 MicaはPPXコンパイラ拡張として実装されており、ユーザーはモジュールシグネチャに最小限のアノテーションを供給できる。
参考スコア（独自算出の注目度）: 0.5939858158928474
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Suppose we are given two OCaml modules implementing the same signature. How do we check that they are observationally equivalent -- that is, that they behave the same on all inputs? One established technique is to use a property-based testing (PBT) tool such as QuickCheck. Currently, however, this can require significant amounts of boilerplate code and ad-hoc test harnesses. To address this issue, we present Mica, an automated tool for testing observational equivalence of OCaml modules. Mica is implemented as a PPX compiler extension, allowing users to supply minimal annotations to a module signature. These annotations guide Mica to automatically derive specialized PBT code that checks observational equivalence. We discuss the design of Mica and demonstrate its efficacy as a testing tool on various modules taken from real-world OCaml libraries.
Abstract（参考訳）: 同じシグネチャを実装する2つのOCamlモジュールが与えられるとします。それらが観察的に等価であること、つまりすべての入力で同じように振る舞うことをどうやって確認しますか? 確立されたテクニックのひとつは、QuickCheckのようなプロパティベースのテスト(PBT)ツールを使用することだ。しかし現時点では、大量のボイラープレートコードとアドホックなテストハーネスが必要になる。この問題に対処するため,OCamlモジュールの観測等価性をテストする自動ツールであるMicaを提案する。 MicaはPPXコンパイラ拡張として実装されており、ユーザーはモジュールシグネチャに最小限のアノテーションを供給できる。これらのアノテーションは、ミカに観察等価性をチェックする特別なPBTコードを自動的に導出するように誘導する。我々は,Micaの設計について論じ,実世界のOCamlライブラリから取得した様々なモジュールの試験ツールとしての有効性を実証する。

関連論文リスト

CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward [50.97588334916863]
評価と結果報酬のための正確で堅牢な軽量検証モデルであるCompassVerifierを開発した。数学、知識、多種多様な推論タスクにまたがる多分野の能力を示し、様々な答えの型を処理する能力を示す。我々は,複数のデータソースから収集したモデル出力からなるVerifierBenchベンチマークを導入し,メタエラーパターンを手動で解析してCompassVerifierを強化する。
論文参考訳（メタデータ） (2025-08-05T17:55:24Z)
Do AI models help produce verified bug fixes? [62.985237003585674]
大規模言語モデルは、ソフトウェアバグの修正に使用される。本稿では,プログラマが大規模言語モデルを用いて,自身のスキルを補完する方法について検討する。その結果は、プログラムバグに対する保証された修正を提供するAIとLLMの適切な役割への第一歩となる。
論文参考訳（メタデータ） (2025-07-21T17:30:16Z)
AutoRestTest: A Tool for Automated REST API Testing Using LLMs and MARL [46.65963514391019]
AutoRestTestは、Semantic Property Dependency Graph(SPDG)とMARL(Multi-Agent Reinforcement Learning)と大規模言語モデル(LLM)を統合して、効果的なREST APIテストを可能にする新しいツールである。
論文参考訳（メタデータ） (2025-01-15T05:54:33Z)
LlamaRestTest: Effective REST API Testing with Small Language Models [50.058600784556816]
LlamaRestTestは、2つのLLM(Large Language Models)を使って現実的なテストインプットを生成する新しいアプローチである。私たちは、GPTを使った仕様強化ツールであるRESTGPTなど、最先端のREST APIテストツールに対して、これを評価しています。私たちの研究は、REST APIテストにおいて、小さな言語モデルは、大きな言語モデルと同様に、あるいは、より良く機能することができることを示しています。
論文参考訳（メタデータ） (2025-01-15T05:51:20Z)
Automated Test-Case Generation for REST APIs Using Model Inference Search Heuristic [15.625240669567479]
EvoMasterは進化的アルゴリズム(EA)を使用して、REST APIのテストケースを自動的に生成するツールである。本稿では、リアルタイム自動学習を用いて自動テストケース生成プロセスのガイドを行う新しい検索(MISH)を提案する。 MISHはシステム全体の振る舞いの表現を学び、推論される経路に基づいてテストケースの適合度を定義する。
論文参考訳（メタデータ） (2024-12-04T16:00:14Z)
Commit0: Library Generation from Scratch [77.38414688148006]
Commit0は、AIエージェントにスクラッチからライブラリを書くよう促すベンチマークである。エージェントには、ライブラリのAPIを概説する仕様文書と、インタラクティブなユニットテストスイートが提供されている。 Commit0はまた、モデルが生成したコードに対して静的解析と実行フィードバックを受け取る、インタラクティブな環境も提供する。
論文参考訳（メタデータ） (2024-12-02T18:11:30Z)
$\textit{X}^2$-DFD: A framework for e${X}$plainable and e${X}$tendable Deepfake Detection [52.14468236527728]
3つのコアモジュールからなる新しいフレームワークX2$-DFDを提案する。最初のモジュールであるモデル特徴評価(MFA)は、MLLMに固有の偽機能の検出能力を計測し、これらの機能の下位ランキングを提供する。第2のモジュールであるStrong Feature Strengthening (SFS)は、上位機能に基づいて構築されたデータセット上でMLLMを微調整することで、検出と説明機能を強化する。第3のモジュールであるWak Feature Supplementing (WFS)は、外部専用の機能を統合することで、低階機能における微調整MLLMの機能を改善する。
論文参考訳（メタデータ） (2024-10-08T15:28:33Z)
OpenFactCheck: A Unified Framework for Factuality Evaluation of LLMs [64.25176233153657]
OpenFactCheckは、大規模な言語モデルのためのオープンソースのファクトチェックフレームワークである。ユーザーは自動的にファクトチェックシステムを簡単にカスタマイズできる。また、そのシステムを用いて、入力文書におけるすべてのクレームの事実性を評価する。
論文参考訳（メタデータ） (2024-08-06T15:49:58Z)
Type-level Property Based Testing [0.0]
本稿では,ソフトウェア仕様と依存型付けモデル,コンパイル時の実装の結合を統一する自動フレームワークを提案する。いくつかの興味深いシステムやネットワークプロトコルをモデル化し、型チェッカーで実装が指定された動作であることを検証し、モデルが仕様のセマンティクスにマッチしていることをテストすることができます。
論文参考訳（メタデータ） (2024-07-17T16:43:41Z)
GPT-HateCheck: Can LLMs Write Better Functional Tests for Hate Speech Detection? [50.53312866647302]
HateCheckは、合成データに対してきめ細かいモデル機能をテストするスイートである。 GPT-HateCheckは,スクラッチからより多彩で現実的な機能テストを生成するフレームワークである。クラウドソースのアノテーションは、生成されたテストケースが高品質であることを示しています。
論文参考訳（メタデータ） (2024-02-23T10:02:01Z)
GENOME: GenerativE Neuro-symbOlic visual reasoning by growing and reusing ModulEs [64.49176353858792]
本稿では,モジュールの増殖・再利用による生成的ニューロシンボリック視覚推論を提案する。提案モデルは,視覚的質問応答や表現理解の参照など,標準的なタスクに対して競合的に機能する。いくつかのトレーニング例を観察し、モジュールを再使用することで、新しい視覚的推論タスクに適応することができる。
論文参考訳（メタデータ） (2023-11-08T18:59:05Z)
Prompting Code Interpreter to Write Better Unit Tests on Quixbugs Functions [0.05657375260432172]
単体テストは、ソフトウェア工学において、記述されたコードの正確性と堅牢性をテストするために一般的に使用されるアプローチである。本研究では,コードインタプリタが生成する単体テストの品質に及ぼす異なるプロンプトの影響について検討する。生成した単体テストの品質は、提供されたプロンプトのマイナーな詳細の変更に敏感ではないことがわかった。
論文参考訳（メタデータ） (2023-09-30T20:36:23Z)
Less Power for More Learning: Restricting OCaml Features for Effective Teaching [0.0]
我々は,OCamlプログラミング言語の特徴をサンドボックス化し,制限するフレームワークを提案する。与えられたエクササイズを解決するのに使用すべきでない言語やライブラリ機能を無効にする方法を説明します。
論文参考訳（メタデータ） (2023-09-08T07:49:40Z)
Crucible: Graphical Test Cases for Alloy Models [0.76146285961466]
この記事では、AUnitのテストケースをグラフィカルに作成できるCrucibleを紹介します。 Crucibleは、構造化された価値あるテストケースを確実に作成するために、ユーザに自動ガイダンスを提供する。
論文参考訳（メタデータ） (2023-07-13T17:43:12Z)
AutoML Two-Sample Test [13.468660785510945]
我々は、目撃者の関数の平均的な相違をテスト統計として捉えた単純なテストを使用し、二乗損失を最小限にすれば、最適なテスト能力を持つ目撃者につながることを証明します。我々はPythonパッケージAutotstでAutoMLの2サンプルテストの実装を提供する。
論文参考訳（メタデータ） (2022-06-17T15:41:07Z)
Pseudo-IoU: Improving Label Assignment in Anchor-Free Object Detection [60.522877583407904]
現在のアンカーフリー物体検出器は非常に単純で有効であるが、正確なラベル割り当て方法がない。 Pseudo-Intersection-over-Union(Pseudo-IoU): アンカーフリーなオブジェクト検出フレームワークに、より標準化され、正確な割り当てルールをもたらす単純なメトリックである。本手法はベルやホイッスルを使わずに最新のアンカーフリー手法と同等の性能を実現する。
論文参考訳（メタデータ） (2021-04-29T02:48:47Z)
CoCoMoT: Conformance Checking of Multi-Perspective Processes via SMT (Extended Version) [62.96267257163426]
我々はCoCoMoT(Computing Conformance Modulo Theories)フレームワークを紹介する。まず、純粋な制御フロー設定で研究したSATベースのエンコーディングを、データ認識ケースに持ち上げる方法を示す。次に,プロパティ保存型クラスタリングの概念に基づく新しい前処理手法を提案する。
論文参考訳（メタデータ） (2021-03-18T20:22:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。