論文の概要: P4Testgen: An Extensible Test Oracle For P4
- arxiv url: http://arxiv.org/abs/2211.15300v3
- Date: Sun, 6 Aug 2023 11:15:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 14:08:45.400804
- Title: P4Testgen: An Extensible Test Oracle For P4
- Title(参考訳): P4Testgen: P4用の拡張可能なテストOracle
- Authors: Fabian Ruffy, Jed Liu, Prathima Kotikalapudi, Vojt\v{e}ch Havel,
Hanneli Tavante, Rob Sherwood, Vladyslav Dubina, Volodymyr Peschanenko,
Anirudh Sivaraman, and Nate Foster
- Abstract要約: P4$_16$言語用のテストオラクルであるP4Testgenを提示する。
P4Testgenは任意のP4ターゲットに対する自動テスト生成をサポートする。
- 参考スコア(独自算出の注目度): 2.1879553303548427
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present P4Testgen, a test oracle for the P4$_{16}$ language. P4Testgen
supports automatic test generation for any P4 target and is designed to be
extensible to many P4 targets. It models the complete semantics of the target's
packet-processing pipeline including the P4 language, architectures and
externs, and target-specific extensions. To handle non-deterministic behaviors
and complex externs (e.g., checksums and hash functions), P4Testgen uses taint
tracking and concolic execution. It also provides path selection strategies
that reduce the number of tests required to achieve full coverage.
We have instantiated P4Testgen for the V1model, eBPF, PNA, and Tofino P4
architectures. Each extension required effort commensurate with the complexity
of the target. We validated the tests generated by P4Testgen by running them
across the entire P4C test suite as well as the programs supplied with the
Tofino P4 Studio. Using the tool, we have also confirmed 25 bugs in mature,
production toolchains for BMv2 and Tofino.
- Abstract(参考訳): P4$_{16}$言語用のテストオラクルであるP4Testgenを提示する。
P4Testgenは任意のP4ターゲットの自動テスト生成をサポートし、多くのP4ターゲットに拡張できるように設計されている。
p4言語、アーキテクチャ、externs、ターゲット固有の拡張を含むターゲットのパケット処理パイプラインの完全なセマンティクスをモデル化する。
非決定論的振舞いと複雑なexterns(チェックサムやハッシュ関数など)を処理するために、p4testgenはtaintトラッキングとconcolic実行を使用している。
また、完全なカバレッジを達成するために必要なテストの数を減らすパス選択戦略も提供する。
V1モデル、eBPF、PNA、およびTofino P4アーキテクチャ用のP4Testgenをインスタンス化した。
それぞれの拡張は、ターゲットの複雑さに合致する努力を必要とした。
P4Testgenが生成したテストは、P4Cテストスイート全体とTofino P4 Studioが提供するプログラムで実行することで検証しました。
このツールを使用して、BMv2とTofino用の成熟したプロダクションツールチェーンで25のバグを確認しました。
関連論文リスト
- GPT-HateCheck: Can LLMs Write Better Functional Tests for Hate Speech
Detection? [55.20381279291041]
HateCheckは、合成データに対してきめ細かいモデル機能をテストするスイートである。
GPT-HateCheckは,スクラッチからより多彩で現実的な機能テストを生成するフレームワークである。
クラウドソースのアノテーションは、生成されたテストケースが高品質であることを示しています。
論文 参考訳(メタデータ) (2024-02-23T10:02:01Z) - Code-Aware Prompting: A study of Coverage Guided Test Generation in
Regression Setting using LLM [34.07127332725332]
テスト生成における大規模言語モデルのコード認識促進戦略であるSymPromptを提案する。
我々のアプローチは、事前訓練されたLLMが、追加の訓練をすることなく、より完全なテストケースを生成することを可能にする。
論文 参考訳(メタデータ) (2024-01-31T18:21:49Z) - TAT-LLM: A Specialized Language Model for Discrete Reasoning over
Tabular and Textual Data [77.66158066013924]
我々は,言語モデル(LLM)の驚くべきパワーを活用して課題を解決することを検討する。
LLaMA2を微調整し,既存のエキスパートアノテートデータセットから自動生成したトレーニングデータを用いてTAT-LLM言語モデルを開発する。
論文 参考訳(メタデータ) (2024-01-24T04:28:50Z) - MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [48.523327752786585]
我々は,新しいテキスト・ツー・データベース・ベースのマルチエージェント・コラボレーティブ・フレームワークであるMACを紹介する。
本フレームワークは,テキスト・ツー・ジェネレーションのためのコア・デコンポーザ・エージェントと,数発のチェーン・オブ・シークレット・推論を備える。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、GPT-4のようにCode 7Bを活用して、オープンソースの命令フォローモデルsql-Llamaを微調整する。
論文 参考訳(メタデータ) (2023-12-18T14:40:20Z) - Can Large Language Models Write Good Property-Based Tests? [4.9094025705644695]
プロパティベーステスト(Property-based Testing、PBT)は、ソフトウェアテスティング研究コミュニティにおいて確立されたテクニックであるが、まだ現実世界のソフトウェアではあまり使われていない。
PBT-GPT を提案するとともに,PLT の LLM を推し進める3つの戦略を提案する。
PBT-GPTは、$textttnumpy$、$textttnetworkx$、$texttdatetime$のサンプルPythonライブラリAPIに関する予備研究で有望な結果を達成する。
論文 参考訳(メタデータ) (2023-07-10T05:09:33Z) - QLoRA: Efficient Finetuning of Quantized LLMs [66.58009990713134]
我々は,48GBのGPU上で65Bパラメータモデルを微調整するのに十分なメモリ使用量を削減する,効率的な微調整手法QLoRAを提案する。
QLoRAは凍結した4ビット量子化事前学習言語モデルを通して低ランクアダプタ(LoRA)に逆伝搬する
最高のモデルファミリであるGuanacoは、Vicunaベンチマークでリリースされたすべてのモデルより優れています。
論文 参考訳(メタデータ) (2023-05-23T17:50:33Z) - Generalized Planning in PDDL Domains with Pretrained Large Language
Models [82.24479434984426]
PDDLドメインを考慮し、GPT-4を用いてPythonプログラムを合成する。
7つのPDDLドメインでこのアプローチを評価し、4つのアブレーションと4つのベースラインと比較した。
論文 参考訳(メタデータ) (2023-05-18T14:48:20Z) - FlaPy: Mining Flaky Python Tests at Scale [14.609208863749831]
FlaPyは、研究者がテストスイートを再実行することによって、与えられた、あるいは自動的にサンプルされたPythonプロジェクトの集合で、不安定なテストをマイニングするためのフレームワークである。
FlaPyはコンテナ化と新しい実行環境を使用してテスト実行を分離し、実際のCI条件をシミュレートする。
FlaPyはSLURMを使ってテスト実行の並列化をサポートしており、数千のプロジェクトをスキャンしてテストのフレキネスをスキャンすることができる。
論文 参考訳(メタデータ) (2023-05-08T15:48:57Z) - Instruction Tuning for Few-Shot Aspect-Based Sentiment Analysis [72.9124467710526]
生成的アプローチは、テキストから(1つ以上の)4つの要素を1つのタスクとして抽出するために提案されている。
本稿では,ABSAを解くための統一的なフレームワークと,それに関連するサブタスクを提案する。
論文 参考訳(メタデータ) (2022-10-12T23:38:57Z) - Towards Runtime Verification of Programmable Switches [16.693719945977833]
実行時検証は、機械学習誘導ファズリングを使用して、コンパイル時に検出されないバグを検出できる。
P4プログラムのバグがローカライズされると、P4のプログラマブルな性質のために欠陥コードにパッチが当てられる。
P6 test P4 switch non-intrusively, すなわち、バグを検出してローカライズするためにP4プログラムを変更する必要はない。
論文 参考訳(メタデータ) (2020-04-22T22:22:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。