Fugu-MT 論文翻訳(概要): P4Testgen: An Extensible Test Oracle For P4

論文の概要: P4Testgen: An Extensible Test Oracle For P4

arxiv url: http://arxiv.org/abs/2211.15300v3
Date: Sun, 6 Aug 2023 11:15:37 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-24 14:08:45.400804
Title: P4Testgen: An Extensible Test Oracle For P4
Title（参考訳）: P4Testgen: P4用の拡張可能なテストOracle
Authors: Fabian Ruffy, Jed Liu, Prathima Kotikalapudi, Vojt\v{e}ch Havel, Hanneli Tavante, Rob Sherwood, Vladyslav Dubina, Volodymyr Peschanenko, Anirudh Sivaraman, and Nate Foster
Abstract要約: P4$_16$言語用のテストオラクルであるP4Testgenを提示する。 P4Testgenは任意のP4ターゲットに対する自動テスト生成をサポートする。
参考スコア（独自算出の注目度）: 2.1879553303548427
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present P4Testgen, a test oracle for the P4$_{16}$ language. P4Testgen supports automatic test generation for any P4 target and is designed to be extensible to many P4 targets. It models the complete semantics of the target's packet-processing pipeline including the P4 language, architectures and externs, and target-specific extensions. To handle non-deterministic behaviors and complex externs (e.g., checksums and hash functions), P4Testgen uses taint tracking and concolic execution. It also provides path selection strategies that reduce the number of tests required to achieve full coverage. We have instantiated P4Testgen for the V1model, eBPF, PNA, and Tofino P4 architectures. Each extension required effort commensurate with the complexity of the target. We validated the tests generated by P4Testgen by running them across the entire P4C test suite as well as the programs supplied with the Tofino P4 Studio. Using the tool, we have also confirmed 25 bugs in mature, production toolchains for BMv2 and Tofino.
Abstract（参考訳）: P4$_{16}$言語用のテストオラクルであるP4Testgenを提示する。 P4Testgenは任意のP4ターゲットの自動テスト生成をサポートし、多くのP4ターゲットに拡張できるように設計されている。 p4言語、アーキテクチャ、externs、ターゲット固有の拡張を含むターゲットのパケット処理パイプラインの完全なセマンティクスをモデル化する。非決定論的振舞いと複雑なexterns(チェックサムやハッシュ関数など)を処理するために、p4testgenはtaintトラッキングとconcolic実行を使用している。また、完全なカバレッジを達成するために必要なテストの数を減らすパス選択戦略も提供する。 V1モデル、eBPF、PNA、およびTofino P4アーキテクチャ用のP4Testgenをインスタンス化した。それぞれの拡張は、ターゲットの複雑さに合致する努力を必要とした。 P4Testgenが生成したテストは、P4Cテストスイート全体とTofino P4 Studioが提供するプログラムで実行することで検証しました。このツールを使用して、BMv2とTofino用の成熟したプロダクションツールチェーンで25のバグを確認しました。

関連論文リスト

Leveraging GPT-4 for Vulnerability-Witnessing Unit Test Generation [0.6571063542099526]
本稿では,最も広く使用されている大規模言語モデルであるGPT-4の自動単体テスト生成機能について検討する。実際の脆弱性とそれに対応する修正を含むVUL4Jデータセットのサブセットについて検討する。我々は,コードコンテキストの影響,GPT-4の自己補正能力の有効性,生成したテストケースの主観的使用性に着目した。
論文参考訳（メタデータ） (2025-06-13T08:13:07Z)
Securing P4 Programs by Information Flow Control [4.6847954792167]
本稿では,P4プログラムにおける情報フローを解析するための新しいセキュリティ型システムを提案する。我々は、この型システムを形式化し、それを証明し、適切に型付けされたプログラムが非干渉を満たすことを保証した。
論文参考訳（メタデータ） (2025-05-14T08:42:46Z)
Large Language Model-Driven Concolic Execution for Highly Structured Test Input Generation [17.998976466008592]
CottontailはLLM(Large Language Model)による新しいコンコリック実行エンジンである。解析プログラムを体系的にテストするための高度に構造化されたテスト入力を生成する。最先端のアプローチ(SymCCとMarco)を14.15%、14.31%上回っている。
論文参考訳（メタデータ） (2025-04-24T13:32:20Z)
Building A Proof-Oriented Programmer That Is 64% Better Than GPT-4o Under Data Scarcity [0.5370906227996627]
本稿では,プロジェクトレベルの証明指向プログラミングのための合成データ拡張について,生成と修復の両面について紹介する。本手法は,その言語の習熟度に関する基礎的証明指向プログラミング問題を合成することにより,データの不足に対処する。我々は,プロジェクトレベルでの証明指向プログラミングにおいて,GPT-4oよりも優れた性能を示すモデルとして,細調整した14BパラメータモデルPoPilotを提案する。
論文参考訳（メタデータ） (2025-02-17T15:24:11Z)
CLOVER: A Test Case Generation Benchmark with Coverage, Long-Context, and Verification [71.34070740261072]
本稿では,テストケースの生成と完成におけるモデルの能力を評価するためのベンチマークCLOVERを提案する。ベンチマークはタスク間でのコード実行のためにコンテナ化されています。
論文参考訳（メタデータ） (2025-02-12T21:42:56Z)
ProofWala: Multilingual Proof Data Synthesis and Theorem-Proving [53.67926215943612]
$rm P Small ROOFW Small ALA$は、ニューラル定理プローサと2つの確立された対話的証明アシスタント(ITP)間の相互作用を可能にする私たちは、$rm P Small ROOFWsmall ALA$生成のCoqとLeanのデータの組み合わせでトレーニングされたモデルが、標準のprov-at-k$メトリック上で、Lean-onlyとCoq-onlyのモデルを上回っていることを示します。
論文参考訳（メタデータ） (2025-02-07T05:35:46Z)
LlamaRestTest: Effective REST API Testing with Small Language Models [50.058600784556816]
LlamaRestTestは、2つのLLM(Large Language Models)を使って現実的なテストインプットを生成する新しいアプローチである。私たちは、GPTを使った仕様強化ツールであるRESTGPTなど、最先端のREST APIテストツールに対して、これを評価しています。私たちの研究は、REST APIテストにおいて、小さな言語モデルは、大きな言語モデルと同様に、あるいは、より良く機能することができることを示しています。
論文参考訳（メタデータ） (2025-01-15T05:51:20Z)
Model Equality Testing: Which Model Is This API Serving? [59.005869726179455]
2サンプルテスト問題であるモデル品質テストのような歪みの検出を形式化する。単純な文字列カーネル上に構築されたテストは、歪みの範囲に対して77.4%の中央値を達成する。次に、このテストを4つのLlamaモデルの商用推論APIに適用し、31のエンドポイントのうち11がMetaがリリースしたリファレンスウェイトとは異なる分布を提供することがわかった。
論文参考訳（メタデータ） (2024-10-26T18:34:53Z)
Constrained C-Test Generation via Mixed-Integer Programming [55.28927994487036]
本研究は,単語の最後の部分のみをギャップに変換する,クローズテスト(ギャップ充足運動)の形式であるC-テストを生成する新しい手法を提案する。局所最適解を実現するために, ギャップサイズやギャップ配置の変化のみを考慮する従来の研究とは対照的に, 混合整数プログラミング(MIP)アプローチを提案する。当社のコード、モデル、収集したデータは32の英語のC-Testで、それぞれ20のギャップ(3,200の個別のギャップ応答)をオープンソースライセンスで公開しています。
論文参考訳（メタデータ） (2024-04-12T21:35:21Z)
A Formal Analysis of SCTP: Attack Synthesis and Patch Verification [7.331862211069559]
SCTP設計の安全性について検討し,厳密なアプローチを形式的手法に根ざして検討した。攻撃者は仲間のポートとIPを隠蔽できる外部者であり、攻撃者は悪意のあるピアであるEvil-Server、攻撃者が捕獲して再生できるReplay、パケットを変更できないOn-Path、攻撃者がピア間のチャネルを制御するOn-Pathの4つのモデルを定義します。
論文参考訳（メタデータ） (2024-03-08T20:38:56Z)
PPFlow: Target-aware Peptide Design with Torsional Flow Matching [52.567714059931646]
ペプチド構造設計のためのねじれ角の内部構造をモデル化するために,textscPPFlowと呼ばれるターゲット認識型ペプチド設計手法を提案する。さらに, PPBench2024というタンパク質-ペプチド結合データセットを構築した。
論文参考訳（メタデータ） (2024-03-05T13:26:42Z)
TAT-LLM: A Specialized Language Model for Discrete Reasoning over Tabular and Textual Data [73.29220562541204]
我々は,言語モデル(LLM)の驚くべきパワーを活用して課題を解決することを検討する。 LLaMA2を微調整し,既存のエキスパートアノテートデータセットから自動生成したトレーニングデータを用いてTAT-LLM言語モデルを開発する。
論文参考訳（メタデータ） (2024-01-24T04:28:50Z)
Tests4Py: A Benchmark for System Testing [11.051969638361012]
Tests4Pyベンチマークには、実世界の7つのPythonアプリケーションから73のバグと、サンプルプログラムから6のバグが含まれている。 Tests4Pyの各科目は機能的正当性を検証するためのオラクルを備えており、システムおよび単体テスト生成をサポートする。
論文参考訳（メタデータ） (2023-07-11T10:04:52Z)
Generalized Planning in PDDL Domains with Pretrained Large Language Models [82.24479434984426]
PDDLドメインを考慮し、GPT-4を用いてPythonプログラムを合成する。 7つのPDDLドメインでこのアプローチを評価し、4つのアブレーションと4つのベースラインと比較した。
論文参考訳（メタデータ） (2023-05-18T14:48:20Z)
FlaPy: Mining Flaky Python Tests at Scale [14.609208863749831]
FlaPyは、研究者がテストスイートを再実行することによって、与えられた、あるいは自動的にサンプルされたPythonプロジェクトの集合で、不安定なテストをマイニングするためのフレームワークである。 FlaPyはコンテナ化と新しい実行環境を使用してテスト実行を分離し、実際のCI条件をシミュレートする。 FlaPyはSLURMを使ってテスト実行の並列化をサポートしており、数千のプロジェクトをスキャンしてテストのフレキネスをスキャンすることができる。
論文参考訳（メタデータ） (2023-05-08T15:48:57Z)
Instruction Tuning for Few-Shot Aspect-Based Sentiment Analysis [72.9124467710526]
生成的アプローチは、テキストから(1つ以上の)4つの要素を1つのタスクとして抽出するために提案されている。本稿では,ABSAを解くための統一的なフレームワークと,それに関連するサブタスクを提案する。
論文参考訳（メタデータ） (2022-10-12T23:38:57Z)
Towards Runtime Verification of Programmable Switches [16.693719945977833]
実行時検証は、機械学習誘導ファズリングを使用して、コンパイル時に検出されないバグを検出できる。 P4プログラムのバグがローカライズされると、P4のプログラマブルな性質のために欠陥コードにパッチが当てられる。 P6 test P4 switch non-intrusively, すなわち、バグを検出してローカライズするためにP4プログラムを変更する必要はない。
論文参考訳（メタデータ） (2020-04-22T22:22:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。