論文の概要: Legion: Best-First Concolic Testing
- arxiv url: http://arxiv.org/abs/2002.06311v3
- Date: Wed, 23 Sep 2020 02:06:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 23:19:46.551137
- Title: Legion: Best-First Concolic Testing
- Title(参考訳): Legion: ベストファーストの衝突テスト
- Authors: Dongge Liu, Gidon Ernst, Toby Murray, Benjamin I. P. Rubinstein
- Abstract要約: Legionは、自動テスト生成を不確実性の下でのシーケンシャルな意思決定の問題として扱うために、AI文献からMonte Carlo Tree Search (MCTS)フレームワークを再設計する。
その最優先の検索戦略は、前回の反復で観測された報酬に基づいて、最も有望なプログラム状態から各検索について調査する、原則化された方法を提供する。
APPFuzzingはモンテカルロシミュレーション技術として機能し、制約サンプリングの事前作業を拡張することで実装されている。
- 参考スコア(独自算出の注目度): 12.566008895024176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Concolic execution and fuzzing are two complementary coverage-based testing
techniques. How to achieve the best of both remains an open challenge. To
address this research problem, we propose and evaluate Legion. Legion
re-engineers the Monte Carlo tree search (MCTS) framework from the AI
literature to treat automated test generation as a problem of sequential
decision-making under uncertainty. Its best-first search strategy provides a
principled way to learn the most promising program states to investigate at
each search iteration, based on observed rewards from previous iterations.
Legion incorporates a form of directed fuzzing that we call approximate
path-preserving fuzzing (APPFuzzing) to investigate program states selected by
MCTS. APPFuzzing serves as the Monte Carlo simulation technique and is
implemented by extending prior work on constrained sampling. We evaluate Legion
against competitors on 2531 benchmarks from the coverage category of Test-Comp
2020, as well as measuring its sensitivity to hyperparameters, demonstrating
its effectiveness on a wide variety of input programs.
- Abstract(参考訳): 競合実行とファジィは相補的なカバレッジベースのテスト技術である。
両方の長所を達成するには,依然としてオープンな課題です。
この課題に対処するため,我々はLegionを提案し,評価する。
Legionは、自動テスト生成を不確実性の下でのシーケンシャルな意思決定の問題として扱うために、AI文献からMonte Carlo Tree Search (MCTS)フレームワークを再設計する。
そのベストファースト検索戦略は、前回の反復から得られた報酬に基づいて、最も有望なプログラム状態の探索方法を原則的に提供する。
Legionは、MCTSが選択したプログラム状態を調べるために、近似経路保存ファジング(APPFuzzing)と呼ばれる方向ファジングを組み込んでいる。
APPFuzzingはモンテカルロシミュレーション技術として機能し、制約サンプリングの事前作業を拡張することで実装されている。
我々は、テストコンプリート2020のカバレッジカテゴリから2531ベンチマークの競合相手に対するレギオンを評価し、ハイパーパラメータに対する感度を測定し、様々な入力プログラムでその効果を示す。
関連論文リスト
- LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning [56.273799410256075]
このフレームワークはMonte Carlo Tree Search (MCTS)と反復的なSelf-Refineを組み合わせて推論パスを最適化する。
このフレームワークは、一般的なベンチマークと高度なベンチマークでテストされており、探索効率と問題解決能力の点で優れた性能を示している。
論文 参考訳(メタデータ) (2024-10-03T18:12:29Z) - Step-by-Step Reasoning for Math Problems via Twisted Sequential Monte Carlo [55.452453947359736]
Twisted Sequential Monte Carlo(TSMC)に基づく新しい検証手法を提案する。
TSMCを大規模言語モデルに適用し、部分解に対する将来的な報酬を推定する。
このアプローチは、ステップワイドなヒューマンアノテーションを必要としない、より直接的なトレーニングターゲットをもたらす。
論文 参考訳(メタデータ) (2024-10-02T18:17:54Z) - Online Test Synthesis From Requirements: Enhancing Reinforcement Learning with Game Theory [1.363146160329157]
リアクティブ実装の自動化として指定された機能要件からブラックボックステストケースの自動オンライン合成を検討する。
提案手法はモンテカルロ木探索(モンテカルロ木探索)を応用し,予測入力を効率的に選択するための強化学習の古典的手法である。
論文 参考訳(メタデータ) (2024-07-26T07:59:59Z) - Multi-Armed Bandits with Abstention [62.749500564313834]
本稿では, 新たな戦略要素である禁忌を取り入れた, 正準多重武装バンディット問題の拡張を提案する。
この強化されたフレームワークでは、エージェントは各タイムステップでアームを選択することだけでなく、観察する前に即時報酬を受け付けないオプションも備えている。
論文 参考訳(メタデータ) (2024-02-23T06:27:12Z) - LEAPS: End-to-End One-Step Person Search With Learnable Proposals [50.39493100627476]
LEAPSという学習可能な提案を用いたエンドツーエンドのワンステップ人物探索手法を提案する。
スパースと学習可能な提案のセットが与えられた後、LEAPSは動的人物検索ヘッドを使用して、非最大抑圧後処理なしで直接人物検出および対応するre-id特徴生成を行う。
論文 参考訳(メタデータ) (2023-03-21T13:59:32Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Hybrid Intelligent Testing in Simulation-Based Verification [0.0]
数百万のテストは、カバレッジの目標を達成するために必要かもしれない。
カバレッジ指向のテスト選択は、カバレッジフィードバックからバイアステストまで、最も効果的なテストへと学習する。
ノベルティ駆動検証は、以前の刺激とは異なる刺激を識別し、シミュレートすることを学ぶ。
論文 参考訳(メタデータ) (2022-05-19T13:22:08Z) - Supervised Learning for Coverage-Directed Test Selection in
Simulation-Based Verification [0.0]
本稿では,自動制約抽出とテスト選択のための新しい手法を提案する。
カバレッジ指向のテスト選択は、カバレッジフィードバックからの教師付き学習に基づいている。
本稿では,手作業による制約記述の低減,効果的なテストの優先順位付け,検証資源の消費の低減,大規模で実生活のハードウェア設計におけるカバレッジ閉鎖の促進について述べる。
論文 参考訳(メタデータ) (2022-05-17T17:49:30Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - End-to-End Training of Neural Retrievers for Open-Domain Question
Answering [32.747113232867825]
ニューラルレトリバーに対して、非監視および監督された方法が最も効果的に使用できるかは不明である。
Inverse Cloze Taskとマスク付きサラエントスパンによる教師なしプリトレーニングのアプローチを提案します。
また,OpenQAモデルにおけるリーダとレシーバコンポーネントのエンドツーエンド教師付きトレーニングのための2つのアプローチについても検討する。
論文 参考訳(メタデータ) (2021-01-02T09:05:34Z) - Unlucky Explorer: A Complete non-Overlapping Map Exploration [0.949996206597248]
エージェントがすべてのセルを訪問するハミルトニアンパスを見つけなければならない探索問題として,Maze Dashパズルを紹介した。
提案したモンテカルロ木探索(MCTS)アルゴリズムに最適化を適用し,有望な結果を得た。
比較の結果,MCTSをベースとしたアプローチは,テストケースの小型化と中型化を両立させる手法であることがわかった。
論文 参考訳(メタデータ) (2020-05-28T17:19:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。