Fugu-MT 論文翻訳(概要): Legion: Best-First Concolic Testing

論文の概要: Legion: Best-First Concolic Testing

arxiv url: http://arxiv.org/abs/2002.06311v3
Date: Wed, 23 Sep 2020 02:06:37 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-31 23:19:46.551137
Title: Legion: Best-First Concolic Testing
Title（参考訳）: Legion: ベストファーストの衝突テスト
Authors: Dongge Liu, Gidon Ernst, Toby Murray, Benjamin I. P. Rubinstein
Abstract要約: Legionは、自動テスト生成を不確実性の下でのシーケンシャルな意思決定の問題として扱うために、AI文献からMonte Carlo Tree Search (MCTS)フレームワークを再設計する。その最優先の検索戦略は、前回の反復で観測された報酬に基づいて、最も有望なプログラム状態から各検索について調査する、原則化された方法を提供する。 APPFuzzingはモンテカルロシミュレーション技術として機能し、制約サンプリングの事前作業を拡張することで実装されている。
参考スコア（独自算出の注目度）: 12.566008895024176
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Concolic execution and fuzzing are two complementary coverage-based testing techniques. How to achieve the best of both remains an open challenge. To address this research problem, we propose and evaluate Legion. Legion re-engineers the Monte Carlo tree search (MCTS) framework from the AI literature to treat automated test generation as a problem of sequential decision-making under uncertainty. Its best-first search strategy provides a principled way to learn the most promising program states to investigate at each search iteration, based on observed rewards from previous iterations. Legion incorporates a form of directed fuzzing that we call approximate path-preserving fuzzing (APPFuzzing) to investigate program states selected by MCTS. APPFuzzing serves as the Monte Carlo simulation technique and is implemented by extending prior work on constrained sampling. We evaluate Legion against competitors on 2531 benchmarks from the coverage category of Test-Comp 2020, as well as measuring its sensitivity to hyperparameters, demonstrating its effectiveness on a wide variety of input programs.
Abstract（参考訳）: 競合実行とファジィは相補的なカバレッジベースのテスト技術である。両方の長所を達成するには,依然としてオープンな課題です。この課題に対処するため,我々はLegionを提案し,評価する。 Legionは、自動テスト生成を不確実性の下でのシーケンシャルな意思決定の問題として扱うために、AI文献からMonte Carlo Tree Search (MCTS)フレームワークを再設計する。そのベストファースト検索戦略は、前回の反復から得られた報酬に基づいて、最も有望なプログラム状態の探索方法を原則的に提供する。 Legionは、MCTSが選択したプログラム状態を調べるために、近似経路保存ファジング(APPFuzzing)と呼ばれる方向ファジングを組み込んでいる。 APPFuzzingはモンテカルロシミュレーション技術として機能し、制約サンプリングの事前作業を拡張することで実装されている。我々は、テストコンプリート2020のカバレッジカテゴリから2531ベンチマークの競合相手に対するレギオンを評価し、ハイパーパラメータに対する感度を測定し、様々な入力プログラムでその効果を示す。

関連論文リスト

TestAgent: An Adaptive and Intelligent Expert for Human Assessment [62.060118490577366]
対話型エンゲージメントによる適応テストを強化するために,大規模言語モデル(LLM)を利用したエージェントであるTestAgentを提案する。 TestAgentは、パーソナライズされた質問の選択をサポートし、テストテイカーの応答と異常をキャプチャし、動的で対話的なインタラクションを通じて正確な結果を提供する。
論文参考訳（メタデータ） (2025-06-03T16:07:54Z)
MLRC-Bench: Can Language Agents Solve Machine Learning Research Challenges? [64.62421656031128]
MLRC-Benchは、機械学習(ML)リサーチコンペティションの挑戦において、言語エージェントがいかに効果的に対処できるかを定量化するために設計されたベンチマークである。 MLRC-Benchは以前の研究とは異なり、新しい研究手法を提案し、実装する上で重要なステップを計測する。最も優れた試験薬でさえ、ベースラインとトップヒューマンのスコアの差の9.3%しか閉じていない。
論文参考訳（メタデータ） (2025-04-13T19:35:43Z)
Sample, Don't Search: Rethinking Test-Time Alignment for Language Models [55.2480439325792]
新しいテストタイムアライメントアプローチであるQAlignを紹介します。テスト時間計算をスケールする際、QAlignは各プロンプトの最適配向分布からのサンプリングに収束する。マルコフ連鎖モンテカルロのテキスト生成における最近の進歩を取り入れることで、基礎となるモデルを変更したり、ロジットアクセスを必要とせずに、より良い整合出力を可能にする。
論文参考訳（メタデータ） (2025-04-04T00:41:40Z)
Representation Improvement in Latent Space for Search-Based Testing of Autonomous Robotic Systems [13.431632585434384]
自動運転車や無人航空機のような自律型ロボットシステムのテストは、予測不可能な環境との相互作用のために難しい。より効率的にテストシナリオを生成するために、多くの検索ベースのアプローチが提案された。変分オートエンコーダの潜在空間にマッピングすることで,テスト表現を向上させるRILaSTを提案する。
論文参考訳（メタデータ） (2025-03-26T15:34:42Z)
Improving Deep Assertion Generation via Fine-Tuning Retrieval-Augmented Pre-trained Language Models [20.71745514142851]
RetriGenは検索強化されたディープアサーション生成アプローチである。我々はRetriGenを6つの最先端アプローチに対して評価する実験を行っている。
論文参考訳（メタデータ） (2025-02-22T04:17:04Z)
LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning [56.273799410256075]
このフレームワークはMonte Carlo Tree Search (MCTS)と反復的なSelf-Refineを組み合わせて推論パスを最適化する。このフレームワークは、一般的なベンチマークと高度なベンチマークでテストされており、探索効率と問題解決能力の点で優れた性能を示している。
論文参考訳（メタデータ） (2024-10-03T18:12:29Z)
Step-by-Step Reasoning for Math Problems via Twisted Sequential Monte Carlo [55.452453947359736]
Twisted Sequential Monte Carlo(TSMC)に基づく新しい検証手法を提案する。 TSMCを大規模言語モデルに適用し、部分解に対する将来的な報酬を推定する。このアプローチは、ステップワイドなヒューマンアノテーションを必要としない、より直接的なトレーニングターゲットをもたらす。
論文参考訳（メタデータ） (2024-10-02T18:17:54Z)
Online Test Synthesis From Requirements: Enhancing Reinforcement Learning with Game Theory [1.363146160329157]
リアクティブ実装の自動化として指定された機能要件からブラックボックステストケースの自動オンライン合成を検討する。提案手法はモンテカルロ木探索(モンテカルロ木探索)を応用し,予測入力を効率的に選択するための強化学習の古典的手法である。
論文参考訳（メタデータ） (2024-07-26T07:59:59Z)
Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化は機械学習アプリケーションにおいて重要な要素である。最新のUQベースラインの集合を実装した新しいベンチマークを導入する。我々は、11タスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も効果的なアプローチを特定した。
論文参考訳（メタデータ） (2024-06-21T20:06:31Z)
Multi-Armed Bandits with Abstention [62.749500564313834]
本稿では, 新たな戦略要素である禁忌を取り入れた, 正準多重武装バンディット問題の拡張を提案する。この強化されたフレームワークでは、エージェントは各タイムステップでアームを選択することだけでなく、観察する前に即時報酬を受け付けないオプションも備えている。
論文参考訳（メタデータ） (2024-02-23T06:27:12Z)
LEAPS: End-to-End One-Step Person Search With Learnable Proposals [50.39493100627476]
LEAPSという学習可能な提案を用いたエンドツーエンドのワンステップ人物探索手法を提案する。スパースと学習可能な提案のセットが与えられた後、LEAPSは動的人物検索ヘッドを使用して、非最大抑圧後処理なしで直接人物検出および対応するre-id特徴生成を行う。
論文参考訳（メタデータ） (2023-03-21T13:59:32Z)
ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文参考訳（メタデータ） (2022-07-14T17:46:37Z)
Hybrid Intelligent Testing in Simulation-Based Verification [0.0]
数百万のテストは、カバレッジの目標を達成するために必要かもしれない。カバレッジ指向のテスト選択は、カバレッジフィードバックからバイアステストまで、最も効果的なテストへと学習する。ノベルティ駆動検証は、以前の刺激とは異なる刺激を識別し、シミュレートすることを学ぶ。
論文参考訳（メタデータ） (2022-05-19T13:22:08Z)
Supervised Learning for Coverage-Directed Test Selection in Simulation-Based Verification [0.0]
本稿では,自動制約抽出とテスト選択のための新しい手法を提案する。カバレッジ指向のテスト選択は、カバレッジフィードバックからの教師付き学習に基づいている。本稿では,手作業による制約記述の低減,効果的なテストの優先順位付け,検証資源の消費の低減,大規模で実生活のハードウェア設計におけるカバレッジ閉鎖の促進について述べる。
論文参考訳（メタデータ） (2022-05-17T17:49:30Z)
When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。精度を向上させるために,2つの軽量モジュールを提案する。 DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。 QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文参考訳（メタデータ） (2021-05-27T13:51:42Z)
End-to-End Training of Neural Retrievers for Open-Domain Question Answering [32.747113232867825]
ニューラルレトリバーに対して、非監視および監督された方法が最も効果的に使用できるかは不明である。 Inverse Cloze Taskとマスク付きサラエントスパンによる教師なしプリトレーニングのアプローチを提案します。また,OpenQAモデルにおけるリーダとレシーバコンポーネントのエンドツーエンド教師付きトレーニングのための2つのアプローチについても検討する。
論文参考訳（メタデータ） (2021-01-02T09:05:34Z)
Unlucky Explorer: A Complete non-Overlapping Map Exploration [0.949996206597248]
エージェントがすべてのセルを訪問するハミルトニアンパスを見つけなければならない探索問題として,Maze Dashパズルを紹介した。提案したモンテカルロ木探索(MCTS)アルゴリズムに最適化を適用し,有望な結果を得た。比較の結果,MCTSをベースとしたアプローチは,テストケースの小型化と中型化を両立させる手法であることがわかった。
論文参考訳（メタデータ） (2020-05-28T17:19:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。