論文の概要: Identifying and Replicating Code Patterns Driving Performance Regressions in Software Systems
- arxiv url: http://arxiv.org/abs/2504.05851v1
- Date: Tue, 08 Apr 2025 09:28:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 23:01:48.025194
- Title: Identifying and Replicating Code Patterns Driving Performance Regressions in Software Systems
- Title(参考訳): ソフトウェアシステムのパフォーマンス低下を駆動するコードパターンの特定とリプリケーション
- Authors: Denivan Campos, Luana Martins, Emanuela Guglielmi, Michele Tucci, Daniele Di Pompeo, Simone Scalabrino, Vittorio Cortellessa, Dario Di Nucci, Rocco Oliveto,
- Abstract要約: パフォーマンス変異テストは、意図的な欠陥を導入し、障害検出能力を測定し、強化する。
重要な課題は、生成されたミュータントが現実世界のパフォーマンス問題を正確に反映しているかどうかを理解することである。
本研究は、性能試験のための突然変異演算子を評価し、拡張する。
- 参考スコア(独自算出の注目度): 7.030339427131108
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Context: Performance regressions negatively impact execution time and memory usage of software systems. Nevertheless, there is a lack of systematic methods to evaluate the effectiveness of performance test suites. Performance mutation testing, which introduces intentional defects (mutants) to measure and enhance fault-detection capabilities, is promising but underexplored. A key challenge is understanding if generated mutants accurately reflect real-world performance issues. Goal: This study evaluates and extends mutation operators for performance testing. Its objectives include (i) collecting existing performance mutation operators, (ii) introducing new operators from real-world code changes that impact performance, and (iii) evaluating these operators on real-world systems to see if they effectively degrade performance. Method: To this aim, we will (i) review the literature to identify performance mutation operators, (ii) conduct a mining study to extract patterns of code changes linked to performance regressions, (iii) propose new mutation operators based on these patterns, and (iv) apply and evaluate the operators to assess their effectiveness in exposing performance degradations. Expected Outcomes: We aim to provide an enriched set of mutation operators for performance testing, helping developers and researchers identify harmful coding practices and design better strategies to detect and prevent performance regressions.
- Abstract(参考訳): コンテキスト: パフォーマンスの回帰は、ソフトウェアシステムの実行時間とメモリ使用量に悪影響を及ぼします。
それにもかかわらず、パフォーマンステストスイートの有効性を評価するための体系的な手法が欠如している。
障害検出能力の測定と向上のために意図的な欠陥(ミュータント)を導入するパフォーマンス突然変異テストは、有望だが未発見である。
重要な課題は、生成されたミュータントが現実世界のパフォーマンス問題を正確に反映しているかどうかを理解することである。
Goal: この研究は、パフォーマンステストのための突然変異演算子を評価し、拡張します。
目的は以下の通り。
(i)既存のパフォーマンス突然変異演算子を収集すること。
(二)パフォーマンスに影響を及ぼす実世界のコードの変更から新たな演算子を導入すること、
三 実世界のシステム上でこれらの演算子を評価して、効果的に性能を劣化させるかどうかを確認すること。
方法:この目的のために、私たちは
(i)パフォーマンス突然変異演算子を特定するために文献をレビューする。
二 性能回帰に関連するコード変更のパターンを抽出するための鉱業調査を行うこと。
(三)これらのパターンに基づく新たな突然変異演算子を提案し、
(4) 性能劣化の露呈の有効性を評価するために, オペレータを適用し, 評価する。
期待された成果: パフォーマンステストのための豊富な突然変異演算子を提供することを目標とし、開発者や研究者が有害なコーディングプラクティスを特定し、パフォーマンスの回帰を検出して防止するためのより良い戦略を設計するのを支援する。
関連論文リスト
- Review, Refine, Repeat: Understanding Iterative Decoding of AI Agents with Dynamic Evaluation and Selection [71.92083784393418]
Best-of-N (BON) サンプリングのような推論時間法は、パフォーマンスを改善するための単純で効果的な代替手段を提供する。
本稿では,反復的改良と動的候補評価,検証器による選択を併用した反復的エージェント復号(IAD)を提案する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - On the Mistaken Assumption of Interchangeable Deep Reinforcement Learning Implementations [53.0667196725616]
ディープ・強化学習(Deep Reinforcement Learning, DRL)とは、エージェントがニューラルネットワークを使って特定の環境でどのアクションをとるかを学ぶ人工知能のパラダイムである。
DRLは最近、ドライビングシミュレーター、3Dロボット制御、マルチプレイヤー・オンライン・バトル・アリーナ・ビデオゲームといった複雑な環境を解くことで注目を集めている。
現在、Deep Q-Network (DQN) や Proximal Policy Optimization (PPO) アルゴリズムのような、これらのエージェントを訓練する最先端のアルゴリズムの実装が数多く存在する。
論文 参考訳(メタデータ) (2025-03-28T16:25:06Z) - FastFT: Accelerating Reinforced Feature Transformation via Advanced Exploration Strategies [26.50070102629617]
先進的な戦略の3つを活用する革新的なフレームワークであるFastFTを紹介します。
生成した変換シーケンスの新規性を評価する手法を開発した。
また、新規性とパフォーマンスを組み合わせて、優先順位付けされたメモリバッファを作成します。
論文 参考訳(メタデータ) (2025-03-26T10:17:41Z) - Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z) - Automated Refactoring of Non-Idiomatic Python Code: A Differentiated Replication with LLMs [54.309127753635366]
本研究は, GPT-4の有効性について検討し, 慣用行動の推奨と示唆について検討した。
この結果から,従来は複雑なコード解析に基づくレコメンデータの実装が求められていた,LCMの課題達成の可能性が浮き彫りになった。
論文 参考訳(メタデータ) (2025-01-28T15:41:54Z) - Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning? [1.9116784879310031]
深層強化学習(RL)では、値関数はディープニューラルネットワークを用いて近似され、平均2乗誤差回帰目標を用いて訓練される。
近年の研究では、クロスエントロピー分類の目的を活かした代替手法が提案されている。
我々の研究は、オフラインのRLセットアップにおけるそのような置換の影響を実証的に調査することを目指している。
論文 参考訳(メタデータ) (2024-06-10T14:25:11Z) - From Static Benchmarks to Adaptive Testing: Psychometrics in AI Evaluation [60.14902811624433]
本稿では,静的評価手法から適応テストへのパラダイムシフトについて論じる。
これには、ベンチマークで各テスト項目の特性と価値を推定し、リアルタイムでアイテムを動的に調整することが含まれる。
我々は、AI評価にサイコメトリックを採用する現在のアプローチ、アドバンテージ、そして根底にある理由を分析します。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - Diversity Enhanced Active Learning with Strictly Proper Scoring Rules [4.81450893955064]
テキスト分類のための能動学習(AL)のための獲得関数について検討する。
我々は、期待損失削減法(ELR)を、ログ確率や負平均二乗誤差などの(厳密な)スコアの増加を推定するために変換する。
BEMPSを用いた平均二乗誤差とログ確率を用いることで、ロバストな取得関数が得られることを示す。
論文 参考訳(メタデータ) (2021-10-27T05:02:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。