Fugu-MT 論文翻訳(概要): Identifying and Replicating Code Patterns Driving Performance Regressions in Software Systems

論文の概要: Identifying and Replicating Code Patterns Driving Performance Regressions in Software Systems

arxiv url: http://arxiv.org/abs/2504.05851v1
Date: Tue, 08 Apr 2025 09:28:46 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-16 23:01:48.025194
Title: Identifying and Replicating Code Patterns Driving Performance Regressions in Software Systems
Title（参考訳）: ソフトウェアシステムのパフォーマンス低下を駆動するコードパターンの特定とリプリケーション
Authors: Denivan Campos, Luana Martins, Emanuela Guglielmi, Michele Tucci, Daniele Di Pompeo, Simone Scalabrino, Vittorio Cortellessa, Dario Di Nucci, Rocco Oliveto,
Abstract要約: パフォーマンス変異テストは、意図的な欠陥を導入し、障害検出能力を測定し、強化する。重要な課題は、生成されたミュータントが現実世界のパフォーマンス問題を正確に反映しているかどうかを理解することである。本研究は、性能試験のための突然変異演算子を評価し、拡張する。
参考スコア（独自算出の注目度）: 7.030339427131108
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Context: Performance regressions negatively impact execution time and memory usage of software systems. Nevertheless, there is a lack of systematic methods to evaluate the effectiveness of performance test suites. Performance mutation testing, which introduces intentional defects (mutants) to measure and enhance fault-detection capabilities, is promising but underexplored. A key challenge is understanding if generated mutants accurately reflect real-world performance issues. Goal: This study evaluates and extends mutation operators for performance testing. Its objectives include (i) collecting existing performance mutation operators, (ii) introducing new operators from real-world code changes that impact performance, and (iii) evaluating these operators on real-world systems to see if they effectively degrade performance. Method: To this aim, we will (i) review the literature to identify performance mutation operators, (ii) conduct a mining study to extract patterns of code changes linked to performance regressions, (iii) propose new mutation operators based on these patterns, and (iv) apply and evaluate the operators to assess their effectiveness in exposing performance degradations. Expected Outcomes: We aim to provide an enriched set of mutation operators for performance testing, helping developers and researchers identify harmful coding practices and design better strategies to detect and prevent performance regressions.
Abstract（参考訳）: コンテキスト: パフォーマンスの回帰は、ソフトウェアシステムの実行時間とメモリ使用量に悪影響を及ぼします。それにもかかわらず、パフォーマンステストスイートの有効性を評価するための体系的な手法が欠如している。障害検出能力の測定と向上のために意図的な欠陥(ミュータント)を導入するパフォーマンス突然変異テストは、有望だが未発見である。重要な課題は、生成されたミュータントが現実世界のパフォーマンス問題を正確に反映しているかどうかを理解することである。 Goal: この研究は、パフォーマンステストのための突然変異演算子を評価し、拡張します。目的は以下の通り。 (i)既存のパフォーマンス突然変異演算子を収集すること。 (二)パフォーマンスに影響を及ぼす実世界のコードの変更から新たな演算子を導入すること、三実世界のシステム上でこれらの演算子を評価して、効果的に性能を劣化させるかどうかを確認すること。方法:この目的のために、私たちは (i)パフォーマンス突然変異演算子を特定するために文献をレビューする。二性能回帰に関連するコード変更のパターンを抽出するための鉱業調査を行うこと。 (三)これらのパターンに基づく新たな突然変異演算子を提案し、 (4) 性能劣化の露呈の有効性を評価するために, オペレータを適用し, 評価する。期待された成果: パフォーマンステストのための豊富な突然変異演算子を提供することを目標とし、開発者や研究者が有害なコーディングプラクティスを特定し、パフォーマンスの回帰を検出して防止するためのより良い戦略を設計するのを支援する。

関連論文リスト

TIDE: Trajectory-based Diagnostic Evaluation of Test-Time Improvement in LLM Agents [43.376952807616256]
自律型LLMエージェントの最近の進歩は、環境との反復的相互作用によって性能を向上させる能力を示している。本稿では,TTIを3つの包括的かつ相互接続的な次元に分解するエージェント非依存および環境非依存のフレームワークであるテスト時間改善診断評価(TIDE)を提案する。
論文参考訳（メタデータ） (2026-02-02T15:00:47Z)
Rethinking the Role of Entropy in Optimizing Tool-Use Behaviors for Large Language Model Agents [54.18201810286764]
LLM(Large Language Models)に基づくツール利用エージェントは、数学的推論やマルチホップ質問応答といったタスクに優れる。長い道のりでは、エージェントはしばしば過度で低品質なツールコールをトリガーし、レイテンシを増大させ、推論性能を低下させる。本稿では,エントロピー低減を監視信号として使用し,ツール使用行動の最適化ニーズに対処する2つの報奨戦略を設計する。
論文参考訳（メタデータ） (2026-02-02T12:52:14Z)
An Empirical Study on Method-Level Performance Evolution in Open-Source Java Projects [14.908341749591594]
我々は15の成熟したオープンソースのJavaプロジェクトで、パフォーマンスの進化を分析する大規模な実証的研究を行った。その結果,メソッドレベルの変化の32.7%が測定可能なパフォーマンスに影響を及ぼすことが判明した。アルゴリズムの変更は、最高の改善可能性を示すが、かなりのレグレッションリスクを持つ。
論文参考訳（メタデータ） (2025-08-09T19:39:01Z)
Scaling Test-time Compute for LLM Agents [51.790752085445384]
テスト時間計算のスケールアップは、大規模言語モデル(LLM)の推論能力の向上に顕著な成功を収めた。本研究では,テスト時間スケーリング手法を言語エージェントに適用する最初の体系的な検討を行う。
論文参考訳（メタデータ） (2025-06-15T17:59:47Z)
Active Test-time Vision-Language Navigation [60.69722522420299]
ATENAは、不確実なナビゲーション結果に対するエピソードフィードバックを通じて、実用的な人間とロボットのインタラクションを可能にする、テスト時のアクティブな学習フレームワークである。特にATENAは、成功エピソードにおける確実性を高め、失敗エピソードにおいてそれを減らすことを学び、不確実性の校正を改善している。さらに,自信ある予測に基づいて,エージェントがナビゲーション結果を評価することができる自己学習戦略を提案する。
論文参考訳（メタデータ） (2025-06-07T02:24:44Z)
KARE-RAG: Knowledge-Aware Refinement and Enhancement for RAG [63.82127103851471]
Retrieval-Augmented Generation (RAG)は、大規模言語モデルがより広範な知識ソースにアクセスすることを可能にする。ノイズの多いコンテンツを処理するために生成モデルの能力を向上させることは、ロバストなパフォーマンスに等しく重要であることを実証する。本稿では,3つの重要なイノベーションを通じて知識利用を改善するKARE-RAGを提案する。
論文参考訳（メタデータ） (2025-06-03T06:31:17Z)
UGCE: User-Guided Incremental Counterfactual Exploration [2.2789818122188925]
対実的説明(CFE)は、モデル出力を変更する最小限の機能変化を識別することによって、機械学習の予測を解釈するための一般的なアプローチである。既存のメソッドはそのような反復的な更新をサポートしず、代わりに変更毎にスクラッチから説明を再計算する。 UGCE(User-Guided Incremental Counterfactual Exploration)は,遺伝的アルゴリズムをベースとした,ユーザ制約の進展に応じて,逆ファクトアルを漸進的に更新するフレームワークである。
論文参考訳（メタデータ） (2025-05-27T15:24:43Z)
MIRROR: Multi-agent Intra- and Inter-Reflection for Optimized Reasoning in Tool Learning [33.009759731505746]
ツール統合を含む複雑なタスクは、大規模言語モデルにとって大きな課題となる。リフレクションはエージェントベンチマークにおける誤った軌道の修正に有効な戦略として現れている。提案するMIRRORは,実行前に意図した動作を批判的に評価するフレームワークと,軌道のさらなる調整を行うインターリフレクションの両方からなるフレームワークである。
論文参考訳（メタデータ） (2025-05-27T03:37:33Z)
Review, Refine, Repeat: Understanding Iterative Decoding of AI Agents with Dynamic Evaluation and Selection [71.92083784393418]
Best-of-N (BON) サンプリングのような推論時間法は、パフォーマンスを改善するための単純で効果的な代替手段を提供する。本稿では,反復的改良と動的候補評価,検証器による選択を併用した反復的エージェント復号(IAD)を提案する。
論文参考訳（メタデータ） (2025-04-02T17:40:47Z)
On the Mistaken Assumption of Interchangeable Deep Reinforcement Learning Implementations [53.0667196725616]
ディープ・強化学習(Deep Reinforcement Learning, DRL)とは、エージェントがニューラルネットワークを使って特定の環境でどのアクションをとるかを学ぶ人工知能のパラダイムである。 DRLは最近、ドライビングシミュレーター、3Dロボット制御、マルチプレイヤー・オンライン・バトル・アリーナ・ビデオゲームといった複雑な環境を解くことで注目を集めている。現在、Deep Q-Network (DQN) や Proximal Policy Optimization (PPO) アルゴリズムのような、これらのエージェントを訓練する最先端のアルゴリズムの実装が数多く存在する。
論文参考訳（メタデータ） (2025-03-28T16:25:06Z)
FastFT: Accelerating Reinforced Feature Transformation via Advanced Exploration Strategies [26.50070102629617]
先進的な戦略の3つを活用する革新的なフレームワークであるFastFTを紹介します。生成した変換シーケンスの新規性を評価する手法を開発した。また、新規性とパフォーマンスを組み合わせて、優先順位付けされたメモリバッファを作成します。
論文参考訳（メタデータ） (2025-03-26T10:17:41Z)
Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文参考訳（メタデータ） (2025-02-18T17:12:26Z)
Automated Refactoring of Non-Idiomatic Python Code: A Differentiated Replication with LLMs [54.309127753635366]
本研究は, GPT-4の有効性について検討し, 慣用行動の推奨と示唆について検討した。この結果から,従来は複雑なコード解析に基づくレコメンデータの実装が求められていた,LCMの課題達成の可能性が浮き彫りになった。
論文参考訳（メタデータ） (2025-01-28T15:41:54Z)
Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文参考訳（メタデータ） (2024-08-24T18:28:19Z)
Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning? [1.9116784879310031]
深層強化学習(RL)では、値関数はディープニューラルネットワークを用いて近似され、平均2乗誤差回帰目標を用いて訓練される。近年の研究では、クロスエントロピー分類の目的を活かした代替手法が提案されている。我々の研究は、オフラインのRLセットアップにおけるそのような置換の影響を実証的に調査することを目指している。
論文参考訳（メタデータ） (2024-06-10T14:25:11Z)
From Static Benchmarks to Adaptive Testing: Psychometrics in AI Evaluation [60.14902811624433]
本稿では,静的評価手法から適応テストへのパラダイムシフトについて論じる。これには、ベンチマークで各テスト項目の特性と価値を推定し、リアルタイムでアイテムを動的に調整することが含まれる。我々は、AI評価にサイコメトリックを採用する現在のアプローチ、アドバンテージ、そして根底にある理由を分析します。
論文参考訳（メタデータ） (2023-06-18T09:54:33Z)
Diversity Enhanced Active Learning with Strictly Proper Scoring Rules [4.81450893955064]
テキスト分類のための能動学習(AL)のための獲得関数について検討する。我々は、期待損失削減法(ELR)を、ログ確率や負平均二乗誤差などの(厳密な)スコアの増加を推定するために変換する。 BEMPSを用いた平均二乗誤差とログ確率を用いることで、ロバストな取得関数が得られることを示す。
論文参考訳（メタデータ） (2021-10-27T05:02:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。