論文の概要: How Do Agentic AI Systems Address Performance Optimizations? A BERTopic-Based Analysis of Pull Requests
- arxiv url: http://arxiv.org/abs/2512.24630v1
- Date: Wed, 31 Dec 2025 05:06:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.576079
- Title: How Do Agentic AI Systems Address Performance Optimizations? A BERTopic-Based Analysis of Pull Requests
- Title(参考訳): エージェントAIシステムはパフォーマンス最適化にどう対処するか? プルリクエストのBERTopicに基づく分析
- Authors: Md Nahidul Islam Opu, Shahidul Islam, Muhammad Asaduzzaman, Shaiful Chowdhury,
- Abstract要約: 本稿では,AIエージェントが生成するパフォーマンス関連プルリクエストについて実証的研究を行う。
この結果から,AIエージェントはソフトウェアスタックの様々な層に性能最適化を適用することがわかった。
- 参考スコア(独自算出の注目度): 1.423280626666929
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM-based software engineering is influencing modern software development. In addition to correctness, prior studies have also examined the performance of software artifacts generated by AI agents. However, it is unclear how exactly the agentic AI systems address performance concerns in practice. In this paper, we present an empirical study of performance-related pull requests generated by AI agents. Using LLM-assisted detection and BERTopic-based topic modeling, we identified 52 performance-related topics grouped into 10 higher-level categories. Our results show that AI agents apply performance optimizations across diverse layers of the software stack and that the type of optimization significantly affects pull request acceptance rates and review times. We also found that performance optimization by AI agents primarily occurs during the development phase, with less focus on the maintenance phase. Our findings provide empirical evidence that can support the evaluation and improvement of agentic AI systems with respect to their performance optimization behaviors and review outcomes.
- Abstract(参考訳): LLMベースのソフトウェアエンジニアリングは、現代のソフトウェア開発に影響を与える。
正確性に加えて、AIエージェントが生成するソフトウェアアーティファクトのパフォーマンスも検討されている。
しかし、エージェントAIシステムが実際にパフォーマンス上の懸念にどのように対処しているかは不明だ。
本稿では,AIエージェントが生成するパフォーマンス関連プルリクエストについて,実証的研究を行う。
LLMによる検出とBERTopicに基づくトピックモデリングを用いて,52のパフォーマンス関連トピックを上位10のカテゴリに分類した。
この結果から,AIエージェントはソフトウェアスタックのさまざまなレイヤに性能最適化を適用し,最適化のタイプがプルリクエストの受け入れ率やレビュー時間に大きく影響していることが示唆された。
また、AIエージェントによるパフォーマンスの最適化は、主に開発フェーズ中に発生し、メンテナンスフェーズに重点を置いていないことも判明した。
本研究は,エージェントAIシステムの性能最適化と評価結果に対する評価と改善を支援する実証的証拠を提供する。
関連論文リスト
- How Do Agents Perform Code Optimization? An Empirical Study [6.085146597426065]
エージェントと人間による性能最適化のコミットを比較した最初の実証的研究を行った。
AIで認可されたパフォーマンスPRは、人間で認可されたPRよりも明示的なパフォーマンス検証を含まないことが分かりました。
論文 参考訳(メタデータ) (2025-12-25T18:20:25Z) - Let the Barbarians In: How AI Can Accelerate Systems Performance Research [80.43506848683633]
我々は、この繰り返しサイクルを、AI駆動システム研究の生成、評価、洗練のサイクルと呼ぶ。
我々はADRSが生成するソリューションが人間の最先端の設計に適合し、さらに優れることを示した。
論文 参考訳(メタデータ) (2025-12-16T18:51:23Z) - On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - A Multi-AI Agent System for Autonomous Optimization of Agentic AI Solutions via Iterative Refinement and LLM-Driven Feedback Loops [3.729242965449096]
本稿では,産業間におけるエージェントAIソリューションを自律的に最適化するフレームワークを提案する。
このフレームワークは、仮説を自律的に生成し、テストすることで、人間の入力なしに最適な性能を達成する。
ケーススタディでは、アウトプットの品質、妥当性、動作性が大幅に改善された。
論文 参考訳(メタデータ) (2024-12-22T20:08:04Z) - A Comprehensive Performance Study of Large Language Models on Novel AI
Accelerators [2.88634411143577]
大規模言語モデル(LLM)は、いくつかの課題に対処するための有望なアプローチと考えられている。
専門のAIアクセラレータハードウェアシステムは、最近、AIアプリケーションの高速化に利用できるようになった。
論文 参考訳(メタデータ) (2023-10-06T21:55:57Z) - PerfDetectiveAI -- Performance Gap Analysis and Recommendation in
Software Applications [0.0]
本稿では,ソフトウェアアプリケーションにおける性能ギャップ分析と提案のための概念的フレームワークPerfDetectiveAIを紹介する。
現代の機械学習(ML)と人工知能(AI)技術は、PerfDetectiveAIでパフォーマンス測定を監視し、ソフトウェアアプリケーションにおけるパフォーマンス不足の領域を特定するために使用されている。
論文 参考訳(メタデータ) (2023-06-11T02:53:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。