論文の概要: Investigating Software Aging in LLM-Generated Software Systems
- arxiv url: http://arxiv.org/abs/2510.24188v1
- Date: Tue, 28 Oct 2025 08:50:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:36.910454
- Title: Investigating Software Aging in LLM-Generated Software Systems
- Title(参考訳): LLM生成ソフトウェアシステムにおけるソフトウェア老化の調査
- Authors: César Santos, Ermeson Andrade, Roberto Natella,
- Abstract要約: 本稿では,Large Language Models (LLM) によるアプリケーションにおけるソフトウェア老化現象を実験的に検討する。
BoltプラットフォームとBaxbenchからの標準化されたプロンプトを使用して、4つのサービス指向アプリケーションを生成し、50時間の負荷テストを実施しました。
その結果, 進行記憶の増大, 応答時間の増加, 性能不安定など, ソフトウェア老化の顕著な証拠が示された。
- 参考スコア(独自算出の注目度): 2.241579575562525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatically generated software, especially code produced by Large Language Models (LLMs), is increasingly adopted to accelerate development and reduce manual effort. However, little is known about the long-term reliability of such systems under sustained execution. In this paper, we experimentally investigate the phenomenon of software aging in applications generated by LLM-based tools. Using the Bolt platform and standardized prompts from Baxbench, we generated four service-oriented applications and subjected them to 50-hour load tests. Resource usage, response time, and throughput were continuously monitored to detect degradation patterns. The results reveal significant evidence of software aging, including progressive memory growth, increased response time, and performance instability across all applications. Statistical analyzes confirm these trends and highlight variability in the severity of aging according to the type of application. Our findings show the need to consider aging in automatically generated software and provide a foundation for future studies on mitigation strategies and long-term reliability evaluation.
- Abstract(参考訳): 自動生成ソフトウェア、特にLarge Language Models (LLMs) によって生成されるコードは、開発を加速し、手作業を減らすためにますます採用されている。
しかし、持続実行中のシステムの長期的な信頼性についてはほとんど分かっていない。
本稿では,LSMツールによるアプリケーションにおけるソフトウェア老化現象を実験的に検討する。
BoltプラットフォームとBaxbenchからの標準化されたプロンプトを使用して、4つのサービス指向アプリケーションを生成し、50時間の負荷テストを実施しました。
リソース使用量、応答時間、スループットを継続的に監視し、劣化パターンを検出する。
その結果、進行記憶の増大、応答時間の増加、全アプリケーションのパフォーマンス不安定性など、ソフトウェア老化の顕著な証拠が明らかになった。
統計分析によってこれらの傾向が確認され、アプリケーションの種類に応じて老化の重大さの変動が強調される。
本研究は,自動生成ソフトウェアにおける老朽化を検討することの必要性を示し,今後の緩和戦略と長期信頼性評価の基盤を提供する。
関連論文リスト
- Training Language Models to Generate Quality Code with Program Analysis Feedback [66.0854002147103]
大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。
実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文 参考訳(メタデータ) (2025-05-28T17:57:47Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - Breaking the Loop: Detecting and Mitigating Denial-of-Service Vulnerabilities in Large Language Models [4.046135652393372]
LLM(Large Language Models)は、教育、ソフトウェア開発、医療、エンターテイメント、法律サービスなど、幅広い分野のアプリケーションに不可欠な、高度なテキスト理解と生成を持つ。
モデルが同じあるいは同じ出力を繰り返し生成するリカレントジェネレーションは、レイテンシの増加と潜在的なDoS(DoS)脆弱性を引き起こす。
本稿では,LLama-3 や GPT-4o などの著名な LLM における再帰発生シナリオを効率よく同定するブラックボックス進化アルゴリズムである RecurrentGenerator を提案する。
論文 参考訳(メタデータ) (2025-03-01T09:32:17Z) - Adversarial Reasoning at Jailbreaking Time [49.70772424278124]
大規模言語モデル(LLM)は、より有能で広く普及している。
テスト時間計算の標準化, 測定, スケーリングの最近の進歩は, ハードタスクにおける高い性能を達成するためにモデルを最適化するための新しい手法を提案する。
本稿では、これらの進歩をジェイルブレイクモデルに応用し、協調LDMから有害な応答を誘発する。
論文 参考訳(メタデータ) (2025-02-03T18:59:01Z) - The Potential of LLMs in Automating Software Testing: From Generation to Reporting [0.0]
手動テストは効果的だが、時間とコストがかかり、自動化メソッドの需要が増大する。
大規模言語モデル(LLM)の最近の進歩は、ソフトウェア工学に大きな影響を与えている。
本稿では,人間の介入を減らし,テスト効率を向上させるため,LSMを用いた自動ソフトウェアテストに対するエージェント指向アプローチについて検討する。
論文 参考訳(メタデータ) (2024-12-31T02:06:46Z) - Agent-Driven Automatic Software Improvement [55.2480439325792]
本提案は,Large Language Models (LLMs) を利用したエージェントの展開に着目して,革新的なソリューションの探求を目的とする。
継続的学習と適応を可能にするエージェントの反復的性質は、コード生成における一般的な課題を克服するのに役立ちます。
我々は,これらのシステムにおける反復的なフィードバックを用いて,エージェントの基盤となるLLMをさらに微調整し,自動化されたソフトウェア改善のタスクに整合性を持たせることを目指している。
論文 参考訳(メタデータ) (2024-06-24T15:45:22Z) - Analyzing the Influence of Processor Speed and Clock Speed on Remaining Useful Life Estimation of Software Systems [0.9831489366502301]
本研究は,オペレーティングシステムやクロック速度などの環境特性の変化がソフトウェアにおけるRUL推定に与える影響を評価するために,解析を拡張した。
検出は、制御されたテストベッドの実際のパフォーマンスデータを用いて厳格に検証され、予測モデル生成データと比較される。
この調査は、ソフトウェアのメンテナンスと最適化戦略に実用的な知識をもたらす。
論文 参考訳(メタデータ) (2023-09-22T04:46:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。