Fugu-MT 論文翻訳(概要): Advancing Software Quality: A Standards-Focused Review of LLM-Based Assurance Techniques

論文の概要: Advancing Software Quality: A Standards-Focused Review of LLM-Based Assurance Techniques

arxiv url: http://arxiv.org/abs/2505.13766v1
Date: Mon, 19 May 2025 22:49:30 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-21 14:49:52.563148
Title: Advancing Software Quality: A Standards-Focused Review of LLM-Based Assurance Techniques
Title（参考訳）: ソフトウェア品質の向上: LLMベースの保証手法の基準に焦点をあてたレビュー
Authors: Avinash Patil,
Abstract要約: 大規模言語モデル(LLM)は、既存のソフトウェア品質保証プロセスを強化する新しい機会を提供する。 LLMは要件分析、コードレビュー、テスト生成、コンプライアンスチェックなどのタスクを自動化することができる。本稿では,LLMに基づくSQA手法と認識基準の交差について検討する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Software Quality Assurance (SQA) is critical for delivering reliable, secure, and efficient software products. The Software Quality Assurance Process aims to provide assurance that work products and processes comply with predefined provisions and plans. Recent advancements in Large Language Models (LLMs) present new opportunities to enhance existing SQA processes by automating tasks like requirement analysis, code review, test generation, and compliance checks. Simultaneously, established standards such as ISO/IEC 12207, ISO/IEC 25010, ISO/IEC 5055, ISO 9001/ISO/IEC 90003, CMMI, and TMM provide structured frameworks for ensuring robust quality practices. This paper surveys the intersection of LLM-based SQA methods and these recognized standards, highlighting how AI-driven solutions can augment traditional approaches while maintaining compliance and process maturity. We first review the foundational software quality standards and the technical fundamentals of LLMs in software engineering. Next, we explore various LLM-based SQA applications, including requirement validation, defect detection, test generation, and documentation maintenance. We then map these applications to key software quality frameworks, illustrating how LLMs can address specific requirements and metrics within each standard. Empirical case studies and open-source initiatives demonstrate the practical viability of these methods. At the same time, discussions on challenges (e.g., data privacy, model bias, explainability) underscore the need for deliberate governance and auditing. Finally, we propose future directions encompassing adaptive learning, privacy-focused deployments, multimodal analysis, and evolving standards for AI-driven software quality.
Abstract（参考訳）: ソフトウェア品質保証(Software Quality Assurance, SQA)は、信頼性が高く、セキュアで、効率的なソフトウェア製品を提供するために重要である。ソフトウェア品質保証プロセス(Software Quality Assurance Process)は、製品やプロセスが事前に定義された規定や計画に従っていることを保証することを目的としている。 LLM(Large Language Models)の最近の進歩は、要求分析、コードレビュー、テスト生成、コンプライアンスチェックなどのタスクを自動化することで、既存のSQAプロセスを強化する新たな機会を提供する。同時に、ISO/IEC 12207、ISO/IEC 25010、ISO/IEC 5055、ISO 9001/ISO/IEC 90003、CMMI、TMMといった標準は、堅牢な品質慣行を保証するための構造化されたフレームワークを提供する。本稿では,LLMをベースとしたSQA手法の共通点と認識基準を調査し,コンプライアンスとプロセスの成熟度を維持しつつ,AI駆動型ソリューションが従来のアプローチをどのように強化するかを明らかにする。まず,ソフトウェア工学におけるLCMの基礎となるソフトウェア品質基準と技術的基礎について概観する。次に、要件検証、欠陥検出、テスト生成、ドキュメント保守など、LCMベースの様々なSQAアプリケーションについて検討する。次に、これらのアプリケーションを主要なソフトウェア品質フレームワークにマッピングし、それぞれの標準内の特定の要件やメトリクスにどう対処できるかを説明します。実証ケーススタディとオープンソースイニシアチブは、これらの手法の実用可能性を示している。同時に、課題(データプライバシ、モデルバイアス、説明可能性など)に関する議論は、慎重なガバナンスと監査の必要性を浮き彫りにしている。最後に、適応学習、プライバシを重視したデプロイメント、マルチモーダル分析、AI駆動ソフトウェア品質の進化標準を含む今後の方向性を提案する。

関連論文リスト

Leveraging LLMs for Formal Software Requirements -- Challenges and Prospects [0.0]
VERIFAI1は、このギャップを埋めるための自動化および半自動化アプローチを調査することを目的としている。本論文では, 課題の繰り返しと今後の研究方向性を明らかにするために, 関連文献の予備的な合成について述べる。
論文参考訳（メタデータ） (2025-07-18T19:15:50Z)
MERA Code: A Unified Framework for Evaluating Code Generation Across Tasks [56.34018316319873]
我々は,最新のLLMをロシア語で評価するためのベンチマークであるMERA Codeを提案する。このベンチマークには、8つのプログラミング言語にまたがる11の評価タスクが含まれている。我々はオープンなLLMとフロンティアAPIモデルを評価し、非英語言語における実用的なコーディングタスクの観点からそれらの制限を分析した。
論文参考訳（メタデータ） (2025-07-16T14:31:33Z)
OpenUnlearning: Accelerating LLM Unlearning via Unified Benchmarking of Methods and Metrics [101.78963920333342]
我々は,大規模言語モデル(LLM)のアンラーニング手法とメトリクスをベンチマークするための標準フレームワークであるOpenUnlearningを紹介する。 OpenUnlearningは、9つのアンラーニングアルゴリズムと16のさまざまな評価を3つの主要なベンチマークで統合する。また、多様なアンラーニング手法をベンチマークし、広範囲な評価スイートとの比較分析を行う。
論文参考訳（メタデータ） (2025-06-14T20:16:37Z)
Software Bill of Materials in Software Supply Chain Security A Systematic Literature Review [0.0]
SBOM(Software Bill of Materials)は、ソフトウェアサプライチェーン(Software supply chains, SSC)の確保に欠かせないツールであると考えられている。この体系的な文献レビューは、現在SBOMがSSCセキュリティの強化にどのように使われているかを評価するために、40の査読された研究から証拠を合成する。生成ツール、データプライバシ、フォーマット/標準化、共有/配布、コスト/オーバーヘッド、脆弱性のエクスプロイラビリティ、メンテナンス、分析ツール、偽陽性、隠されたパッケージ、改ざんなどである。
論文参考訳（メタデータ） (2025-06-04T02:49:04Z)
Training Language Models to Generate Quality Code with Program Analysis Feedback [66.0854002147103]
大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文参考訳（メタデータ） (2025-05-28T17:57:47Z)
AGENTIF: Benchmarking Instruction Following of Large Language Models in Agentic Scenarios [51.46347732659174]
LLM(Large Language Models)は、現実世界のエージェントアプリケーションにおいて高度な機能を示す。 AgentIFは、エージェントシナリオでLLM命令に従う能力を体系的に評価する最初のベンチマークである。
論文参考訳（メタデータ） (2025-05-22T17:31:10Z)
Assessing and Advancing Benchmarks for Evaluating Large Language Models in Software Engineering Tasks [13.736881548660422]
大規模言語モデル(LLM)は、ソフトウェア工学(SE)で人気が高まっている。この分野での有効性を理解するためには有効性の評価が不可欠です本稿では、191ベンチマークの徹底的なレビューを行い、どのベンチマークが利用可能か、どのようにベンチマークを構築しているか、これらのベンチマークの将来展望の3つの主要な側面に対処する。
論文参考訳（メタデータ） (2025-05-13T18:45:10Z)
Requirements-Driven Automated Software Testing: A Systematic Review [13.67495800498868]
本研究では,REDAST研究の現状を整理し,今後の方向性について考察する。この体系的な文献レビュー(SLR)は、要求入力、変換技術、テスト結果、評価方法、既存の制限を分析して、REDASTの展望を探求する。
論文参考訳（メタデータ） (2025-02-25T23:13:09Z)
Quality Assurance Practices in Agile Methodology [0.0]
ソフトウェアの複雑さは日々増加しており、ソフトウェアプロダクトの検証の必要性も増している。ソフトウェアメトリクスを開発プロセスやソフトウェア製品に適用するプラクティスは重要なタスクであり、学習と規律を必要とする。
論文参考訳（メタデータ） (2024-11-07T19:45:40Z)
Leveraging LLMs for the Quality Assurance of Software Requirements [40.55044936397561]
ISO 29148標準に従って,ソフトウェア要件の品質特性を評価するために,LLM(Large Language Model)の能力を導入,評価する。本稿では,LCMが要求をどう評価するか,その意思決定プロセスを説明するとともに,要件の改良版を提案する能力について考察する。
論文参考訳（メタデータ） (2024-08-20T14:17:50Z)
Design of a Quality Management System based on the EU Artificial Intelligence Act [0.0]
EU AI Actは、リスクの高いAIシステムのプロバイダとデプロイ者が品質管理システム(QMS)を確立することを義務付けている。本稿では,マイクロサービス・ソフトウェア・アズ・ア・サービス・ウェブ・アプリケーションとしてのQMSの設計コンセプトとプロトタイプを紹介する。
論文参考訳（メタデータ） (2024-08-08T12:14:02Z)
Agent-Driven Automatic Software Improvement [55.2480439325792]
本提案は,Large Language Models (LLMs) を利用したエージェントの展開に着目して,革新的なソリューションの探求を目的とする。継続的学習と適応を可能にするエージェントの反復的性質は、コード生成における一般的な課題を克服するのに役立ちます。我々は,これらのシステムにおける反復的なフィードバックを用いて,エージェントの基盤となるLLMをさらに微調整し,自動化されたソフトウェア改善のタスクに整合性を持たせることを目指している。
論文参考訳（メタデータ） (2024-06-24T15:45:22Z)
Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化は機械学習アプリケーションにおいて重要な要素である。最新のUQベースラインの集合を実装した新しいベンチマークを導入する。我々は、11タスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も効果的なアプローチを特定した。
論文参考訳（メタデータ） (2024-06-21T20:06:31Z)
Towards Generating Executable Metamorphic Relations Using Large Language Models [46.26208489175692]
大規模言語モデル(LLM)を用いた要件から実行可能なMRを自動的に抽出する手法を提案する。提案手法の有効性を評価するため,シーメンス・インダストリー・ソフトウェアと共同で質問紙調査を行った。
論文参考訳（メタデータ） (2024-01-30T13:52:47Z)
Technology Readiness Levels for AI & ML [79.22051549519989]
機械学習システムの開発は、現代的なツールで容易に実行できるが、プロセスは通常急いで、エンドツーエンドで実行される。エンジニアリングシステムは、高品質で信頼性の高い結果の開発を効率化するために、明確に定義されたプロセスとテスト標準に従います。我々は、機械学習の開発と展開のための実証されたシステムエンジニアリングアプローチを提案する。
論文参考訳（メタデータ） (2020-06-21T17:14:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。