論文の概要: Automated Concern Extraction from Textual Requirements of Cyber-Physical Systems: A Multi-solution Study
- arxiv url: http://arxiv.org/abs/2510.19237v1
- Date: Wed, 22 Oct 2025 04:44:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.123935
- Title: Automated Concern Extraction from Textual Requirements of Cyber-Physical Systems: A Multi-solution Study
- Title(参考訳): サイバー物理システムのテクスチャ要件からの自動抽出:マルチソリューションスタディ
- Authors: Dongming Jin, Zhi Jin, Xiaohong Chen, Zheng Fang, Linyu Li, Shengxin Zhao, Chuihui Wang, Hongbin Xiao,
- Abstract要約: サイバー物理システム(CPS)は情報空間と物理世界の深い統合によって特徴づけられる。
要求事項抽出のための自動化されたソリューションは、要件エンジニアの負担を軽減するために提案されている。
提案するReqEBenchは,12の現実世界のCPSからの2,721の要求を含む,新たなCPS要求事項抽出ベンチマークである。
- 参考スコア(独自算出の注目度): 32.72367544006539
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cyber-physical systems (CPSs) are characterized by a deep integration of the information space and the physical world, which makes the extraction of requirements concerns more challenging. Some automated solutions for requirements concern extraction have been proposed to alleviate the burden on requirements engineers. However, evaluating the effectiveness of these solutions, which relies on fair and comprehensive benchmarks, remains an open question. To address this gap, we propose ReqEBench, a new CPSs requirements concern extraction benchmark, which contains 2,721 requirements from 12 real-world CPSs. ReqEBench offers four advantages. It aligns with real-world CPSs requirements in multiple dimensions, e.g., scale and complexity. It covers comprehensive concerns related to CPSs requirements. It undergoes a rigorous annotation process. It covers multiple application domains of CPSs, e.g., aerospace and healthcare. We conducted a comparative study on three types of automated requirements concern extraction solutions and revealed their performance in real-world CPSs using our ReqEBench. We found that the highest F1 score of GPT-4 is only 0.24 in entity concern extraction. We further analyze failure cases of popular LLM-based solutions, summarize their shortcomings, and provide ideas for improving their capabilities. We believe ReqEBench will facilitate the evaluation and development of automated requirements concern extraction.
- Abstract(参考訳): サイバー物理システム(CPS)は、情報空間と物理世界の深い統合によって特徴付けられ、要求事項の抽出がより困難になる。
要求事項抽出のための自動化されたソリューションは、要件エンジニアの負担を軽減するために提案されている。
しかしながら、公平で包括的なベンチマークに依存するこれらのソリューションの有効性を評価することは、未解決の問題である。
このギャップを解決するために、12の現実世界のCPSからの2,721の要求を含む新しいCPSs要求事項抽出ベンチマークであるReqEBenchを提案する。
ReqEBenchには4つの利点がある。
実世界のCPSの要件を,例えばスケールや複雑性など,複数の次元で整合させるのです。
CPSの要求に関する包括的な懸念をカバーしている。
厳密なアノテーションプロセスを実行します。
CPS、例えば、航空宇宙、ヘルスケアの複数のアプリケーションドメインをカバーする。
我々は,3種類の自動要件抽出ソリューションの比較研究を行い,ReqEBenchを用いて実環境におけるCPSの性能を明らかにした。
その結果, GPT-4のF1スコアが最も高いのは, 実体的関心事抽出の0.24点であることがわかった。
さらに、一般的なLCMベースのソリューションの障害事例を分析し、その欠点を要約し、その能力を改善するためのアイデアを提供する。
ReqEBenchは、自動要求事項抽出の評価と開発を容易にするだろうと考えています。
関連論文リスト
- How Good Are Synthetic Requirements ? Evaluating LLM-Generated Datasets for AI4RE [0.5156484100374059]
本稿では,合成要求データを生成するための改良された製品ラインアプローチを提案する。
提案する4つの研究課題は,データ品質にどのような影響を及ぼすか,また,自動的なプロンプト最適化,およびポストジェネレーションのキュレーションについて検討する。
以上の結果から, 人工的な要件は, 特定のタスクにおいて, 人為的な要件と一致し, より優れる可能性が示唆された。
論文 参考訳(メタデータ) (2025-06-26T10:52:07Z) - Federated Learning for Cyber Physical Systems: A Comprehensive Survey [49.54239703000928]
近年,フェデレートラーニング(FL)が普及している。
この記事では、FLが、インテリジェントトランスポートシステム、サイバーセキュリティサービス、スマートシティ、スマートヘルスケアソリューションなど、重要なCPSアプリケーションでどのように利用されるのかを精査する。
論文 参考訳(メタデータ) (2025-05-08T01:17:15Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - Creating Automated Quantum-Assisted Solutions for Optimization Problems [0.0]
ソリューションパスを探索し、自動化し、評価できるフレームワークであるQuaST決定ツリーを提案する。
私たちのセットアップはモジュール化され、高度に構造化され、柔軟性があり、どんな準備や前処理、後処理のステップも含められます。
論文 参考訳(メタデータ) (2024-09-30T16:59:14Z) - An Evaluation of Requirements Modeling for Cyber-Physical Systems via LLMs [18.657412233247328]
問題フレームアプローチは、コンポーネントの特性と相互接続をキャプチャすることで、現実世界の問題を形成することを目的としている。
大規模言語モデル(LLM)は、自然言語理解において優れた性能を示している。
論文 参考訳(メタデータ) (2024-08-05T13:20:14Z) - MMAU: A Holistic Benchmark of Agent Capabilities Across Diverse Domains [54.117238759317004]
大規模マルチタスクエージェント理解(MMAU)ベンチマークは、複雑な環境設定を必要としない包括的なオフラインタスクを特徴としている。
ツールユース、DAG(Directed Acyclic Graph)QA、データサイエンスと機械学習コーディング、コンテストレベルのプログラミング、数学の5分野にわたるモデルを評価する。
3K以上の異なるプロンプトを含む20の精巧に設計されたタスクにより、MMAUはLLMエージェントの強度と限界を評価するための包括的なフレームワークを提供する。
論文 参考訳(メタデータ) (2024-07-18T00:58:41Z) - EWEK-QA: Enhanced Web and Efficient Knowledge Graph Retrieval for Citation-based Question Answering Systems [103.91826112815384]
引用ベースのQAシステムは2つの欠点に悩まされている。
彼らは通常、抽出された知識の源としてWebにのみ依存し、外部の知識ソースを追加することで、システムの効率を損なう。
システムに供給された知識の内容を充実させるため,Web と 効率的な知識グラフ (KG) 検索ソリューション (EWEK-QA) を提案する。
論文 参考訳(メタデータ) (2024-06-14T19:40:38Z) - Classification, Challenges, and Automated Approaches to Handle Non-Functional Requirements in ML-Enabled Systems: A Systematic Literature Review [10.09767622002672]
本稿では,これまで検討されてきた非機能要件の分類と,ML対応システムでモデルを開発する上で直面する課題の2つを対象とする体系的文献レビューを提案する。
本報告では,30種類の非機能要件を同定し,これらを6つの主要クラスに分類した。
また、23以上のソフトウェアエンジニアリング課題のカタログを編集し、機械学習対応システムの非機能要件についてさらなる研究を行ないました。
論文 参考訳(メタデータ) (2023-11-29T09:45:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。