論文の概要: Cluster-Aware Dual-Level Test Specification Generation for Large-Scale Automotive Software Requirements
- arxiv url: http://arxiv.org/abs/2606.17197v1
- Date: Mon, 15 Jun 2026 18:36:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.102508
- Title: Cluster-Aware Dual-Level Test Specification Generation for Large-Scale Automotive Software Requirements
- Title(参考訳): 大規模自動車ソフトウェア要求に対するクラスタ対応デュアルレベルテスト仕様生成
- Authors: Hazem Ayman, Menna Sedik, Kareem Mostafa, Mahmoud Soliman, Samer Saber, Ibrahim Habib,
- Abstract要約: Cluster-then-Summarize"パイプラインは、Automotive SPICE SWE.6要件を満たすテスト仕様を生成する。
本稿では,これらの制約を3段階に分けて処理する,新しい「クラスタ・then-Summarize」パイプラインを提案する。
- 参考スコア(独自算出の注目度): 0.769672852567215
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating test specifications that satisfy Automotive SPICE SWE.6 requirements becomes increasingly challenging and time-consuming as projects scale to thousands of requirements. Because this manual process often consumes weeks of engineering effort, automation becomes a critical necessity. However, standard Large Language Model (LLM) approaches struggle at scale: processing requirements individually discards vital inter-requirement dependencies, while feeding entire corpora at once exceeds context-window limits, leading to incomplete integration coverage and redundant test cases. This paper presents a novel "Cluster-then-Summarize" pipeline that addresses these limitations through three-stages. Requirements are embedded using sentence transformers and grouped using UMAP dimensionality reduction followed by HDBSCAN density-based clustering. This grouping utilizes an automatic minimum cluster size selection driven by a quality criterion combining normalized Silhouette and Calinski-Harabasz scores. A multi-level map-reduce summarization algorithm then distills each cluster into concise, domain-conformant descriptions while preserving quantitative thresholds and safety integrity levels. The pipeline exploits the derived cluster topology to generate test specifications at two levels: individual requirement verification and cluster-level integration tests that verify cross-requirement feature behavior. A nearby-cluster context mechanism provides bounded cross-feature awareness during each LLM call, and Retrieval-Augmented Generation grounds all outputs in ISO 26262 and ASPICE standards. Evaluation on automotive requirement datasets of varying scale demonstrates that the cluster-aware approach improves integration test coverage and maintains summarization fidelity compared to baseline methods while scaling efficiently to thousands of requirements.
- Abstract(参考訳): Automotive SPICE SWE.6要件を満たすテスト仕様の生成は、プロジェクトが数千の要件にスケールするにつれて、ますます難しくなり、時間がかかります。
この手動のプロセスは、しばしば何週間もエンジニアリングの労力を消費するので、自動化は重要な必需品となる。
しかし、標準のLarge Language Model(LLM)アプローチは大規模で苦労している。処理要件は個別に要求間の依存関係を破棄するが、コーパス全体を一度に供給することはコンテキストとウィンドウの制限を超え、不完全な統合カバレッジと冗長なテストケースをもたらす。
本稿では,これらの制約を3段階に分けて処理する,新しい「クラスタ・then-Summarize」パイプラインを提案する。
要求事項は文変換器を用いて埋め込み, UMAP次元の削減とHDBSCAN密度に基づくクラスタリングによってグループ化される。
このグルーピングは、正規化されたシルエットとカリンスキー・ハラバスのスコアを組み合わせた品質基準によって駆動される自動最小クラスタサイズ選択を利用する。
マルチレベルマップ・リデュース・サマリゼーションアルゴリズムは、各クラスタを定量的なしきい値と安全性を保ちながら、簡潔でドメインに適合した記述に蒸留する。
パイプラインは、派生したクラスタトポロジを利用して、2つのレベルでテスト仕様を生成する。
近隣クラスタのコンテキストメカニズムは、各LCM呼び出し中に境界付きクロスフィーチャー認識を提供し、Retrieval-Augmented GenerationはISO 26262とASPICE標準のすべての出力を根拠にしている。
様々なスケールの自動車要求データセットの評価は、クラスタ認識アプローチが統合テストカバレッジを改善し、ベースライン手法と比較して要約フィリティを維持しながら、数千の要求に効率的にスケーリングしていることを示す。
関連論文リスト
- BLO-Inst: Bi-Level Optimization Based Alignment of YOLO and SAM for Robust Instance Segmentation [26.763780360661965]
BLO-Instは、双方向の最適化によって検出とセグメンテーションの目的を整列する統合フレームワークである。
BLO-Instは、一般的な医療領域におけるタスクの標準ベースラインよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-01-29T17:58:55Z) - ESMC: MLLM-Based Embedding Selection for Explainable Multiple Clustering [79.69917150582633]
MLLM(Multi-modal large language model)は、ユーザ主導のクラスタリングを実現するために利用することができる。
本手法はまず,MLLMのテキストトークンの隠蔽状態が対応する特徴と強く関連していることを明らかにする。
また、擬似ラベル学習を付加した軽量クラスタリングヘッドを採用し、クラスタリング精度を大幅に向上させた。
論文 参考訳(メタデータ) (2025-11-30T04:36:51Z) - GLiClass: Generalist Lightweight Model for Sequence Classification Tasks [49.2639069781367]
本稿では,シーケンス分類タスクにGLiNERアーキテクチャを適用する新しい手法であるGLiClassを提案する。
提案手法は,ゼロショットおよび少数ショット学習シナリオに必要な柔軟性を維持しつつ,埋め込み方式に匹敵する高い精度と効率を実現する。
論文 参考訳(メタデータ) (2025-08-11T06:22:25Z) - Edge-Assisted Collaborative Fine-Tuning for Multi-User Personalized Artificial Intelligence Generated Content (AIGC) [38.59865959433328]
クラウドベースのソリューションは計算を助けるが、プライバシのリスク、パーソナライズ効率、通信コストに対処するのに不足することが多い。
本稿では,クラスタを意識した新しい階層型統合フレームワークを提案する。
このフレームワークは,スケーラブルなマルチユーザパーソナライズAIGCサービスの実用性を維持しつつ,収束の加速を実現する。
論文 参考訳(メタデータ) (2025-08-06T06:07:24Z) - High-Throughput LLM inference on Heterogeneous Clusters [6.11367906161332]
異種クラスタ上での大規模言語モデル(LLM)推論には,2つの大きな課題がある。
さまざまなインスタンスの異なる処理能力を十分に考慮した,インスタンス間のリクエストスケジュールの新たなメカニズムが提案されている。
大規模な実験により、提案されたスケジューラは、2つの異種クラスタ上で122.5%と33.6%のスループットを向上させることが示された。
論文 参考訳(メタデータ) (2025-04-18T08:59:11Z) - Problem-oriented AutoML in Clustering [2.541080349729282]
Problem-oriented AutoML in Clustering (PoAC)フレームワークは、クラスタリングタスクを自動化する新しいフレキシブルなアプローチを導入している。
PoACはクラスタリング問題、CVI、メタ機能の間の動的接続を確立し、ユーザーはこれらのコンポーネントをカスタマイズできる。
PoACはアルゴリズムに依存しないため、追加のデータや再トレーニングを必要とせずに、異なるクラスタリング問題にシームレスに適応する。
論文 参考訳(メタデータ) (2024-09-24T16:25:53Z) - Revisiting Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [85.51611950757643]
IAC (Instance-Adaptive Clustering, インスタンス適応クラスタリング) を提案する。
IACは$ MathcalO(n, textpolylog(n) $の計算複雑性を維持しており、大規模問題に対してスケーラブルで実用的なものである。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - Cluster-Former: Clustering-based Sparse Transformer for Long-Range
Dependency Encoding [90.77031668988661]
Cluster-Formerはクラスタリングベースの新しいスパーストランスであり、チャンクされたシーケンスにまたがって注意を向ける。
提案されたフレームワークは、Sliding-Window LayerとCluster-Former Layerの2つのユニークなタイプのTransformer Layerにピボットされている。
実験によると、Cluster-Formerはいくつかの主要なQAベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-09-13T22:09:30Z) - Improving Problem Identification via Automated Log Clustering using
Dimensionality Reduction [0.8122270502556374]
我々は、同じ理由で失敗したランニングログを自動的にグループ化することで、より効果的に扱えるようにする。
システムログの問題を特定するために開発されたアプローチは、継続的デプロイメントログの問題を特定するために一般化されますか?
クラスタリングアルゴリズムでクラスタをマージするための基準は、品質にどのように影響しますか?
論文 参考訳(メタデータ) (2020-09-07T17:26:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。