論文の概要: Workflow-Level Design Principles for Trustworthy GenAI in Automotive System Engineering
- arxiv url: http://arxiv.org/abs/2602.19614v1
- Date: Mon, 23 Feb 2026 09:02:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.738941
- Title: Workflow-Level Design Principles for Trustworthy GenAI in Automotive System Engineering
- Title(参考訳): 自動車システム工学における信頼できるGenAIのためのワークフローレベル設計原則
- Authors: Chih-Hong Cheng, Brian Hsuan-Cheng Liao, Adam Molin, Hasan Esen,
- Abstract要約: 我々は、モノリシックな"ビッグバン"が大きな仕様の重要な変更を見逃してしまうことを示しています。
要求デルタをSysML v2モデルに伝達し、コンパイルと静的解析を通じて更新を検証する。
- 参考スコア(独自算出の注目度): 3.6445317030389233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The adoption of large language models in safety-critical system engineering is constrained by trustworthiness, traceability, and alignment with established verification practices. We propose workflow-level design principles for trustworthy GenAI integration and demonstrate them in an end-to-end automotive pipeline, from requirement delta identification to SysML v2 architecture update and re-testing. First, we show that monolithic ("big-bang") prompting misses critical changes in large specifications, while section-wise decomposition with diversity sampling and lightweight NLP sanity checks improves completeness and correctness. Then, we propagate requirement deltas into SysML v2 models and validate updates via compilation and static analysis. Additionally, we ensure traceable regression testing by generating test cases through explicit mappings from specification variables to architectural ports and states, providing practical safeguards for GenAI used in safety-critical automotive engineering.
- Abstract(参考訳): 安全クリティカルなシステムエンジニアリングにおける大規模言語モデルの採用は、信頼性、トレーサビリティ、確立された検証プラクティスとの整合性によって制約される。
我々は、信頼できるGenAI統合のためのワークフローレベルの設計原則を提案し、要求デルタ識別からSysML v2アーキテクチャのアップデートと再テストまで、エンドツーエンドの自動車パイプラインでそれらを実証する。
まず、モノリシックな"ビッグバン"が大きな仕様の重要な変更を見逃し、多様性サンプリングと軽量なNLPの正当性チェックによる分割分解によって完全性と正当性が向上することを示す。
次に、要求デルタをSysML v2モデルに伝達し、コンパイルと静的解析を通じて更新を検証する。
さらに、仕様変数からアーキテクチャポートや状態への明示的なマッピングを通じてテストケースを生成することで、トレース可能な回帰テストを保証する。
関連論文リスト
- Veri-Sure: A Contract-Aware Multi-Agent Framework with Temporal Tracing and Formal Verification for Correct RTL Code Generation [4.723302382132762]
シリコングレードの正しさは、 (i) シミュレーション中心の評価の限られたカバレッジと信頼性、 (ii) 回帰と修復幻覚、 (iii) エージェントハンドオフ間で意図が再解釈される意味的ドリフトによってボトルネックが残っている。
エージェントの意図を整合させる設計契約を確立するマルチエージェントフレームワークであるVeri-Sureを提案する。
論文 参考訳(メタデータ) (2026-01-27T16:10:23Z) - AI-NativeBench: An Open-Source White-Box Agentic Benchmark Suite for AI-Native Systems [52.65695508605237]
我々は、Model Context Protocol(MCP)とAgent-to-Agent(A2A)標準に基づいて、アプリケーション中心でホワイトボックスのAI-NativeベンチマークスイートであるAI-NativeBenchを紹介する。
エージェントスパンを分散トレース内の第一級市民として扱うことにより,本手法は,単純な機能以上の工学的特性の粒度解析を可能にする。
この研究は、モデル能力の測定から信頼性の高いAI-Nativeシステムへの移行を導く最初の体系的な証拠を提供する。
論文 参考訳(メタデータ) (2026-01-14T11:32:07Z) - STAF: Leveraging LLMs for Automated Attack Tree-Based Security Test Generation [3.283937504286784]
本稿では,セキュリティテストケースの自動生成のための新しいアプローチであるSTAF(Security Test Automation Framework)を紹介する。
自動テストフレームワークとの統合とともに、賢明で実行可能な自動車セキュリティテストスイートを生成するために必要な要素とプロセスを示します。
論文 参考訳(メタデータ) (2025-09-24T14:46:42Z) - Generating Automotive Code: Large Language Models for Software Development and Verification in Safety-Critical Systems [21.595590728109226]
このフレームワークは、C++などの言語でコード生成を自動化するために、LLM(Large Language Models)を使用している。
フィードバック駆動パイプラインは、安全基準に準拠したテスト、シミュレーション、検証の統合を保証する。
論文 参考訳(メタデータ) (2025-06-04T15:01:59Z) - Training Language Models to Generate Quality Code with Program Analysis Feedback [66.0854002147103]
大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。
実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文 参考訳(メタデータ) (2025-05-28T17:57:47Z) - SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models [63.71984266104757]
我々は、構造化されていない知識と構造化されていない知識の両方を取り入れることで、MLLMベースの自動運転を強化するフレームワークであるSafeAutoを提案する。
安全知識を明示的に統合するため,交通ルールを一階述語論理に変換する推論コンポーネントを開発した。
我々のマルチモーダル検索・拡張生成モデルは、過去の運転経験から学ぶために、ビデオ、制御信号、環境特性を活用する。
論文 参考訳(メタデータ) (2025-02-28T21:53:47Z) - A Progressive Transformer for Unifying Binary Code Embedding and Knowledge Transfer [15.689556592544667]
本稿では,バイナリコード埋め込みのための新しいトランスフォーマーベースの手法であるProTSTを紹介する。
ProTSTは、独特の木のような構造に基づく階層的なトレーニングプロセスを採用している。
その結果, ProTSTは従来の2段階トレーニングに比べて14.8%改善した(F1, MRR, Recall@1)。
論文 参考訳(メタデータ) (2024-12-15T13:04:29Z) - Fast-Slow Test-Time Adaptation for Online Vision-and-Language Navigation [67.18144414660681]
オンラインビジョン・アンド・ランゲージナビゲーション(VLN)のためのFSTTA(Fast-Slow Test-Time Adaptation)アプローチを提案する。
提案手法は,4つのベンチマークにおいて顕著な性能向上を実現する。
論文 参考訳(メタデータ) (2023-11-22T07:47:39Z) - A General Framework for Verification and Control of Dynamical Models via Certificate Synthesis [54.959571890098786]
システム仕様を符号化し、対応する証明書を定義するためのフレームワークを提供する。
コントローラと証明書を形式的に合成する自動化手法を提案する。
我々のアプローチは、ニューラルネットワークの柔軟性を利用して、制御のための安全な学習の幅広い分野に寄与する。
論文 参考訳(メタデータ) (2023-09-12T09:37:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。