論文の概要: Inferring Equivalence Classes from Legacy Undocumented Embedded Binaries for ISO 26262-Compliant Testing
- arxiv url: http://arxiv.org/abs/2604.22673v1
- Date: Fri, 24 Apr 2026 15:49:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.527036
- Title: Inferring Equivalence Classes from Legacy Undocumented Embedded Binaries for ISO 26262-Compliant Testing
- Title(参考訳): ISO 26262-Compliant Testingのためのレガシー未文書組込みバイナリから等価クラスを推定する
- Authors: Marco De Luca, Domenico Francesco De Angelis, Domenico Amalfitano, Pasquale Cimmino, Anna Rita Fasolino,
- Abstract要約: 本稿では,コンパイルされたファームウェアから直接,出力指向同値クラスを推定するためのバイナリレベル手法を提案する。
オプションの処理後ステップは、理解とドキュメントをサポートするために可読な表現を生成する。
- 参考スコア(独自算出の注目度): 3.2187337255863397
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Equivalence class partitioning is a well-established test design technique mandated by safety standards such as ISO~26262 for systematic testing of safety software. In industrial practice, however, its application to legacy undocumented embedded firmware is often hindered by incomplete or outdated functional specifications. This paper proposes a binary-level methodology for inferring output-oriented equivalence classes directly from compiled firmware, without relying on source-level annotations or external documentation. The approach combines control-flow reconstruction and guided symbolic execution to analyze individual functions and group execution paths according to indistinguishable observable behavior, including return values and output parameters. An optional post-processing step produces human-readable representations to support comprehension and documentation. The methodology is evaluated in an industrial automotive context through a practitioner-based study assessing correctness and interpretability. Results indicate strong alignment with expert expectations and a positive perception of readability and usefulness for supporting function understanding and test design. These findings demonstrate the feasibility and practical relevance of binary-level equivalence class inference for systematic testing of legacy undocumented safety-embedded software.
- Abstract(参考訳): 等価クラスパーティショニング(Equivalence class partitioning)は、ISO~26262のような安全ソフトウェアを体系的にテストするための安全基準によって規定された、確立されたテスト設計技術である。
しかし、産業実践においては、レガシーな文書化されていない組み込みファームウェアへの適用は、不完全または時代遅れな機能仕様によって妨げられることが多い。
本稿では、ソースレベルのアノテーションや外部文書に頼ることなく、コンパイルされたファームウェアから直接出力指向の等価クラスを推論するためのバイナリレベルの方法論を提案する。
このアプローチは、制御フローの再構築とガイド付きシンボル実行を組み合わせることで、戻り値や出力パラメータを含む識別不能な観測可能な振る舞いに従って、個々の関数とグループ実行パスを分析する。
オプションの処理後ステップは、理解とドキュメントをサポートするために可読な表現を生成する。
本手法は, 正確性と解釈可能性を評価する実践者による研究を通じて, 産業自動車の文脈で評価される。
結果は、専門家の期待に強く一致し、可読性に対する肯定的な認識と、機能理解とテスト設計を支援するための有用性を示している。
これらの結果から,バイナリレベルの等価クラス推論が,レガシーな文書化されていない安全組み込みソフトウェアを体系的にテストするための可能性と実践的妥当性が示唆された。
関連論文リスト
- From Feelings to Metrics: Understanding and Formalizing How Users Vibe-Test LLMs [48.36707944399574]
バイブテストが実際にどのように機能するかを研究し、その後、体系的な分析を支援するために形式化する。
コーディングベンチマークの実験では、パーソナライズされたプロンプトとユーザ認識評価を組み合わせることで、どのモデルが好まれるかを変更できることがわかった。
論文 参考訳(メタデータ) (2026-04-15T17:57:08Z) - ProdCodeBench: A Production-Derived Benchmark for Evaluating AI Coding Agents [10.578603956693696]
本稿では,ProdCodeBenchを用いて実運用用ベンチマークの計算手法を提案する。
それぞれのキュレートされたサンプルは、7つのプログラミング言語にまたがる冗長なプロンプト、コミットされたコード変更、フェイル・ツー・パステストで構成されている。
4つの基礎モデルの体系的な分析は、53.2%から72.2%の範囲で解決する。
論文 参考訳(メタデータ) (2026-04-02T01:52:55Z) - UniDial-EvalKit: A Unified Toolkit for Evaluating Multi-Faceted Conversational Abilities [70.79422099851506]
対話型AIシステム評価のための統合評価ツールキットUniDial-EvalKit(UDE)を提案する。
UDEは異種データフォーマットを普遍的なスキーマに標準化し、モジュールアーキテクチャを通じて複雑な評価パイプラインを合理化し、一貫したスコアリングインターフェースの下でメートル法計算を調整する。
論文 参考訳(メタデータ) (2026-03-24T13:01:31Z) - Symfrog-512: High-Capacity Sponge-Based AEAD Cipher (1024-bit State) [0.0]
この提案には、決定論的テストベクタと再現可能なベンチマークスイートとともに、完全なリファレンス実装が含まれている。
AEADの構築は、ドメイン分離、レートとキャパシティの選択、タグ生成、参照CLIで使用される正確なファイルフォーマットなど、完全に規定されている。
報告されたパフォーマンス数値は、ドキュメンテーションされたハードウェアとコンパイラ設定の下で、組み込みのベンチマークツールによって生成される。
論文 参考訳(メタデータ) (2026-02-19T23:39:54Z) - DOCUEVAL: An LLM-based AI Engineering Tool for Building Customisable Document Evaluation Workflows [14.403156040714817]
我々は、カスタマイズ可能な評価器を構築するためのAIエンジニアリングツールであるDOCUEVALを紹介する。
DOCUEVALが評価器の工学とスケーラブルで信頼性の高い文書評価の両方を実現する方法を示す。
論文 参考訳(メタデータ) (2025-09-12T08:09:09Z) - Logic Mining from Process Logs: Towards Automated Specification and Verification [0.0]
本稿では、ワークフローを介して発見されたプロセスモデルから論理的仕様を生成するアプローチを提案する。
本研究では、品質データ、特にノイズが生成された仕様の構造とテスト容易性に与える影響について検討する。
論文 参考訳(メタデータ) (2025-06-10T09:44:19Z) - Training Language Models to Generate Quality Code with Program Analysis Feedback [66.0854002147103]
大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。
実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文 参考訳(メタデータ) (2025-05-28T17:57:47Z) - Advancing Embodied Agent Security: From Safety Benchmarks to Input Moderation [52.83870601473094]
エンボディード・エージェントは、複数のドメインにまたがって大きな潜在能力を示す。
既存の研究は主に、一般的な大言語モデルのセキュリティに重点を置いている。
本稿では, エンボディエージェントの保護を目的とした新しい入力モデレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-22T08:34:35Z) - Test Case Recommendations with Distributed Representation of Code
Syntactic Features [2.225268436173329]
本稿では,ソースコード手法とテストケースの構造的・意味的特性を利用する自動手法を提案する。
提案するアプローチは、当初、メソッドレベルのソースコードとユニットテストを分散表現に変換するためにニューラルネットワークをトレーニングする。
このモデルは、メソッドの埋め込みと以前に組み込まれたトレーニングインスタンスのコサイン類似性を計算します。
論文 参考訳(メタデータ) (2023-10-04T21:42:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。