論文の概要: Compiler Bugs Detection in Logic Synthesis Tools via Linear Upper Confidence Bound
- arxiv url: http://arxiv.org/abs/2509.01149v1
- Date: Mon, 01 Sep 2025 05:54:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.555041
- Title: Compiler Bugs Detection in Logic Synthesis Tools via Linear Upper Confidence Bound
- Title(参考訳): 線形上部信頼境界を用いた論理合成ツールにおけるコンパイラバグ検出
- Authors: Hui Zeng, Zhihao Xu, Hui Li, Siwen Wang, Qian Ma,
- Abstract要約: Lin-Hunterは、HDLテストケースの多様性とFPGAロジック合成ツールバリデーションの効率を高めるために設計された新しいテストフレームワークである。
これまで報告されていない10の欠陥を含む18のユニークなバグを発見し、公式開発者によって確認された。
- 参考スコア(独自算出の注目度): 11.123007674634936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Field-Programmable Gate Arrays (FPGAs) play an indispensable role in Electronic Design Automation (EDA), translating Register-Transfer Level (RTL) designs into gate-level netlists. The correctness and reliability of FPGA logic synthesis tools are critically important, as unnoticed bugs in these tools may infect the final hardware implementations. However, recent approaches often rely heavily on random selection strategies, limiting the structural diversity of the generated HDL test cases and resulting in inadequate exploration of the tool's feature space. To address this limitation, we propose Lin-Hunter, a novel testing framework designed to systematically enhance the diversity of HDL test cases and the efficiency of FPGA logic synthesis tool validation. Specifically, Lin-Hunter introduces a principled set of metamorphic transformation rules to generate functionally equivalent yet structurally diverse HDL test case variants, effectively addressing the limited diversity of existing test inputs. To further enhance bug discovery efficiency, Lin-Hunter integrates an adaptive strategy selection mechanism based on the Linear Upper Confidence Bound (LinUCB) method. This method leverages feedback from synthesis logs of previously executed test cases to dynamically prioritize transformation strategies that have empirically demonstrated a higher likelihood of triggering synthesis bugs. Comprehensive experiments conducted over a three-month period demonstrate the practical effectiveness of Lin-Hunter. Our method has discovered 18 unique bugs, including 10 previously unreported defects, which have been confirmed by official developers. Moreover, our method outperforms state-of-the-art testing methods in both test-case diversity and bug-discovery efficiency.
- Abstract(参考訳): FPGA (Field-Programmable Gate Arrays) は電子設計自動化 (Electronic Design Automation, EDA) において必要不可欠な役割を担い、レジスター-トランスファーレベル (RTL) の設計をゲートレベルのネットリストに変換する。
FPGAロジック合成ツールの正確性と信頼性は、これらのツールの未確認バグが最終的なハードウェア実装に影響を及ぼす可能性があるため、非常に重要である。
しかし、近年のアプローチは、しばしばランダム選択戦略に大きく依存し、生成されたHDLテストケースの構造的多様性を制限し、ツールの特徴空間を不適切に探索する。
この制限に対処するため,HDLテストケースの多様性とFPGAロジック合成ツール検証の効率を体系的に向上する新しいテストフレームワークであるLin-Hunterを提案する。
特に、Lin-Hunterは、機能的に等価だが構造的に異なるHDLテストケース変種を生成するために、メタモルフィック変換規則の原則セットを導入し、既存のテスト入力の限られた多様性に効果的に対処する。
バグ発見効率をさらに高めるため、Lin-HunterはLinUCB(LinUCB)法に基づく適応戦略選択機構を統合する。
この方法は、以前に実行されたテストケースの合成ログからのフィードバックを利用して、合成バグをトリガーする確率を実証的に証明した変換戦略を動的に優先順位付けする。
3ヶ月にわたる総合的な実験はリン・ハンガーの実用性を実証した。
これまで報告されていない10の欠陥を含む18のユニークなバグを発見し、公式開発者によって確認された。
さらに,本手法は,テストケースの多様性とバグ発見効率の両方において,最先端のテスト手法よりも優れている。
関連論文リスト
- SSVD: Structured SVD for Parameter-Efficient Fine-Tuning and Benchmarking under Domain Shift in ASR [65.90944188787786]
ローランク適応(LoRA)は、音声アプリケーションで広く使われているが、VeRA、DoRA、PiSSA、SVFTといった最先端の変種は、主に言語や視覚タスクのために開発されており、音声による検証は限られている。
本研究は,これらのPEFTメソッドをESPnet内での総合的な統合とベンチマークを行う。
本研究では、0.1Bから2Bまでのモデルスケールで、幼児の発話や方言の変化を含むドメインシフト音声認識タスクに関するすべての手法を評価する。
論文 参考訳(メタデータ) (2025-09-02T20:51:17Z) - Code Difference Guided Fuzzing for FPGA Logic Synthesis Compilers via Bayesian Optimization [8.52837330241478]
我々は、FPGA論理合成コンパイラのバグを検出するため、LCC-Fuzzと呼ばれるベイズ最適化に基づく誘導突然変異戦略を提案する。
3ヶ月の間に、LSC-Fuzzは16のバグを発見し、そのうち12が公式の技術サポートによって確認されている。
論文 参考訳(メタデータ) (2025-08-25T06:41:36Z) - A Novel Mutation Based Method for Detecting FPGA Logic Synthesis Tool Bugs [7.8865444084780965]
FPGA論理合成ツールの試験方法であるVERMEIを提案する。
VERMEIは前処理、等価突然変異、バグ識別の3つのモジュールで構成されている。
5ヶ月以内にVERMEIは15のバグをベンダーに報告した。
論文 参考訳(メタデータ) (2025-08-21T13:11:59Z) - Training Language Models to Generate Quality Code with Program Analysis Feedback [66.0854002147103]
大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。
実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文 参考訳(メタデータ) (2025-05-28T17:57:47Z) - Scoring Verifiers: Evaluating Synthetic Verification for Code and Reasoning [59.25951947621526]
本稿では,既存の符号化ベンチマークをスコアとランキングデータセットに変換して,合成検証の有効性を評価する手法を提案する。
我々は4つの新しいベンチマーク(HE-R, HE-R+, MBPP-R, MBPP-R+)を公表し, 標準, 推論, 報酬に基づくLCMを用いて合成検証手法を解析した。
実験の結果, 推論はテストケースの生成を著しく改善し, テストケースのスケーリングによって検証精度が向上することがわかった。
論文 参考訳(メタデータ) (2025-02-19T15:32:11Z) - Automated Refactoring of Non-Idiomatic Python Code: A Differentiated Replication with LLMs [54.309127753635366]
本研究は, GPT-4の有効性について検討し, 慣用行動の推奨と示唆について検討した。
この結果から,従来は複雑なコード解析に基づくレコメンデータの実装が求められていた,LCMの課題達成の可能性が浮き彫りになった。
論文 参考訳(メタデータ) (2025-01-28T15:41:54Z) - Toward Automated Validation of Language Model Synthesized Test Cases using Semantic Entropy [0.5057850174013127]
現代の大規模言語モデル(LLM)ベースのプログラミングエージェントは、しばしば、生成されたコードを洗練するためにテスト実行フィードバックに依存する。
本稿では,LLMが生成したテストケースの自動検証にセマンティックエントロピーを利用する新しいフレームワークVALTESTを紹介する。
VALTESTはテストの妥当性を最大29%向上し、パス@1スコアの大幅な増加によって証明されたコード生成のパフォーマンスが向上することを示している。
論文 参考訳(メタデータ) (2024-11-13T00:07:32Z) - Exploring and Lifting the Robustness of LLM-powered Automated Program Repair with Metamorphic Testing [31.327835928133535]
大規模言語モデルを用いた自動プログラム修復(LAPR)技術は、最先端のバグ修正性能を達成した。
実際に展開する前に、LAPR技術で堅牢性テストを実施することが不可欠である。
LAPR技術専用のメタモルフィックテスティングフレームワークであるMT-LAPRを提案する。
論文 参考訳(メタデータ) (2024-10-10T01:14:58Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。