論文の概要: TrojanGYM: A Detector-in-the-Loop LLM for Adaptive RTL Hardware Trojan Insertion
- arxiv url: http://arxiv.org/abs/2601.17178v1
- Date: Fri, 23 Jan 2026 21:11:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.321605
- Title: TrojanGYM: A Detector-in-the-Loop LLM for Adaptive RTL Hardware Trojan Insertion
- Title(参考訳): TrojanGYM: 適応RTLハードウェアトロイの木馬挿入用LLM検出器
- Authors: Saideep Sreekumar, Zeng Wang, Akashdeep Saha, Weihua Xiao, Minghao Shao, Muhammad Shafique, Ozgur Sinanoglu, Ramesh Karri, Johann Knechtel,
- Abstract要約: ハードウェアトロイの木馬(HT)は、学習検出器がパターンやスタイリングされた小さなベンチマークをトリガー/ロードするのに過度に適合するため、依然として重要な脅威である。
本稿では,HT挿入を自動的にキュレートして検出盲点を露呈するフレームワークであるTrojanGYMを紹介する。
また,グラフ抽出,トレーニング,予測信頼性を改善したGNN4TJの新たな実装であるRobust-GNN4TJを提案する。
- 参考スコア(独自算出の注目度): 14.250356355764389
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hardware Trojans (HTs) remain a critical threat because learning-based detectors often overfit to narrow trigger/payload patterns and small, stylized benchmarks. We introduce TrojanGYM, an agentic, LLM-driven framework that automatically curates HT insertions to expose detector blind spots while preserving design correctness. Given high-level HT specifications, a suite of cooperating LLM agents (instantiated with GPT-4, LLaMA-3.3-70B, and Gemini-2.5Pro) proposes and refines RTL modifications that realize diverse triggers and payloads without impacting normal functionality. TrojanGYM implements a feedback-driven benchmark generation loop co-designed with HT detectors, in which constraint-aware syntactic checking and GNN-based HT detectors provide feedback that iteratively refines HT specifications and insertion strategies to better surface detector blind spots. We further propose Robust-GNN4TJ, a new implementation of the GNN4TJ with improved graph extraction, training robustness, and prediction reliability, especially on LLM-generated HT designs. On the most challenging TrojanGYM-generated benchmarks, Robust-GNN4TJ raises HT detection rates from 0% to 60% relative to a prior GNN-based detector. We instantiate TrojanGYM on SRAM, AES-128, and UART designs at RTL level, and show that it systematically produces diverse, functionally correct HTs that reach up to 83.33% evasion rates against modern GNN-based detectors, revealing robustness gaps that are not apparent when these detectors are evaluated solely on existing TrustHub-style benchmarks. Post peer-review, we will release all codes and artifacts.
- Abstract(参考訳): ハードウェアトロイの木馬(HT)は、学習ベースの検出器が狭いトリガー/ペイロードパターンと小さなスタイリングされたベンチマークに過度に適合するため、依然として重大な脅威である。
我々は,HT挿入を自動的にキュレートして,設計の正しさを保ちながら検出盲点を露呈する,エージェント型LLM駆動のフレームワークであるTrojanGYMを紹介する。
高レベルのHT仕様を与えられたLLMエージェント群(GPT-4、LLaMA-3.3-70B、Gemini-2.5Pro)は、通常の機能に影響を与えることなく多様なトリガやペイロードを実現するRTL修正を提案し、改良する。
TrojanGYMは、HT検出器と共同設計されたフィードバック駆動ベンチマーク生成ループを実装しており、制約を意識した構文チェックとGNNベースのHT検出器は、HT仕様を反復的に洗練し、インサート戦略によりディザスタブラインドスポットをよりよく表面化するフィードバックを提供する。
さらに, GNN4TJ の新たな実装である Robust-GNN4TJ を提案する。
最も困難なTrojanGYM生成ベンチマークでは、Robost-GNN4TJは、以前のGNNベースの検出器と比較して、HT検出率を0%から60%に引き上げている。
我々は、SRAM、AES-128、UARTの設計上のTrojanGYMをRTLレベルでインスタンス化し、現在のGNNベースの検出器に対して最大83.33%の回避率に達する多様な機能的なHTを体系的に生成し、これらの検出器が既存のTrustHubスタイルのベンチマークでのみ評価された場合に、堅牢性ギャップが明らかになることを示した。
ピアレビューの後、すべてのコードとアーティファクトをリリースします。
関連論文リスト
- RADAR: Retrieval-Augmented Detector with Adversarial Refinement for Robust Fake News Detection [50.073924438848316]
本稿では,強靭な偽ニュース検出のための対角補正機能を備えた検索拡張検出器RADARを提案する。
提案手法では,現実の物品を現実の摂動で書き直すジェネレータを用いて,高密度経路探索によるクレームの検証を行う軽量検出器と組み合わせる。
論文 参考訳(メタデータ) (2026-01-07T14:52:15Z) - DetectAnyLLM: Towards Generalizable and Robust Detection of Machine-Generated Text Across Domains and Models [60.713908578319256]
タスク指向の知識で検出器を最適化するために,DDL(Direct Discrepancy Learning)を提案する。
そこで本研究では,最新のMGTD性能を実現する統合検出フレームワークであるTectAnyLLMを紹介する。
MIRAGEは5つのテキストドメインにまたがる10のコーパスから人書きテキストをサンプリングし、17個の最先端のLLMを使用して再生成または修正する。
論文 参考訳(メタデータ) (2025-09-15T10:59:57Z) - TrojanWhisper: Evaluating Pre-trained LLMs to Detect and Localize Hardware Trojans [0.0]
既存のハードウェアトロイの木馬検出法はいくつかの限界に直面している。
LLM(Large Language Models)の出現は、HT検出に有望な新しい方向を提供する。
本稿では,レジスタ転送レベル (RTL) に挿入された各種HTの検出における汎用LLMの可能性について検討する。
論文 参考訳(メタデータ) (2024-12-10T16:16:22Z) - Unleashing GHOST: An LLM-Powered Framework for Automated Hardware Trojan Design [0.0]
GHOSTは、大規模言語モデル(LLM)を活用して高速なHT生成と挿入を行う自動攻撃フレームワークである。
GHOST生成HTの100%はML生成HT検出ツールによる検出を回避した。
論文 参考訳(メタデータ) (2024-12-03T20:33:29Z) - SENTAUR: Security EnhaNced Trojan Assessment Using LLMs Against Undesirable Revisions [17.21926121783922]
ハードウェアトロイジャン(HT)は、ステルスな動作の導入、意図したIC作業の防止、またはサイドチャネルを介して機密データを漏洩することができる。
HTに対処するためには、HTシナリオを迅速に調査することが重要な要件である。
本稿では,登録転送レベル(RTL)設計のためのHTスイートを生成するための大規模言語モデル(LLM)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-17T07:13:06Z) - Evasive Hardware Trojan through Adversarial Power Trace [6.949268510101616]
我々は,HT検出をバイパスするためのHT難読化(HTO)手法を提案する。
HTOはASICとFPGA用の1つのトランジスタで実装できる。
適応攻撃者は、スペクトルノイズ予算で設計を制約することで、まだ回避可能なHTOを設計可能であることを示す。
論文 参考訳(メタデータ) (2024-01-04T16:28:15Z) - Rank-DETR for High Quality Object Detection [52.82810762221516]
高性能なオブジェクト検出器は、バウンディングボックス予測の正確なランキングを必要とする。
本研究では, 簡易かつ高性能なDETR型物体検出器について, 一連のランク指向設計を提案して紹介する。
論文 参考訳(メタデータ) (2023-10-13T04:48:32Z) - Trojan Playground: A Reinforcement Learning Framework for Hardware Trojan Insertion and Detection [0.0]
現在のハードウェアトロイジャン(HT)検出技術は、主に限られたHTベンチマークに基づいて開発されている。
本稿では,これらの欠点に対処する最初の自動強化学習(RL) HT挿入検出フレームワークを紹介する。
論文 参考訳(メタデータ) (2023-05-16T16:42:07Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。