論文の概要: An Automated Framework for Input Alphabet Construction in Stateful Protocol Implementation Learning
- arxiv url: http://arxiv.org/abs/2606.23464v1
- Date: Mon, 22 Jun 2026 15:14:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 18:53:55.204906
- Title: An Automated Framework for Input Alphabet Construction in Stateful Protocol Implementation Learning
- Title(参考訳): ステートフルプロトコル実装学習における入力Alphabet構築のための自動フレームワーク
- Authors: JiongHan Wang, WenChao Huang,
- Abstract要約: ステートフルなプロトコル実装のための一般的な分析技術であるステート機械学習は、手書き入力アルファベットから派生したコアボトルネックに悩まされている。
我々は、プロトコルメッセージレイアウトを解析し、構造化突然変異規則に従って候補入力シンボルを生成するために、大きな言語モデルを採用する。
連続的なアルファベットの増大に伴うオーバヘッドの増大を考慮して,新たなアルファベットエントリを組み込む際に,既存の学習オートマトンを再利用するためのミニバッチインクリメンタル学習戦略を導入する。
- 参考スコア(独自算出の注目度): 0.8536845899508164
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As a prevalent analytical technique for stateful protocol implementations, state machine learning suffers from a core bottleneck stemming from handcrafted input alphabets. Manual alphabet definition inherently limits the completeness of input exploration, making it difficult to capture anomalous non-conformant messages and consequently missing latent semantic defects. In this paper, we target automatic input alphabet generation to break the above limitation for state machine learning. We adopt large language models to parse protocol message layouts and produce candidate input symbols following structured mutation rules, which automatically covers valid and invalid message spaces and eliminates reliance on manual protocol expertise. Considering the rising overhead brought by continuously growing alphabets, we introduce a mini-batch incremental learning strategy to reuse existing learned automata when incorporating new alphabet entries. Comprehensive experiments on practical protocol stacks indicate our approach can reproduce existing security vulnerabilities and identify novel semantic bugs. A subset of these newly discovered issues has been confirmed and patched by developers, proving the practicability and effectiveness of our proposed method.
- Abstract(参考訳): ステートフルなプロトコル実装の一般的な分析手法として、ステート機械学習は手作りの入力アルファベットに由来するコアボトルネックに悩まされている。
手動アルファベットの定義は本質的に入力探索の完全性を制限し、異常な非整合メッセージのキャプチャが困難になり、結果として潜在意味の欠陥が欠落する。
本稿では、状態機械学習における上記の制限を破るために、自動入力アルファベット生成を目標とする。
我々は、プロトコルのレイアウトを解析し、構造化された変更規則に従って候補入力シンボルを生成するために、大きな言語モデルを採用し、有効かつ無効なメッセージ空間を自動でカバーし、手動のプロトコルの専門知識に依存しない。
連続的なアルファベットの増大に伴うオーバヘッドの増大を考慮すると、新しいアルファベットエントリを組み込む際に既存の学習オートマトンを再利用するためのミニバッチインクリメンタル学習戦略を導入する。
実用的なプロトコルスタックに関する包括的な実験は、我々のアプローチが既存のセキュリティ脆弱性を再現し、新しいセマンティックなバグを識別できることを示している。
新たに発見された問題のサブセットが開発者によって確認され,提案手法の有効性と有効性が確認された。
関連論文リスト
- STEAD: Robust Provably Secure Linguistic Steganography with Diffusion Language Model [71.35577462669856]
拡散言語モデル(DLM)を用いた頑健で確実な言語ステガノグラフィーを提案する。
ステガノグラフ抽出中に擬似ランダム誤り訂正や近傍探索補正を含む誤り訂正戦略を導入する。
論文 参考訳(メタデータ) (2026-01-21T08:58:12Z) - Automated Quality Control for Language Documentation: Detecting Phonotactic Inconsistencies in a Kokborok Wordlist [0.0]
バングラを用いたコクボロク品種の多言語データセットに教師なし異常検出法を適用した。
文字レベルと音節レベルの特徴は、潜在的な転写エラーや借用を識別するために使用される。
ハイリコールアプローチは、フィールドワーカーに検証を必要とするエントリをフラグする体系的な方法を提供する。
論文 参考訳(メタデータ) (2025-10-24T15:51:10Z) - Your Language Model Can Secretly Write Like Humans: Contrastive Paraphrase Attacks on LLM-Generated Text Detectors [77.82885394684202]
テキスト検出を効果的に欺く訓練不要な方法である textbfContrastive textbfParaphrase textbfAttack (CoPA) を提案する。
CoPAは、大規模言語モデルによって生成される人間のような分布とは対照的に、補助的な機械的な単語分布を構築している。
我々の理論的分析は、提案された攻撃の優越性を示唆している。
論文 参考訳(メタデータ) (2025-05-21T10:08:39Z) - Signs as Tokens: A Retrieval-Enhanced Multilingual Sign Language Generator [55.94334001112357]
テキスト入力から3Dサインアバターを自動回帰的に生成できる多言語手話モデルSigns as Tokens(SOKE)を導入する。
単語レベルの正確な記号を提供するために,外部記号辞書を組み込んだ検索強化SLG手法を提案する。
論文 参考訳(メタデータ) (2024-11-26T18:28:09Z) - CryptoFormalEval: Integrating LLMs and Formal Verification for Automated Cryptographic Protocol Vulnerability Detection [41.94295877935867]
我々は,新たな暗号プロトコルの脆弱性を自律的に識別する大規模言語モデルの能力を評価するためのベンチマークを導入する。
私たちは、新しい、欠陥のある通信プロトコルのデータセットを作成し、AIエージェントが発見した脆弱性を自動的に検証する方法を設計しました。
論文 参考訳(メタデータ) (2024-11-20T14:16:55Z) - Offline Detection of Misspelled Handwritten Words by Convolving
Recognition Model Features with Text Labels [0.0]
テキストに対して手書き画像を比較する作業を紹介する。
我々のモデルの分類ヘッドは、最先端の生成逆数ネットワークを用いて生成された合成データに基づいて訓練されている。
このような大規模なパフォーマンス向上は、ヒューマン・イン・ザ・ループの自動化を利用したアプリケーションの生産性を大幅に向上させる可能性がある。
論文 参考訳(メタデータ) (2023-09-18T21:13:42Z) - Block the Label and Noise: An N-Gram Masked Speller for Chinese Spell
Checking [0.0]
本稿では, ラベルの漏洩や誤検出を回避するため, 電流や周辺トークンをマスキングするn-gramマスキング層を提案する。
SIGHANデータセットの実験では、プラグ可能なn-gramマスキング機構により、一般的なCSCモデルの性能が向上することを示した。
論文 参考訳(メタデータ) (2023-05-05T06:43:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。