論文の概要: ShellGames: Speculative LLM-Driven SSH Deception
- arxiv url: http://arxiv.org/abs/2606.17986v1
- Date: Tue, 16 Jun 2026 14:40:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.48675
- Title: ShellGames: Speculative LLM-Driven SSH Deception
- Title(参考訳): ShellGames: 投機的LLM駆動SSH推論
- Authors: Umberto Salviati, Fabio De Gaspari, Mauro Conti, Luigi Vincenzo Mancini,
- Abstract要約: 大規模言語モデル(LLM)は、よりダイナミックな騙しシステムへの有望な道を提供する。
LLMは、持続状態の欠如、出力の不整合、転倒、潜伏、そして、偽装を明らかにする可能性のある行動幻覚への感受性など、適用性を根本的に制限する重要な制限に悩まされている。
LLMに基づくSSHシェルシミュレータであるShellGamesを提案する。
- 参考スコア(独自算出の注目度): 17.337274635900933
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Cyber deception and Moving Target Defense are promising strategies that aim to disrupt adversaries by increasing uncertainty. However, sustaining long-lived, credible interactive sessions with adversaries remains an open challenge. Large Language Models (LLMs) offer a promising path toward more dynamic deception systems, but suffer from key limitations that fundamentally limit their applicability, including: lack of persistent state, output inconsistencies, hallucinations, latency, and susceptibility to behavioral subversion that may reveal the deception. We propose ShellGames, an SSH shell simulator based on LLM designed to address these limitations. ShellGames combines five complementary techniques: (i) Automatic Chain-of-Thought and few-shot learning to improve correctness; (ii) memory management to maintain system state coherency; (iii) speculative command execution to reduce response latency; (iv) smart routing of complex interactive commands to a sandboxed environment; and (v) subversion detection leveraging the constrained input-output domain of shell environments. To enable systematic evaluation, we introduce a standardized benchmarking protocol and dataset spanning correctness, consistency, state tracking, and robustness tasks. ShellGames achieves $0.898$ command accuracy on correctness ($+5.3pp$ over baselines), $0.918$ sequence-level accuracy on consistency ($+36pp$), $0.98$ state tracking accuracy ($+18.3pp$), and $0.95$ accuracy on robustness ($+37pp$). A user study with $n=20$ participants confirms that ShellGames achieves realism comparable to a real shell under free exploration and outperforms traditional honeypots on perceived command coverage.
- Abstract(参考訳): サイバー詐欺と移動目標防衛は、不確実性を高めて敵を破壊しようとする有望な戦略である。
しかし、長期にわたって、敵との信頼できる対話的なセッションは、依然としてオープンな課題である。
大規模言語モデル(LLM)は、よりダイナミックな偽装システムへの有望な道を提供するが、永続的な状態の欠如、出力の不整合、幻覚、遅延、そして、偽装を明らかにする可能性のある行動的転用に対する感受性など、その適用性を根本的に制限する重要な制限に悩まされている。
LLMに基づくSSHシェルシミュレータであるShellGamesを提案する。
ShellGamesは5つの補完的テクニックを組み合わせています。
一 正当性を改善するために、自動結束及び数発の学習
二 システム状態の整合性を維持するためのメモリ管理
(iii)応答遅延を低減するための投機的コマンド実行
(四)複雑な対話型コマンドのサンドボックス環境へのスマートルーティング、及び
(v)シェル環境の制約された入出力領域を利用したサブバージョン検出。
体系的な評価を可能にするため,標準化されたベンチマークプロトコルとデータセットを導入し,正確性,一貫性,状態追跡,堅牢性といったタスクを網羅する。
ShellGamesは、精度が0.898$(ベースライン以上)、一貫性が0.918$(+36pp$)、状態追跡が0.98$(+18.3pp$)、堅牢性が0.95$(+37pp$)である。
参加者が$n=20$のユーザスタディでは、ShellGamesがフリーサーベイで本物のシェルに匹敵するリアリズムを実現し、コマンドカバレッジで従来のハニーポットを上回っていることが確認されている。
関連論文リスト
- Survive or Collapse: The Asymmetric Roles of Data Gating and Reward Grounding in Self-Play RL [76.45061154544568]
セルフプレイ強化学習は、言語モデルを独自の生成タスクで訓練し、人間ラベルなしでプロジェクタとソルバを共進化させる。
最近のシステムでは強い推理効果が報告されているが、崩壊と不安定性は広く観察され、理解されていない。
代わりに、自己プレイの安定性は、提案者生成タスクがトレーニングプールに入るかを判断するデータレベルゲートと、すでに認められたタスクに関するポリシーを更新する報酬信号の2つの異なるレバーによって管理されていると論じる。
論文 参考訳(メタデータ) (2026-05-21T09:19:23Z) - ComplexMCP: Evaluation of LLM Agents in Dynamic, Interdependent, and Large-Scale Tool Sandbox [61.862814740220806]
$textbfComplexMCP$は厳格な条件下でエージェントを評価するために設計されたベンチマークである。
Model Context Protocol (MCP)上に構築された$textbfComplexMCP$は300以上の精巧にテストされたツールを提供する。
論文 参考訳(メタデータ) (2026-05-11T16:20:51Z) - Time Is All It Takes: Spike-Retiming Attacks on Event-Driven Spiking Neural Networks [87.16809558673403]
スパイキングニューラルネットワーク(SNN)は離散スパイクで計算し、時間構造を利用する。
イベント駆動SNNにおけるスパイク数と振幅を保存しながら、既存のスパイクを繰り返すタイミングのみの敵について検討する。
論文 参考訳(メタデータ) (2026-02-03T09:06:53Z) - $σ$-zero: Gradient-based Optimization of $\ell_0$-norm Adversarial Examples [14.17412770504598]
入力摂動の作成には$ell_infty$-normの制約が使用できることを示す。
我々は $sigma$NISTtt- と呼ばれる新しい $ell_infty$-norm 攻撃を提案する。
論文 参考訳(メタデータ) (2024-02-02T20:08:11Z) - Acting in Delayed Environments with Non-Stationary Markov Policies [57.52103323209643]
本稿では,MDPにおける学習と計画のためのフレームワークについて紹介する。
実行が遅れると、元の状態空間における決定論的マルコフポリシーは最大報酬を得るのに十分であるが、非定常である必要があることを証明します。
我々は、状態拡張に頼らずに遅延実行タスクを解く非定常Q学習スタイルのモデルベースアルゴリズムを考案した。
論文 参考訳(メタデータ) (2021-01-28T13:35:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。