論文の概要: Enhancing Linux Privilege Escalation Attack Capabilities of Local LLM Agents
- arxiv url: http://arxiv.org/abs/2604.27143v1
- Date: Wed, 29 Apr 2026 19:54:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.780215
- Title: Enhancing Linux Privilege Escalation Attack Capabilities of Local LLM Agents
- Title(参考訳): ローカルLLMエージェントのLinuxプリビレージエスカレーション攻撃能力を向上する
- Authors: Benjamin Probst, Andreas Happe, Jürgen Cito,
- Abstract要約: 小型のオープンウェイトモデルは、自動Linux特権エスカレーションでは性能が良くない。
本研究は,システムレベルを目標とし,介入を促すことによって,この性能ギャップを埋めることができるか,という,系統的な実証研究である。
- 参考スコア(独自算出の注目度): 1.1677624591989955
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Recent research has demonstrated the potential of Large Language Models (LLMs) for autonomous penetration testing, particularly when using cloud-based restricted-weight models. However, reliance on such models introduces security, privacy, and sovereignty concerns, motivating the use of locally hosted open-weight alternatives. Prior work shows that small open-weight models perform poorly on automated Linux privilege escalation, limiting their practical applicability. In this paper, we present a systematic empirical study of whether targeted system-level and prompting interventions can bridge this performance gap. We analyze failure modes of open-weight models in autonomous privilege escalation, map them to established enhancement techniques, and evaluate five concrete interventions (chain-of-thought prompting, retrieval-augmented generation, structured prompts, history compression, and reflective analysis) implemented as extensions to hackingBuddyGPT. Our results show that open-weight models can match or outperform cloud-based baselines such as GPT-4o. With our treatments enabled, Llama3.1 70B exploits 83% of tested vulnerabilities, while smaller models including Llama3.1 8B and Qwen2.5 7B achieve 67% when using guidance. A full-factorial ablation study over all treatment combinations reveals that reflection-based treatments contribute most, while also identifying vulnerability discovery as a remaining bottleneck for local models.
- Abstract(参考訳): 最近の研究は、特にクラウドベースの制限重み付けモデルを使用する場合、自律的な浸透試験におけるLarge Language Models (LLMs) の可能性を示している。
しかしながら、そのようなモデルへの依存は、セキュリティ、プライバシ、主権の懸念を導入し、ローカルにホストされたオープンウェイトな代替手段の使用を動機付けている。
以前の研究では、小さなオープンウェイトモデルでは、自動Linux特権エスカレーションではパフォーマンスが悪く、実用性に制限があることが示されていた。
本稿では,この性能ギャップを埋めるシステムレベルと迅速な介入が可能であるかどうかを,系統的な実証研究により検証する。
我々は、自律的な特権エスカレーションにおけるオープンウェイトモデルの障害モードを分析し、それらを確立された拡張技術にマッピングし、ハッキングの拡張として実装された5つの具体的な介入(チェーン・オブ・プルート・プロンプト、検索・拡張生成、構造化プロンプト、履歴圧縮、リフレクティブ解析)を評価する。
その結果,オープンウェイトモデルでは,GPT-4oのようなクラウドベースラインに適合あるいは優れることがわかった。
Llama3.1 70Bはテスト済みの脆弱性の83%を悪用し、Llama3.1 8BやQwen2.5 7Bのような小さなモデルはガイダンスを使用すると67%を達成した。
すべての治療の組み合わせに対する完全な段階的アブレーション研究は、リフレクションベースの治療が最も寄与する一方で、脆弱性発見を局所モデルにおける残りのボトルネックとして認識していることを示している。
関連論文リスト
- An empirical study of LoRA-based fine-tuning of large language models for automated test case generation [5.182076496564637]
本稿では,パラメータ効率の高いファインチューニング,特にLoRAを用いた要件ベースのテストケース生成に関する総合的研究について述べる。
オープンソースおよびプロプライエタリモデルを含む複数のLLMファミリーを統一実験パイプラインで評価する。
実験により,LoRAをベースとしたファインチューニングにより,すべてのオープンソースモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2026-04-08T11:09:49Z) - AWE: Adaptive Agents for Dynamic Web Penetration Testing [0.0]
AWEは、自動Web侵入テストのためのメモリ拡張マルチエージェントフレームワークである。
軽量なLLMオーケストレーション層に、構造化された脆弱性固有の分析パイプラインを組み込む。
AWEはインジェクションクラスの脆弱性を大幅に向上させる。
論文 参考訳(メタデータ) (2026-03-01T07:32:42Z) - AgentCPM-Explore: Realizing Long-Horizon Deep Exploration for Edge-Scale Agents [75.67445299298949]
AgentCPM-Exploreは、知識密度と強力な探索能力を備えたコンパクトな4Bエージェントモデルである。
本稿では,パラメータ空間モデルの融合,報酬信号の復調,文脈情報の改良を特徴とする総合的なトレーニングフレームワークを提案する。
AgentCPM-Exploreは4つのベンチマークで8BクラスのSOTAモデルにマッチまたは超え、また5つのベンチマークでClaude-4.5-SonnetやDeepSeek-v3.2のような大規模モデルよりも優れている。
論文 参考訳(メタデータ) (2026-02-06T08:24:59Z) - Multi-Layer Confidence Scoring for Detection of Out-of-Distribution Samples, Adversarial Attacks, and In-Distribution Misclassifications [2.4219039094115034]
我々は,Multi-Layer Analysis for Confidence Scoring (MACS)を紹介する。
我々は、信頼度推定、分布シフトの検出、敵攻撃に当てはまるスコアを導出する。
VGG16 と ViTb16 モデルを用いた実験では,最先端のアプローチを超越した性能を実現している。
論文 参考訳(メタデータ) (2025-12-22T15:25:10Z) - Death by a Thousand Prompts: Open Model Vulnerability Analysis [0.06213771671016099]
オープンウェイトモデルは、研究者や開発者に対して、さまざまなダウンストリームアプリケーションの基礎を提供します。
8つのオープンウェイトな大規模言語モデル(LLM)の安全性とセキュリティの姿勢をテストし、その後の微調整とデプロイメントに影響を与える可能性のある脆弱性を特定しました。
以上の結果から, マルチターン攻撃による成功率は25.86%から92.78%であった。
論文 参考訳(メタデータ) (2025-11-05T07:22:24Z) - Scaf-GRPO: Scaffolded Group Relative Policy Optimization for Enhancing LLM Reasoning [49.290631188365786]
Scaf-GRPOは、モデルの独立した学習が停滞した時に介入するトレーニングフレームワークである。
これはQwen2.5-Math-7Bモデルのパス@1スコアを、バニラGRPOベースラインよりも44.3%向上させる。
この結果から、我々のフレームワークは、それまで到達範囲を超えていた問題を解決するモデルの能力を解き放つ、堅牢で効果的な方法論を提供することを示した。
論文 参考訳(メタデータ) (2025-10-22T17:41:30Z) - Knowledge Grafting: A Mechanism for Optimizing AI Model Deployment in Resource-Constrained Environments [0.0]
資源制約のある環境でAIモデルを最適化するために知識グラフトを導入する。
このアプローチはモデルサイズを88.54%削減する。
さまざまなエッジコンピューティングシナリオにまたがって拡張することができる。
論文 参考訳(メタデータ) (2025-07-25T13:37:45Z) - KBAlign: Efficient Self Adaptation on Specific Knowledge Bases [73.34893326181046]
本稿では,効率的なモデル適応によりRAGシステムを強化する自己教師型フレームワークKBAlignを提案する。
私たちのキーとなる洞察は、2つの革新的なメカニズムを通じて、モデルの本質的な能力を知識の整合性に活用することです。
KBAlign は GPT-4 による適応によって得られる性能向上の90%を達成できることを示した。
論文 参考訳(メタデータ) (2024-11-22T08:21:03Z) - Democratizing LLMs: An Exploration of Cost-Performance Trade-offs in
Self-Refined Open-Source Models [53.859446823312126]
SoTAは7Bから65Bまでのさまざまなサイズのオープンソースモデルを平均して、ベースラインのパフォーマンスから8.2%改善している。
厳密に言えば、Vicuna-7Bのような非常に小さなメモリフットプリントを持つモデルでさえ、全体的な11.74%の改善と、高い創造性、オープンエンドタスクの25.39%の改善を示している。
論文 参考訳(メタデータ) (2023-10-11T15:56:00Z) - MF-CLIP: Leveraging CLIP as Surrogate Models for No-box Adversarial Attacks [65.86360607693457]
敵に事前の知識がないノンボックス攻撃は、実際的な関連性にもかかわらず、比較的過小評価されている。
本研究は,大規模ビジョン・ランゲージ・モデル(VLM)をノンボックス・アタックの実行のための代理モデルとして活用するための体系的な研究である。
理論的および実証的な分析により,バニラCLIPを直接サロゲートモデルとして適用するための識別能力の不足に起因するno-boxアタックの実行に重要な制限があることが判明した。
MF-CLIP(MF-CLIP: MF-CLIP)はCLIPのサロゲートモデルとしての有効性を高める新しいフレームワークである。
論文 参考訳(メタデータ) (2023-07-13T08:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。