Fugu-MT 論文翻訳(概要): Prompt Engineering vs. Fine-Tuning for LLM-Based Vulnerability Detection in Solana and Algorand Smart Contracts

論文の概要: Prompt Engineering vs. Fine-Tuning for LLM-Based Vulnerability Detection in Solana and Algorand Smart Contracts

arxiv url: http://arxiv.org/abs/2511.11250v1
Date: Fri, 14 Nov 2025 12:50:36 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-17 22:42:18.602874
Title: Prompt Engineering vs. Fine-Tuning for LLM-Based Vulnerability Detection in Solana and Algorand Smart Contracts
Title（参考訳）: ソラナおよびアルゴランスマートコントラクトにおけるLDMによる脆弱性検出のためのプロンプトエンジニアリングとファインチューニング
Authors: Biagio Boi, Christian Esposito,
Abstract要約: 本稿では,大規模言語モデル(LLM)がスマートコントラクトの脆弱性を検出する能力について検討する。 SolanaとAlgorandのスマートコントラクトエコシステムに注力しています。この結果から,LLMに基づくアプローチはスマートコントラクトの静的脆弱性検出に有効であることが示唆された。
参考スコア（独自算出の注目度）: 1.0255673932966183
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Smart contracts have emerged as key components within decentralized environments, enabling the automation of transactions through self-executing programs. While these innovations offer significant advantages, they also present potential drawbacks if the smart contract code is not carefully designed and implemented. This paper investigates the capability of large language models (LLMs) to detect OWASP-inspired vulnerabilities in smart contracts beyond the Ethereum Virtual Machine (EVM) ecosystem, focusing specifically on Solana and Algorand. Given the lack of labeled datasets for non-EVM platforms, we design a synthetic dataset of annotated smart contract snippets in Rust (for Solana) and PyTeal (for Algorand), structured around a vulnerability taxonomy derived from OWASP. We evaluate LLMs under three configurations: prompt engineering, fine-tuning, and a hybrid of both, comparing their performance on different vulnerability categories. Experimental results show that prompt engineering achieves general robustness, while fine-tuning improves precision and recall on less semantically rich languages such as TEAL. Additionally, we analyze how the architectural differences of Solana and Algorand influence the manifestation and detectability of vulnerabilities, offering platform-specific mappings that highlight limitations in existing security tooling. Our findings suggest that LLM-based approaches are viable for static vulnerability detection in smart contracts, provided domain-specific data and categorization are integrated into training pipelines.
Abstract（参考訳）: スマートコントラクトは分散環境における重要なコンポーネントとして現れており、セルフエグゼクティブプログラムによるトランザクションの自動化を可能にしている。これらのイノベーションには大きなメリットがありますが、スマートコントラクトコードが慎重に設計され実装されていない場合には、潜在的な欠点も示します。本稿では,大規模な言語モデル(LLM)がEthereum仮想マシン(EVM)エコシステムを超えてOWASPにインスパイアされたスマートコントラクトの脆弱性を検出する能力について検討する。非EVMプラットフォーム用のラベル付きデータセットがないので、OWASPから派生した脆弱性分類を中心に構築されたRust(Solana用)とPyTeal(Algorand用)で、注釈付きスマートコントラクトスニペットの合成データセットを設計します。我々は,LLMを3つの構成で評価する: プロンプトエンジニアリング,ファインチューニング,および両者のハイブリッドで,異なる脆弱性カテゴリにおける性能の比較を行う。実験結果から, TEALのようなより意味に乏しい言語では, ファインチューニングにより精度が向上し, 再現性も向上することがわかった。さらに、SolanaとAlgorandのアーキテクチャ上の違いが脆弱性の顕在化と検出可能性にどのように影響するかを分析し、既存のセキュリティツールの制限を強調したプラットフォーム固有のマッピングを提供します。この結果から,LLMベースのアプローチはスマートコントラクトの静的脆弱性検出に有効であることが示唆された。

関連論文リスト

RealSec-bench: A Benchmark for Evaluating Secure Code Generation in Real-World Repositories [58.32028251925354]
LLM(Large Language Models)は、コード生成において顕著な能力を示しているが、セキュアなコードを生成する能力は依然として重要で、未調査の領域である。我々はRealSec-benchを紹介します。RealSec-benchは、現実世界の高リスクなJavaリポジトリから慎重に構築されたセキュアなコード生成のための新しいベンチマークです。
論文参考訳（メタデータ） (2026-01-30T08:29:01Z)
Examining the Effectiveness of Transformer-Based Smart Contract Vulnerability Scan [0.0]
スマートコントラクトの脆弱性スキャンに対するディープラーニングに基づくアプローチを評価する。本稿では,トランスフォーマを用いたスマートコートの脆弱性解析装置VASCOTを提案する。 VASCOTの性能は、最先端のLSTMベースの脆弱性検出モデルと比較される。
論文参考訳（メタデータ） (2026-01-12T09:00:42Z)
ParaVul: A Parallel Large Language Model and Retrieval-Augmented Framework for Smart Contract Vulnerability Detection [43.41293570032631]
ParaVulは、スマートコントラクト脆弱性検出の信頼性と精度を向上させるための、検索強化フレームワークである。 LLM微調整のためのスパースローランド適応(SLoRA)を開発した。脆弱性契約データセットを構築し,RAG(Retrieval-Augmented Generation)システムを開発した。
論文参考訳（メタデータ） (2025-10-20T03:23:41Z)
Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.83217247686402]
大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文参考訳（メタデータ） (2025-08-28T13:00:28Z)
SAEL: Leveraging Large Language Models with Adaptive Mixture-of-Experts for Smart Contract Vulnerability Detection [14.581402965011117]
スマートコントラクト脆弱性検出のためのLLMベースのフレームワークであるSAELを提案する。まず、脆弱性を特定し、説明を生成するためにLSMを誘導するプロンプトを設計する。次に、CodeT5とT5のプロンプトチューニングをコントラクトコードと説明処理に適用し、タスク固有のパフォーマンスを向上させる。
論文参考訳（メタデータ） (2025-07-30T04:28:00Z)
White-Basilisk: A Hybrid Model for Code Vulnerability Detection [45.03594130075282]
我々は、優れた性能を示す脆弱性検出の新しいアプローチであるWhite-Basiliskを紹介する。 White-Basiliskは、パラメータ数2億の脆弱性検出タスクで結果を得る。この研究は、コードセキュリティにおける新しいベンチマークを確立し、コンパクトで効率的に設計されたモデルが、特定のタスクにおいてより大きなベンチマークよりも優れているという実証的な証拠を提供する。
論文参考訳（メタデータ） (2025-07-11T12:39:25Z)
Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs [71.7892165868749]
LLM(Commercial Large Language Model) APIは基本的な信頼の問題を生み出します。ユーザーは特定のモデルに課金するが、プロバイダが忠実に提供できることを保証することはない。我々は,このモデル置換問題を定式化し,現実的な逆条件下での検出方法を評価する。我々は,信頼された実行環境(TEE)を実用的で堅牢なソリューションとして使用し,評価する。
論文参考訳（メタデータ） (2025-04-07T03:57:41Z)
How Robust Are Router-LLMs? Analysis of the Fragility of LLM Routing Capabilities [62.474732677086855]
大規模言語モデル(LLM)ルーティングは,計算コストと性能のバランスをとる上で重要な戦略である。 DSCベンチマークを提案する: Diverse, Simple, and Categorizedは、幅広いクエリタイプでルータのパフォーマンスを分類する評価フレームワークである。
論文参考訳（メタデータ） (2025-03-20T19:52:30Z)
Leveraging Large Language Models and Machine Learning for Smart Contract Vulnerability Detection [0.0]
我々は、モデル性能を比較するために、機械学習アルゴリズムを訓練、テストし、タイプに応じてスマートコントラクトコードを分類する。我々の研究は、機械学習と大規模言語モデルを組み合わせて、さまざまなスマートコントラクトの脆弱性を検出するリッチで解釈可能なフレームワークを提供します。
論文参考訳（メタデータ） (2025-01-04T08:32:53Z)
ContractTrace: Retracing Smart Contract Versions for Security Analyses [4.126275271359132]
ContractTraceは、スマートコントラクトのバージョンを正確に識別し、コヒーレントなラインにリンクする自動化インフラストラクチャです。この機能は、脆弱性の伝播パターンを理解し、ブロックチェーン環境におけるセキュリティパッチの有効性を評価するために不可欠である。
論文参考訳（メタデータ） (2024-12-30T11:10:22Z)
AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文参考訳（メタデータ） (2024-11-02T13:24:30Z)
Soley: Identification and Automated Detection of Logic Vulnerabilities in Ethereum Smart Contracts Using Large Language Models [1.081463830315253]
GitHubのコード変更から抽出された実世界のスマートコントラクトのロジック脆弱性を実証的に調査する。本稿では,スマートコントラクトにおける論理的脆弱性の自動検出手法であるSoleyを紹介する。スマートコントラクト開発者が実際のシナリオでこれらの脆弱性に対処するために使用する緩和戦略について検討する。
論文参考訳（メタデータ） (2024-06-24T00:15:18Z)
HasTEE+ : Confidential Cloud Computing and Analytics with Haskell [50.994023665559496]
信頼性コンピューティングは、Trusted Execution Environments(TEEs)と呼ばれる特別なハードウェア隔離ユニットを使用して、コテナントクラウドデプロイメントにおける機密コードとデータの保護を可能にする。低レベルのC/C++ベースのツールチェーンを提供するTEEは、固有のメモリ安全性の脆弱性の影響を受けやすく、明示的で暗黙的な情報フローのリークを監視するための言語構造が欠如している。私たちは、Haskellに埋め込まれたドメイン固有言語(cla)であるHasTEE+を使って、上記の問題に対処します。
論文参考訳（メタデータ） (2024-01-17T00:56:23Z)
ESCORT: Ethereum Smart COntRacTs Vulnerability Detection using Deep Neural Network and Transfer Learning [80.85273827468063]
既存の機械学習ベースの脆弱性検出方法は制限され、スマートコントラクトが脆弱かどうかのみ検査される。スマートコントラクトのための初のDeep Neural Network(DNN)ベースの脆弱性検出フレームワークであるESCORTを提案する。 ESCORTは6種類の脆弱性に対して平均95%のF1スコアを達成し,検出時間は契約あたり0.02秒であることを示す。
論文参考訳（メタデータ） (2021-03-23T15:04:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。