論文の概要: A Preference-Driven Methodology for High-Quality Solidity Code Generation
- arxiv url: http://arxiv.org/abs/2506.03006v1
- Date: Tue, 03 Jun 2025 15:45:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.436466
- Title: A Preference-Driven Methodology for High-Quality Solidity Code Generation
- Title(参考訳): 高品質固形コード生成のための参照駆動方式
- Authors: Zhiyuan Peng, Xin Yin, Chenhao Ying, Chao Ni, Yuan Luo,
- Abstract要約: PrefGenは、人間の好みを超えて標準DPOを拡張して、定量化されたブロックチェーン固有のメトリクスを組み込む新しいフレームワークである。
本稿では,Pass@k(機能的正当性),Compile@k(機能的正当性),Gas@k(ガス効率),Secure@k(セキュリティ評価)の4つの相補的指標を用いた総合的評価手法を紹介する。
PrefGenは、すべての臨界次元で既存のアプローチを大幅に上回り、66.7%のPass@5、58.9%のGas@5、62.5%のSecure@5を達成している。
- 参考スコア(独自算出の注目度): 11.139579355590332
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Large Language Models (LLMs) have demonstrated remarkable progress in generating functionally correct Solidity code, they continue to face critical challenges in producing gas-efficient and secure code, which are critical requirements for real-world smart contract deployment. Although recent advances leverage Supervised Fine-Tuning (SFT) and Direct Preference Optimization (DPO) for code preference alignment, existing approaches treat functional correctness, gas optimization, and security as independent objectives, resulting in contracts that may achieve operational soundness but suffer from prohibitive execution costs or dangerous vulnerabilities. To address these limitations, we propose PrefGen, a novel framework that extends standard DPO beyond human preferences to incorporate quantifiable blockchain-specific metrics, enabling holistic multi-objective optimization specifically tailored for smart contract generation. Our framework introduces a comprehensive evaluation methodology with four complementary metrics: Pass@k (functional correctness), Compile@k (syntactic correctness), Gas@k (gas efficiency), and Secure@k (security assessment), providing rigorous multi-dimensional contract evaluation. Through extensive experimentation, we demonstrate that PrefGen significantly outperforms existing approaches across all critical dimensions, achieving 66.7% Pass@5, 58.9% Gas@5, and 62.5% Secure@5, while generating production-ready smart contracts that are functionally correct, cost-efficient, and secure.
- Abstract(参考訳): 大きな言語モデル(LLM)は機能的に正しいSolidityコードの生成において顕著な進歩を見せていますが、現実のスマートコントラクトデプロイメントにおいて重要な要件であるガス効率とセキュアなコードの生成において、引き続き重要な課題に直面しています。
最近の進歩は、コードの優先順位調整にSupervised Fine-Tuning (SFT) と Direct Preference Optimization (DPO) を利用しているが、既存のアプローチでは、機能的正当性、ガス最適化、セキュリティを独立した目的として扱い、運用上の健全性を達成できるが、違法な実行コストや危険な脆弱性に悩まされる可能性がある。
これらの制限に対処するために、PrefGenを提案する。これは、人間の好みを超えて標準DPOを拡張して、定量化されたブロックチェーン固有のメトリクスを取り入れ、スマートコントラクト生成に特化して包括的な多目的最適化を可能にする、新しいフレームワークである。
本稿では,Pass@k(機能的正当性),Compile@k(機能的正当性),Gas@k(ガス効率),Secure@k(セキュリティ評価)の4つの相補的評価手法を紹介する。
広範な実験を通じて、PrefGenはすべての臨界次元にわたって既存のアプローチを著しく上回り、66.7%のPass@5、58.9%のGas@5、62.5%のSecure@5を達成し、機能的に正確でコスト効率が高く、セキュアなプロダクション対応のスマートコントラクトを生成する。
関連論文リスト
- Guiding LLM-based Smart Contract Generation with Finite State Machine [24.841721855191857]
有限状態機械(FSM)と大言語モデル(LLM)に基づくスマートコントラクト生成フレームワークであるFSM-SCGを提案する。
最高のベースラインと比較して、FSM-SCGは生成したスマートコントラクトコードのコンパイル成功率を少なくとも48%改善し、平均脆弱性リスクスコアを約68%削減する。
論文 参考訳(メタデータ) (2025-05-13T13:13:26Z) - Revisiting Locally Differentially Private Protocols: Towards Better Trade-offs in Privacy, Utility, and Attack Resistance [4.5282933786221395]
ローカル微分プライバシー(LDP)は、特にデータを収集するサーバが信頼できない設定で、強力なプライバシ保護を提供する。
本稿では, LDPプロトコルを改良するための汎用多目的最適化フレームワークを提案する。
我々のフレームワークは、調整可能なプライバシ・ユーティリティ・トレードオフによるLPP機構のモジュール化とコンテキスト対応のデプロイを可能にする。
論文 参考訳(メタデータ) (2025-03-03T12:41:01Z) - SmartLLM: Smart Contract Auditing using Custom Generative AI [0.0]
本稿では,LLaMA 3.1モデルにレトリーバル拡張生成(RAG)を応用した新しいアプローチであるSmartLLMを紹介する。
ERC標準からドメイン固有の知識を統合することで、SmartLLMはMythrilやSlitherのような静的解析ツールよりも優れたパフォーマンスを実現している。
実験の結果、100%の完全なリコールと70%の精度スコアが示され、脆弱性の特定におけるモデルの堅牢性を強調した。
論文 参考訳(メタデータ) (2025-02-17T06:22:05Z) - Automated Proof Generation for Rust Code via Self-Evolution [69.25795662658356]
私たちは、Rustコードの自動証明生成を可能にする、人書きスニペットの欠如を克服するフレームワークであるSAFEを紹介します。
SAFEは、細調整されたモデルの自己老化能力を訓練するために、多数の合成不正確な証明を再利用する。
我々は、人間の専門家によるベンチマークで52.52%の精度で達成し、GPT-4oのパフォーマンス14.39%を大きく上回った。
論文 参考訳(メタデータ) (2024-10-21T08:15:45Z) - CodeDPO: Aligning Code Models with Self Generated and Verified Source Code [52.70310361822519]
我々は、コード生成に好み学習を統合するフレームワークであるCodeDPOを提案し、コードの正確性と効率性という2つの重要なコード優先要因を改善した。
CodeDPOは、コードとテストケースを同時に生成、評価するセルフジェネレーション・アンド・バリデーションメカニズムを利用して、新しいデータセット構築方法を採用している。
論文 参考訳(メタデータ) (2024-10-08T01:36:15Z) - ConU: Conformal Uncertainty in Large Language Models with Correctness Coverage Guarantees [68.33498595506941]
自己整合性理論に基づく新しい不確実性尺度を導入する。
次に,CPアルゴリズムに正当性に整合した不確かさ条件を組み込むことにより,適合性不確かさの基準を策定する。
実証的な評価は、我々の不確実性測定が過去の最先端手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-06-29T17:33:07Z) - Bayesian Optimization with Formal Safety Guarantees via Online Conformal Prediction [36.14499894307206]
ブラックボックスゼロ階最適化は、金融、物理学、工学といった分野における応用において中心的な原始である。
本稿では,提案手法の安全性に関するフィードバックも提供するシナリオについて検討する。
制約関数の性質に関わらず、安全要件を満たす新しいBOベースのアプローチが導入された。
論文 参考訳(メタデータ) (2023-06-30T17:26:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。