Fugu-MT 論文翻訳(概要): A Preference-Driven Methodology for High-Quality Solidity Code Generation

論文の概要: A Preference-Driven Methodology for High-Quality Solidity Code Generation

arxiv url: http://arxiv.org/abs/2506.03006v1
Date: Tue, 03 Jun 2025 15:45:31 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-05 01:42:09.436466
Title: A Preference-Driven Methodology for High-Quality Solidity Code Generation
Title（参考訳）: 高品質固形コード生成のための参照駆動方式
Authors: Zhiyuan Peng, Xin Yin, Chenhao Ying, Chao Ni, Yuan Luo,
Abstract要約: PrefGenは、人間の好みを超えて標準DPOを拡張して、定量化されたブロックチェーン固有のメトリクスを組み込む新しいフレームワークである。本稿では,Pass@k(機能的正当性),Compile@k(機能的正当性),Gas@k(ガス効率),Secure@k(セキュリティ評価)の4つの相補的指標を用いた総合的評価手法を紹介する。 PrefGenは、すべての臨界次元で既存のアプローチを大幅に上回り、66.7%のPass@5、58.9%のGas@5、62.5%のSecure@5を達成している。
参考スコア（独自算出の注目度）: 11.139579355590332
License: http://creativecommons.org/licenses/by/4.0/
Abstract: While Large Language Models (LLMs) have demonstrated remarkable progress in generating functionally correct Solidity code, they continue to face critical challenges in producing gas-efficient and secure code, which are critical requirements for real-world smart contract deployment. Although recent advances leverage Supervised Fine-Tuning (SFT) and Direct Preference Optimization (DPO) for code preference alignment, existing approaches treat functional correctness, gas optimization, and security as independent objectives, resulting in contracts that may achieve operational soundness but suffer from prohibitive execution costs or dangerous vulnerabilities. To address these limitations, we propose PrefGen, a novel framework that extends standard DPO beyond human preferences to incorporate quantifiable blockchain-specific metrics, enabling holistic multi-objective optimization specifically tailored for smart contract generation. Our framework introduces a comprehensive evaluation methodology with four complementary metrics: Pass@k (functional correctness), Compile@k (syntactic correctness), Gas@k (gas efficiency), and Secure@k (security assessment), providing rigorous multi-dimensional contract evaluation. Through extensive experimentation, we demonstrate that PrefGen significantly outperforms existing approaches across all critical dimensions, achieving 66.7% Pass@5, 58.9% Gas@5, and 62.5% Secure@5, while generating production-ready smart contracts that are functionally correct, cost-efficient, and secure.
Abstract（参考訳）: 大きな言語モデル(LLM)は機能的に正しいSolidityコードの生成において顕著な進歩を見せていますが、現実のスマートコントラクトデプロイメントにおいて重要な要件であるガス効率とセキュアなコードの生成において、引き続き重要な課題に直面しています。最近の進歩は、コードの優先順位調整にSupervised Fine-Tuning (SFT) と Direct Preference Optimization (DPO) を利用しているが、既存のアプローチでは、機能的正当性、ガス最適化、セキュリティを独立した目的として扱い、運用上の健全性を達成できるが、違法な実行コストや危険な脆弱性に悩まされる可能性がある。これらの制限に対処するために、PrefGenを提案する。これは、人間の好みを超えて標準DPOを拡張して、定量化されたブロックチェーン固有のメトリクスを取り入れ、スマートコントラクト生成に特化して包括的な多目的最適化を可能にする、新しいフレームワークである。本稿では,Pass@k(機能的正当性),Compile@k(機能的正当性),Gas@k(ガス効率),Secure@k(セキュリティ評価)の4つの相補的評価手法を紹介する。広範な実験を通じて、PrefGenはすべての臨界次元にわたって既存のアプローチを著しく上回り、66.7%のPass@5、58.9%のGas@5、62.5%のSecure@5を達成し、機能的に正確でコスト効率が高く、セキュアなプロダクション対応のスマートコントラクトを生成する。

関連論文リスト

An Optimisation Framework for Unsupervised Environment Design [88.29733214939544]
非教師なし環境設計(UED)は、エージェントの全般的な堅牢性を最大化することを目的としている。ゼロサム設定において、証明可能な収束アルゴリズムを提供する。提案手法の有効性を実証的に検証する。
論文参考訳（メタデータ） (2025-05-27T03:07:26Z)
Guiding LLM-based Smart Contract Generation with Finite State Machine [24.841721855191857]
有限状態機械(FSM)と大言語モデル(LLM)に基づくスマートコントラクト生成フレームワークであるFSM-SCGを提案する。最高のベースラインと比較して、FSM-SCGは生成したスマートコントラクトコードのコンパイル成功率を少なくとも48%改善し、平均脆弱性リスクスコアを約68%削減する。
論文参考訳（メタデータ） (2025-05-13T13:13:26Z)
Enhancing Smart Contract Vulnerability Detection in DApps Leveraging Fine-Tuned LLM [0.7018579932647147]
分散アプリケーション(DApps)は、スマートコントラクトの脆弱性のため、重大なセキュリティリスクに直面します。本稿では,Large Language Models (LLM) を利用したスマートコントラクト脆弱性検出手法を提案する。
論文参考訳（メタデータ） (2025-04-07T12:32:14Z)
Revisiting Locally Differentially Private Protocols: Towards Better Trade-offs in Privacy, Utility, and Attack Resistance [4.5282933786221395]
ローカル微分プライバシー(LDP)は、特にデータを収集するサーバが信頼できない設定で、強力なプライバシ保護を提供する。本稿では, LDPプロトコルを改良するための汎用多目的最適化フレームワークを提案する。我々のフレームワークは、調整可能なプライバシ・ユーティリティ・トレードオフによるLPP機構のモジュール化とコンテキスト対応のデプロイを可能にする。
論文参考訳（メタデータ） (2025-03-03T12:41:01Z)
SolBench: A Dataset and Benchmark for Evaluating Functional Correctness in Solidity Code Completion and Repair [51.0686873716938]
コード補完モデルによって生成されたSolidityスマートコントラクトの機能的正しさを評価するベンチマークであるSolBenchを紹介する。本稿では,スマートコントラクトの機能的正当性を検証するための検索拡張コード修復フレームワークを提案する。その結果、コード修復と検索技術は、計算コストを削減しつつ、スマートコントラクト完了の正しさを効果的に向上することを示した。
論文参考訳（メタデータ） (2025-03-03T01:55:20Z)
SmartLLM: Smart Contract Auditing using Custom Generative AI [0.0]
本稿では,LLaMA 3.1モデルにレトリーバル拡張生成(RAG)を応用した新しいアプローチであるSmartLLMを紹介する。 ERC標準からドメイン固有の知識を統合することで、SmartLLMはMythrilやSlitherのような静的解析ツールよりも優れたパフォーマンスを実現している。実験の結果、100%の完全なリコールと70%の精度スコアが示され、脆弱性の特定におけるモデルの堅牢性を強調した。
論文参考訳（メタデータ） (2025-02-17T06:22:05Z)
Automated Proof Generation for Rust Code via Self-Evolution [69.25795662658356]
私たちは、Rustコードの自動証明生成を可能にする、人書きスニペットの欠如を克服するフレームワークであるSAFEを紹介します。 SAFEは、細調整されたモデルの自己老化能力を訓練するために、多数の合成不正確な証明を再利用する。我々は、人間の専門家によるベンチマークで52.52%の精度で達成し、GPT-4oのパフォーマンス14.39%を大きく上回った。
論文参考訳（メタデータ） (2024-10-21T08:15:45Z)
CodeDPO: Aligning Code Models with Self Generated and Verified Source Code [52.70310361822519]
我々は、コード生成に好み学習を統合するフレームワークであるCodeDPOを提案し、コードの正確性と効率性という2つの重要なコード優先要因を改善した。 CodeDPOは、コードとテストケースを同時に生成、評価するセルフジェネレーション・アンド・バリデーションメカニズムを利用して、新しいデータセット構築方法を採用している。
論文参考訳（メタデータ） (2024-10-08T01:36:15Z)
OATH: Efficient and Flexible Zero-Knowledge Proofs of End-to-End ML Fairness [13.986886689256128]
Zero-Knowledge Proofs of Fairnessは、サービスプロバイダが彼らのモデルが多様な人口動態を公平に提供できることを検証することによって、フェアネスの非準拠に対処する。 OATHはクライアント対面通信とオフライン監査フェーズを効果的にデプロイできるフレームワークである。 OATHは、ニューラルネットワークZKPoFの以前の作業よりも、ランタイムを1343倍改善し、はるかに大きなモデルにスケールアップする。
論文参考訳（メタデータ） (2024-09-17T16:00:35Z)
ConU: Conformal Uncertainty in Large Language Models with Correctness Coverage Guarantees [68.33498595506941]
自己整合性理論に基づく新しい不確実性尺度を導入する。次に,CPアルゴリズムに正当性に整合した不確かさ条件を組み込むことにより,適合性不確かさの基準を策定する。実証的な評価は、我々の不確実性測定が過去の最先端手法よりも優れていることを示している。
論文参考訳（メタデータ） (2024-06-29T17:33:07Z)
RigorLLM: Resilient Guardrails for Large Language Models against Undesired Content [62.685566387625975]
現在の緩和戦略は効果はあるものの、敵の攻撃下では弾力性がない。本稿では,大規模言語モデルのための弾力性ガードレール(RigorLLM)について紹介する。
論文参考訳（メタデータ） (2024-03-19T07:25:02Z)
Bayesian Optimization with Formal Safety Guarantees via Online Conformal Prediction [36.14499894307206]
ブラックボックスゼロ階最適化は、金融、物理学、工学といった分野における応用において中心的な原始である。本稿では,提案手法の安全性に関するフィードバックも提供するシナリオについて検討する。制約関数の性質に関わらず、安全要件を満たす新しいBOベースのアプローチが導入された。
論文参考訳（メタデータ） (2023-06-30T17:26:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。