論文の概要: Dependency-Guided Repository-Level C-to-Rust Translation with Reinforcement Alignment
- arxiv url: http://arxiv.org/abs/2604.02852v1
- Date: Fri, 03 Apr 2026 08:13:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.394498
- Title: Dependency-Guided Repository-Level C-to-Rust Translation with Reinforcement Alignment
- Title(参考訳): 強化アライメントを用いた依存型レポジトリ-レベルC-to-Rust変換
- Authors: Jia Feng, Wenjie Gan, Cuiyun Gao, Chaozheng Wang, Feng Luo, Xin Xia, Ge Li, Kui Liu,
- Abstract要約: C-to-Rust移行は、パフォーマンスを犠牲にすることなく、ソフトウェアセキュリティを改善するために重要である。
大規模なコードコーパスでトレーニングされた大規模言語モデル(LLM)は、有望な代替手段を提供する。
モデル機能拡張と構造推論を組み合わせたフレームワークであるDepTransを提案する。
- 参考スコア(独自算出の注目度): 26.296349203732138
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automating C-to-Rust migration is critical for improving software security without sacrificing performance. Traditional rule-based methods struggle with diverse C idioms, often producing rigid and unidiomatic Rust code. Large Language Models (LLMs), trained on massive code corpora, offer a promising alternative by leveraging cross-language generalization to generate more idiomatic and maintainable Rust code. However, several challenges remain. First, existing LLM-based approaches fail to handle cross-file dependencies effectively, either ignoring them or including entire files as context, which limits accurate dependency modeling. Second, complex dependencies and structured inputs and outputs make it difficult to verify syntactic correctness and functional equivalence at the repository level. Third, the lack of large-scale C-Rust parallel data constrains model performance. We propose DepTrans, a framework that combines model capability enhancement with structured inference. DepTrans introduces Reinforcement-Aligned Syntax Training to improve generation quality through multi-task fine-tuning and feedback-driven reinforcement learning. It further applies Dependency-Guided Iterative Refinement to capture fine-grained cross-file dependencies and iteratively refine generated Rust code. We construct a dataset of 85k training samples and a benchmark of 145 repository-level instances. Experiments show that DepTrans achieves a 60.7 percent compilation success rate and 43.5 percent computational accuracy, outperforming the strongest baseline by 22.8 and 17.3 percentage points. It also successfully builds 7 of 15 industrial C projects, demonstrating its practical potential.
- Abstract(参考訳): CからRustへのマイグレーションを自動化することは、パフォーマンスを犠牲にすることなく、ソフトウェアセキュリティを改善する上で非常に重要です。
従来のルールベースのメソッドは多様なCイディオムと競合し、しばしば堅固で統一的なRustコードを生成する。
大規模なコードコーパスでトレーニングされたLarge Language Models(LLMs)は、言語間の一般化を活用して、より慣用的でメンテナンス可能なRustコードを生成する、有望な代替手段を提供する。
しかし、いくつかの課題が残っている。
まず、既存のLCMベースのアプローチは、ファイルを無視するか、ファイル全体をコンテキストとして含むか、ファイル間の依存関係を効果的に扱えないため、正確な依存関係モデリングが制限される。
第二に、複雑な依存関係と構造化された入力と出力は、リポジトリレベルでの構文的正確性と機能的等価性を検証するのを難しくする。
第3に、大規模C-Rust並列データ制約の欠如は、モデルの性能を制約する。
モデル機能拡張と構造推論を組み合わせたフレームワークであるDepTransを提案する。
DepTransはReinforcement-Aligned Syntax Trainingを導入し、マルチタスクの微調整とフィードバック駆動の強化学習を通じて生成品質を向上させる。
さらに、Dependency-Guided Iterative Refinementを適用して、きめ細かいクロスファイル依存関係をキャプチャし、生成したRustコードを反復的に洗練する。
85kのトレーニングサンプルのデータセットと145のリポジトリレベルのインスタンスのベンチマークを構築した。
実験の結果、DepTransは60.7%のコンパイル成功率と43.5パーセントの計算精度を達成し、最強のベースラインを22.8ポイント、17.3ポイント上回った。
また15の産業用Cプロジェクトのうち7つを成功させ、その実用的な可能性を実証した。
関連論文リスト
- C2RustXW: Program-Structure-Aware C-to-Rust Translation via Program Analysis and LLM [16.098065606505983]
Toolは、プログラム解析をLLM(Large Language Models)と統合したプログラム構造対応C-to-Rust翻訳アプローチである。
CodeNetの100%構文上の正しさとGitHubの97.78%を実現し、コードサイズ(43.70%まで)と安全でない使用率(5.75%まで)を大幅に削減した。
プロジェクトのレベルでは、ツールが完全な構文的正しさと平均意味論的正しさを78.87%達成し、実用的でスケーラブルなC-to-Rustマイグレーションの有効性を実証している。
論文 参考訳(メタデータ) (2026-03-30T17:07:11Z) - His2Trans: A Skeleton First Framework for Self Evolving C to Rust Translation with Historical Retrieval [45.246293154277886]
His2Transは、決定論的でビルド対応のスケルトンと自己進化的な知識抽出を組み合わせて、安定したインクリメンタルマイグレーションをサポートするフレームワークである。
産業用OpenHarmonyモジュールの実験では、His2Transが99.75%インクリメンタルコンパイルパスレートに達した。
論文 参考訳(メタデータ) (2026-03-03T05:42:08Z) - Architecture-Aware Multi-Design Generation for Repository-Level Feature Addition [53.50448142467294]
RAIMは、リポジトリレベルの機能追加のための、多設計およびアーキテクチャ対応のフレームワークである。
複数の多様な実装設計を生成することで、線形パッチから切り離される。
NoCode-bench Verifiedデータセットの実験では、RAIMが新しい最先端のパフォーマンスを確立することが示されている。
論文 参考訳(メタデータ) (2026-03-02T12:50:40Z) - Do Not Treat Code as Natural Language: Implications for Repository-Level Code Generation and Beyond [13.550121154853715]
自然言語ではなく構造化コードとしてコードを扱う,リポジトリレベルのコード生成フレームワークであるHydraを紹介します。
我々はHydraがオープンソースおよびクローズドソースのCodeLLMにまたがって最先端のパフォーマンスを実現することを示す。
論文 参考訳(メタデータ) (2026-02-12T07:44:00Z) - EvoC2Rust: A Skeleton-guided Framework for Project-Level C-to-Rust Translation [17.560908544319094]
EvoC2Rustは、完全なCプロジェクトを同等のRustに変換する自動化フレームワークである。
プロジェクトレベルの翻訳には骨格誘導翻訳戦略を採用している。
論文 参考訳(メタデータ) (2025-08-06T10:31:23Z) - CRUST-Bench: A Comprehensive Benchmark for C-to-safe-Rust Transpilation [51.18863297461463]
CRUST-Benchは100のCリポジトリのデータセットで、それぞれが安全なRustとテストケースで手書きのインターフェースとペアリングされている。
我々は、このタスクで最先端の大規模言語モデル(LLM)を評価し、安全で慣用的なRust生成が依然として難しい問題であることを確認した。
最高のパフォーマンスモデルであるOpenAI o1は、ワンショット設定で15タスクしか解決できない。
論文 参考訳(メタデータ) (2025-04-21T17:33:33Z) - RustRepoTrans: Repository-level Code Translation Benchmark Targeting Rust [50.65321080814249]
RustRepoTransは、インクリメンタル翻訳をターゲットにした、最初のリポジトリレベルのコンテキストコード変換ベンチマークである。
複雑な翻訳シナリオの制約を評価するために, 7つの代表的なLLMを評価し, それらの誤差を分析した。
論文 参考訳(メタデータ) (2024-11-21T10:00:52Z) - COrAL: Order-Agnostic Language Modeling for Efficient Iterative Refinement [80.18490952057125]
反復改良は、複雑なタスクにおける大規模言語モデル(LLM)の能力を高める効果的なパラダイムとして登場した。
我々はこれらの課題を克服するために、コンテキストワイズ順序非依存言語モデリング(COrAL)を提案する。
当社のアプローチでは、管理可能なコンテキストウィンドウ内で複数のトークン依存関係をモデル化しています。
論文 参考訳(メタデータ) (2024-10-12T23:56:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。