Fugu-MT 論文翻訳(概要): Large Language Model-Powered Agent for C to Rust Code Translation

論文の概要: Large Language Model-Powered Agent for C to Rust Code Translation

arxiv url: http://arxiv.org/abs/2505.15858v1
Date: Wed, 21 May 2025 01:26:23 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-23 17:12:47.816329
Title: Large Language Model-Powered Agent for C to Rust Code Translation
Title（参考訳）: CからRustへのコード翻訳のための大規模言語モデル駆動エージェント
Authors: HoHyun Sim, Hyeonjoong Cho, Yeonghyeon Go, Zhoulai Fu, Ali Shokri, Binoy Ravindran,
Abstract要約: 現代のシステムプログラミング言語であるRustは、C言語に代わるメモリセーフな代替言語として登場した。 C-to-Rust翻訳のエージェント能力の適用は、異なる課題をもたらす。数学や常識 QA とは異なり、C-to-Rust に必要な中間ステップは十分に定義されていない。我々は、新しい中間ステップ、仮想ファジィングに基づく等価テスト(VFT)、エージェント計画フレームワーク、LLMを利用したC-to-Rustコード翻訳のためのエージェント(LAC2R)を提案する。
参考スコア（独自算出の注目度）: 2.182572303351317
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: The C programming language has been foundational in building system-level software. However, its manual memory management model frequently leads to memory safety issues. In response, a modern system programming language, Rust, has emerged as a memory-safe alternative. Moreover, automating the C-to-Rust translation empowered by the rapid advancements of the generative capabilities of LLMs is gaining growing interest for large volumes of legacy C code. Despite some success, existing LLM-based approaches have constrained the role of LLMs to static prompt-response behavior and have not explored their agentic problem-solving capability. Applying the LLM agentic capability for the C-to-Rust translation introduces distinct challenges, as this task differs from the traditional LLM agent applications, such as math or commonsense QA domains. First, the scarcity of parallel C-to-Rust datasets hinders the retrieval of suitable code translation exemplars for in-context learning. Second, unlike math or commonsense QA, the intermediate steps required for C-to-Rust are not well-defined. Third, it remains unclear how to organize and cascade these intermediate steps to construct a correct translation trajectory. To address these challenges in the C-to-Rust translation, we propose a novel intermediate step, the Virtual Fuzzing-based equivalence Test (VFT), and an agentic planning framework, the LLM-powered Agent for C-to-Rust code translation (LAC2R). The VFT guides LLMs to identify input arguments that induce divergent behaviors between an original C function and its Rust counterpart and to generate informative diagnoses to refine the unsafe Rust code. LAC2R uses the MCTS to systematically organize the LLM-induced intermediate steps for correct translation. We experimentally demonstrated that LAC2R effectively conducts C-to-Rust translation on large-scale, real-world benchmarks.
Abstract（参考訳）: C言語はシステムレベルのソフトウェアの構築に基礎を置いている。しかし、その手動メモリ管理モデルはしばしばメモリ安全性の問題を引き起こす。これに対して、現代のシステムプログラミング言語であるRustは、メモリセーフな代替として登場した。さらに、LLMの生成能力の急速な進歩により、C-to-Rust翻訳が自動化されるようになり、多くのレガシーCコードに対する関心が高まっている。いくつかの成功にもかかわらず、既存のLCMベースのアプローチは、LCMの役割を静的なプロンプト応答動作に制限し、エージェント的問題解決能力について検討していない。 C-to-Rust翻訳にLLMエージェント機能を適用することは、数学や常識QAドメインのような従来のLLMエージェントアプリケーションとは異なるため、異なる課題をもたらす。第一に、並列C-to-Rustデータセットの不足は、テキスト内学習に適したコード翻訳例の検索を妨げる。第二に、数学や常識 QA とは異なり、C-to-Rust に必要な中間ステップは十分に定義されていない。第三に、これらの中間段階の編成とカスケードが正しい翻訳軌道を構築するのにどうすればよいのかは、いまだ不明である。 C-to-Rust翻訳におけるこれらの課題に対処するために,新たな中間ステップであるVirtual Fuzzing-based equivalence Test (VFT) とエージェント計画フレームワークである LLM-powered Agent for C-to-Rust code translation (LAC2R) を提案する。 VFTはLSMをガイドして、元のC関数とそのRust関数間の分岐挙動を誘導する入力引数を特定し、安全でないRustコードを洗練するための情報診断を生成する。 LAC2RはMCTSを使用してLCMによって誘導される中間段階を体系的に整理し、正しい翻訳を行う。 LAC2Rは大規模実世界のベンチマークでC-to-Rust変換を効果的に行うことを実験的に実証した。

関連論文リスト

Project-Level C-to-Rust Translation via Synergistic Integration of Knowledge Graphs and Large Language Models [19.90921023222177]
Cコードを安全なRustに変換することは、メモリ安全性を確保する効果的な方法である。新しいC-Rust Pointer Knowledge Graphは、グローバルの観点からポインタセマンティクスを提供する。我々の実験では、翻訳されたRustの安全でない使用量を99.9%削減している。
論文参考訳（メタデータ） (2025-10-13T03:09:35Z)
Integrating Rules and Semantics for LLM-Based C-to-Rust Translation [34.61632926526051]
我々は、翻訳を強化するためにRulEs aNd sEmanticsを統合したLLMベースのフレームワークであるIRENEを提案する。 IRENEは3つのモジュールから構成される。1) 静的アナライザから生成されたルールに基づいて関連する翻訳例を選択するルール拡張された検索モジュールで、Rustルールの処理を改善し、2) LLMを誘導してCコードのセマンティック理解を強化する構造化要約モジュール、3) コンパイラ診断を利用して反復的に翻訳を洗練するエラー駆動翻訳モジュール。
論文参考訳（メタデータ） (2025-08-09T10:41:03Z)
EVOC2RUST: A Skeleton-guided Framework for Project-Level C-to-Rust Translation [16.12483934561206]
EvoC2Rustは、Cプロジェクト全体を同等のRustに変換する自動化フレームワークである。オープンソースベンチマークと6つの産業プロジェクトに対する評価は,プロジェクトレベルのC-to-Rust翻訳におけるEvoC2Rustの優れた性能を示している。
論文参考訳（メタデータ） (2025-08-06T10:31:23Z)
Function-to-Style Guidance of LLMs for Code Translation [59.487054943812836]
コード翻訳における大規模言語モデルの性能向上を目的として,F2STransという関数型案内パラダイムを提案する。提案手法は,(1)高品質なソースターゲットコードペアを用いた翻訳精度を最適化する機能学習という2つの重要な段階から構成される。我々は,最新のソースコード,広範なテストケース,手動で注釈付き接頭辞翻訳を含む新しいコード翻訳ベンチマークを導入する。
論文参考訳（メタデータ） (2025-07-15T08:25:02Z)
The Unreasonable Effectiveness of Model Merging for Cross-Lingual Transfer in LLMs [54.59207567677249]
大規模言語モデル(LLM)は、ハイソース言語以外のタスクで依然として苦戦している。本研究では,タスク固有のポストトレーニングデータが不足している低リソース言語への言語間移動について検討する。
論文参考訳（メタデータ） (2025-05-23T20:28:31Z)
SafeTrans: LLM-assisted Transpilation from C to Rust [5.6274106543826585]
Rustは、Cの"システム"プログラミング言語としてのメモリセーフな代替として、強力な競争相手である。本稿では,大規模な言語モデル(LLM)がRustへのCコードの自動コンパイルを実現する可能性を評価する。 SafeTrans は LLM を使って,C コードを Rust にトランスパイルするフレームワークである。
論文参考訳（メタデータ） (2025-05-15T21:05:33Z)
CRUST-Bench: A Comprehensive Benchmark for C-to-safe-Rust Transpilation [63.23120252801889]
CRUST-Benchは100のCリポジトリのデータセットで、それぞれが安全なRustとテストケースで手書きのインターフェースとペアリングされている。我々は、このタスクで最先端の大規模言語モデル(LLM)を評価し、安全で慣用的なRust生成が依然として難しい問題であることを確認した。最高のパフォーマンスモデルであるOpenAI o1は、ワンショット設定で15タスクしか解決できない。
論文参考訳（メタデータ） (2025-04-21T17:33:33Z)
LLMigrate: Transforming "Lazy" Large Language Models into Efficient Source Code Migrators [21.114491141763647]
RustでCコードを書き直すことでメモリの安全性が向上するが、32万行のLinuxカーネルのような大規模なマイグレーションは依然として困難である。最近のLarge Language Model (LLM)アプローチは、より慣用的で安全なRustプログラムを生成するが、しばしば"遅延"を示す。 LLMベースのC-to-Rust翻訳ツールはモジュールを個別の関数に分割し、個別に翻訳し、再統合する。
論文参考訳（メタデータ） (2025-03-31T07:09:07Z)
Syzygy: Dual Code-Test C to (safe) Rust Translation using LLMs and Dynamic Analysis [8.361424157571468]
Syzygyは、C言語を安全なRustに変換する自動化アプローチである。これは、Rustのコード翻訳を安全にする上で、これまでで最大の自動化およびテスト検証済みのCである。
論文参考訳（メタデータ） (2024-12-18T18:55:46Z)
RustRepoTrans: Repository-level Code Translation Benchmark Targeting Rust [50.65321080814249]
RustRepoTransは、インクリメンタル翻訳をターゲットにした、最初のリポジトリレベルのコンテキストコード変換ベンチマークである。複雑な翻訳シナリオの制約を評価するために, 7つの代表的なLLMを評価し, それらの誤差を分析した。
論文参考訳（メタデータ） (2024-11-21T10:00:52Z)
Context-aware Code Segmentation for C-to-Rust Translation using Large Language Models [1.8416014644193066]
大きな言語モデル(LLM)は、ルールベースのメソッドよりも自然で安全なコードを生成することで、この翻訳を自動化することを約束している。大規模Cコードをコンパイル可能なRustコードに変換する際の成功率を改善するLLMベースの翻訳方式を提案する。 4キロのコードを含む20のベンチマークCプログラムの実験では、すべてのプログラムをコンパイル可能なRustコードに変換することに成功した。
論文参考訳（メタデータ） (2024-09-16T17:52:36Z)
Why Not Transform Chat Large Language Models to Non-English? [57.16587777261422]
非英語データの不足は、非英語大言語モデル(LLM)の開発を制限する TransLLMは、転送問題を変換チェーン・オブ・シント(translation chain of-of- Thought)でいくつかの一般的なサブタスクに分割する。本手法は,シングルターンデータのみを用いて,マルチターンベンチマークMT-benchにおいて,強いベースラインとChatGPTより優れる。
論文参考訳（メタデータ） (2024-05-22T18:53:25Z)
If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code Empowers Large Language Models to Serve as Intelligent Agents [81.60906807941188]
大型言語モデル(LLM)は、自然言語と形式言語(コード)の組み合わせに基づいて訓練されるコードは、標準構文、論理一貫性、抽象化、モジュール性を備えた高レベルの目標を実行可能なステップに変換する。
論文参考訳（メタデータ） (2024-01-01T16:51:20Z)
ML-Bench: Evaluating Large Language Models and Agents for Machine Learning Tasks on Repository-Level Code [76.84199699772903]
ML-Benchは、既存のコードリポジトリを利用してタスクを実行する現実世界のプログラミングアプリケーションに根ざしたベンチマークである。 LLM(Large Language Model)とAIエージェントの両方を評価するために、事前に定義されたデプロイメント環境でLLMのテキスト-コード変換を評価するML-LLM-Benchと、Linuxサンドボックス環境でエンドツーエンドのタスク実行で自律エージェントをテストするML-Agent-Benchの2つの設定が採用されている。
論文参考訳（メタデータ） (2023-11-16T12:03:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。