論文の概要: His2Trans: A Skeleton First Framework for Self Evolving C to Rust Translation with Historical Retrieval
- arxiv url: http://arxiv.org/abs/2603.02617v1
- Date: Tue, 03 Mar 2026 05:42:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.649836
- Title: His2Trans: A Skeleton First Framework for Self Evolving C to Rust Translation with Historical Retrieval
- Title(参考訳): His2Trans: 歴史検索によるCからRustへの自己進化のためのスケルトン最初のフレームワーク
- Authors: Shengbo Wang, Mingwei Liu, Guangsheng Ou, Yuwen Chen, Zike Li, Yanlin Wang, Zibin Zheng,
- Abstract要約: His2Transは、決定論的でビルド対応のスケルトンと自己進化的な知識抽出を組み合わせて、安定したインクリメンタルマイグレーションをサポートするフレームワークである。
産業用OpenHarmonyモジュールの実験では、His2Transが99.75%インクリメンタルコンパイルパスレートに達した。
- 参考スコア(独自算出の注目度): 45.246293154277886
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated C-to-Rust migration encounters systemic obstacles when scaling from code snippets to industrial projects, mainly because build context is often unavailable ("dependency hell") and domain-specific evolutionary knowledge is missing. As a result, current LLM-based methods frequently cannot reconstruct precise type definitions under complex build systems or infer idiomatic API correspondences, which in turn leads to hallucinated dependencies and unproductive repair loops. To tackle these issues, we introduce His2Trans, a framework that combines a deterministic, build-aware skeleton with self-evolving knowledge extraction to support stable, incremental migration. On the structural side, His2Trans performs build tracing to create a compilable Project-Level Skeleton Graph, providing a strictly typed environment that separates global verification from local logic generation. On the cognitive side, it derives fine-grained API and code-fragment rules from historical migration traces and uses a Retrieval-Augmented Generation (RAG) system to steer the LLM toward idiomatic interface reuse. Experiments on industrial OpenHarmony modules show that His2Trans reaches a 99.75% incremental compilation pass rate, effectively fixing build failures where baselines struggle. On general-purpose benchmarks, it lowers the unsafe code ratio by 23.6 percentage points compared to C2Rust while producing the fewest warnings. Finally, knowledge accumulation studies demonstrate the framework's evolutionary behavior: by continuously integrating verified patterns, His2Trans cuts repair overhead on unseen tasks by about 60%.
- Abstract(参考訳): CからRustへの自動マイグレーションは、コードスニペットから産業プロジェクトへのスケーリングにおいて、システム上の障害に直面する。
結果として,現在のLCMベースの手法では,複雑なビルドシステム下での正確な型定義の再構築や慣用的なAPI対応の推測がしばしば行われず,その結果,幻覚的依存関係や非生産的修復ループが生じる。
これらの問題に対処するために、我々は、決定論的でビルド対応のスケルトンと自己進化的な知識抽出を組み合わせたフレームワークHis2Transを導入し、安定的で漸進的なマイグレーションをサポートする。
構造面では、His2Transはコンパイル可能なProject-Level Skeleton Graphを作成するためにビルドトレースを実行する。
認知面では、歴史的なマイグレーショントレースから細粒度のAPIとコードフラグメントルールを導出し、LLMを慣用的なインタフェースの再利用に向けて操るために、レトリーバル拡張生成(RAG)システムを使用する。
インダストリアルOpenHarmonyモジュールの実験によると、His2Transは99.75%のインクリメンタルコンパイルパスレートに達し、ベースラインが苦労するビルド失敗を効果的に修正している。
汎用ベンチマークでは、最も少ない警告を生成しながら、C2Rustと比較して安全でないコードの割合を23.6ポイント下げる。
検証済みのパターンを継続的に統合することで、His2Transは目に見えないタスクの修復オーバーヘッドを約60%削減します。
関連論文リスト
- Why Does the LLM Stop Computing: An Empirical Study of User-Reported Failures in Open-Source LLMs [50.075587392477935]
オープンソースのDeepSeek、Llama、Qwenのエコシステムから、705の現実世界の失敗に関する大規模な実証的研究を行った。
ホワイトボックスオーケストレーションは、モデルアルゴリズムの欠陥からデプロイメントスタックのシステム的脆弱性へと、信頼性のボトルネックを移動させます。
論文 参考訳(メタデータ) (2026-01-20T06:42:56Z) - LibContinual: A Comprehensive Library towards Realistic Continual Learning [62.34449396069085]
継続的学習(CL)における根本的な課題は破滅的な忘れ込みであり、新しいタスクに適応することで、以前のタスクのパフォーマンスが低下する。
現実的なCLの基礎となるプラットフォームとして設計された,包括的で再現可能なライブラリであるLibContinualを提案する。
論文 参考訳(メタデータ) (2025-12-26T13:59:13Z) - Completion by Comprehension: Guiding Code Generation with Multi-Granularity Understanding [37.78627994991325]
CoCoは、大規模なコードリポジトリから複数の粒度コンテキストでコード補完を可能にする新しいフレームワークである。
CrossCodeEvalとRepoEvalベンチマークの実験は、CoCoが最先端のベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-12-04T07:37:59Z) - Context-Guided Decompilation: A Step Towards Re-executability [50.71992919223209]
バイナリ逆コンパイルは、ソフトウェアセキュリティ分析、リバースエンジニアリング、マルウェア理解において重要な役割を果たす。
大規模言語モデル (LLMs) の最近の進歩により、ニューラルデコンパイルが可能になったが、生成されたコードは一般的に意味論的にのみ使用可能である。
In-context Learning(ICL)を活用して,再実行可能なソースコードを生成するためのILC4Decompを提案する。
論文 参考訳(メタデータ) (2025-11-03T17:21:39Z) - SK2Decompile: LLM-based Two-Phase Binary Decompilation from Skeleton to Skin [17.843213826367343]
SK2Decompileは,スケルトン(意味構造)からプログラムのスキン(識別器)へデコンパイルするための新しい2相アプローチである。
具体的には、まず、プログラムの「スケルトン」の導出として、プログラムのバイナリコードを中間表現(IR)に変換する構造回復モデルを適用する。
我々は,コンパイラが期待する構文的・意味的規則に従うプログラム構造を生成するモデルに,強化学習を適用した。
論文 参考訳(メタデータ) (2025-09-26T09:35:46Z) - Integrating Rules and Semantics for LLM-Based C-to-Rust Translation [34.61632926526051]
我々は、翻訳を強化するためにRulEs aNd sEmanticsを統合したLLMベースのフレームワークであるIRENEを提案する。
IRENEは3つのモジュールから構成される。1) 静的アナライザから生成されたルールに基づいて関連する翻訳例を選択するルール拡張された検索モジュールで、Rustルールの処理を改善し、2) LLMを誘導してCコードのセマンティック理解を強化する構造化要約モジュール、3) コンパイラ診断を利用して反復的に翻訳を洗練するエラー駆動翻訳モジュール。
論文 参考訳(メタデータ) (2025-08-09T10:41:03Z) - EvoC2Rust: A Skeleton-guided Framework for Project-Level C-to-Rust Translation [17.560908544319094]
EvoC2Rustは、完全なCプロジェクトを同等のRustに変換する自動化フレームワークである。
プロジェクトレベルの翻訳には骨格誘導翻訳戦略を採用している。
論文 参考訳(メタデータ) (2025-08-06T10:31:23Z) - Large Language Model-Powered Agent for C to Rust Code Translation [2.182572303351317]
現代のシステムプログラミング言語であるRustは、C言語に代わるメモリセーフな代替言語として登場した。
C-to-Rust翻訳のエージェント能力の適用は、異なる課題をもたらす。
数学や常識 QA とは異なり、C-to-Rust に必要な中間ステップは十分に定義されていない。
我々は、新しい中間ステップ、仮想ファジィングに基づく等価テスト(VFT)、エージェント計画フレームワーク、LLMを利用したC-to-Rustコード翻訳のためのエージェント(LAC2R)を提案する。
論文 参考訳(メタデータ) (2025-05-21T01:26:23Z) - ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。
このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-02-17T12:38:57Z) - MemoRAG: Boosting Long Context Processing with Global Memory-Enhanced Retrieval Augmentation [60.04380907045708]
Retrieval-Augmented Generation (RAG)は、この問題に対処するための有望な戦略と考えられている。
我々は,グローバルメモリ拡張検索による新しいRAGフレームワークであるMemoRAGを提案する。
MemoRAGは、様々な長期コンテキスト評価タスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-09-09T13:20:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。