論文の概要: RulER: Automated Rule-Based Semantic Error Localization and Repair for Code Translation
- arxiv url: http://arxiv.org/abs/2509.14829v1
- Date: Thu, 18 Sep 2025 10:45:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:53.168821
- Title: RulER: Automated Rule-Based Semantic Error Localization and Repair for Code Translation
- Title(参考訳): RulER: コード翻訳のためのルールベースの自動セマンティックエラーローカライゼーションと修正
- Authors: Shuo Jin, Songqiang Chen, Xiaoyuan Xie, Shing-Chi Cheung,
- Abstract要約: RulERはルールベースのコード翻訳のデバッグ方法である。
RulERは、LLMによって生成された正しい翻訳からコード翻訳ルールを自動的に導出する。
RulERはパッチ生成のための直接的なLLMよりも優れた修理性能を示す。
- 参考スコア(独自算出の注目度): 7.173039924860286
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated code translation aims to convert programs between different programming languages while maintaining their functionality. Due to the imperfections of code translation models, the generated translations may contain errors that compromise their reliability. Existing automated debugging methods for code translation rely on code alignments and repair patch templates to locate and fix erroneous translations. However, existing methods lack reliable references to construct code alignments and design repair patch templates, which significantly impacts their localization accuracy and repair effectiveness. To address these limitations, we reintroduce code translation rules and propose a rule-based debugging method for code translation, called RulER. RulER automatically derives code translation rules from correct translations generated by LLMs, enabling the efficient collection of diverse translation rules. In addition, RulER dynamically combines the existing rules on expandable nodes like expressions and tokens to further adaptively align more statements. These rules capture clear and detailed structural correspondences between source and target programming languages. Therefore, they can serve as reliable and reusable references for code alignment and repair template design, enabling RulER to locate and fix translation errors effectively. Our evaluation of RulER on Java-to-C++ and Python-to-C++ translations produced by four code translation models demonstrates that RulER outperforms state-of-the-art methods, BatFix and TransMap. Our experimental results show that RulER outperformed the best baseline by 20% and 272% in terms of error localization rates and repair success rates, respectively. RulER exhibits superior repair performance compared to directly prompting LLMs for patch generation, demonstrating a promising methodology for extracting and leveraging coding knowledge from LLMs.
- Abstract(参考訳): 自動コード翻訳は、異なるプログラミング言語間でプログラムを変換し、その機能を維持することを目的としている。
コード翻訳モデルの欠陥のため、生成された翻訳には信頼性を損なうエラーが含まれている可能性がある。
コード翻訳のための既存の自動デバッギングメソッドは、コードのアライメントと修正パッチテンプレートに依存して、誤った翻訳を見つけ、修正する。
しかし、既存の手法では、コードアライメントや設計の修正パッチテンプレートに対する信頼性に欠けており、ローカライゼーションの精度と修復効率に大きな影響を与えている。
これらの制約に対処するため、コード翻訳ルールを再導入し、ルールベースのコード翻訳デバッグ手法であるRulERを提案する。
RulERは、LLMによって生成された正しい翻訳からコード翻訳ルールを自動的に導き出し、多様な翻訳規則の効率的な収集を可能にする。
さらにRulERは、式やトークンのような拡張可能なノード上の既存のルールを動的に組み合わせて、より多くのステートメントを適応的に調整する。
これらの規則は、ソース言語とターゲットプログラミング言語の間の明確で詳細な構造的対応を捉えている。
したがって、コードアライメントと修復テンプレート設計のための信頼性と再利用可能なリファレンスとして機能し、RulERが翻訳エラーを効果的に見つけて修正することができる。
4つのコード翻訳モデルによって生成されたJava-to-C++とPython-to-C++の翻訳に対するRulERの評価は、RulERが最先端のメソッドであるBatFixとTransMapより優れていることを示している。
実験の結果,RulERは誤差局所化率と修復成功率において,20%,272%で最高のベースラインを達成できた。
RulERは、パッチ生成のためのLLMを直接的に促すよりも優れた修復性能を示し、LLMからコーディング知識を抽出し活用するための有望な方法論を実証している。
関連論文リスト
- IFEvalCode: Controlled Code Generation [69.28317223249358]
本稿では,Code LLMの命令追従能力を改善するために,前方および後方制約生成を提案する。
IFEvalCodeは、7つのプログラミング言語の1.6Kテストサンプルからなる多言語ベンチマークである。
論文 参考訳(メタデータ) (2025-07-30T08:08:48Z) - Function-to-Style Guidance of LLMs for Code Translation [59.487054943812836]
コード翻訳における大規模言語モデルの性能向上を目的として,F2STransという関数型案内パラダイムを提案する。
提案手法は,(1)高品質なソースターゲットコードペアを用いた翻訳精度を最適化する機能学習という2つの重要な段階から構成される。
我々は,最新のソースコード,広範なテストケース,手動で注釈付き接頭辞翻訳を含む新しいコード翻訳ベンチマークを導入する。
論文 参考訳(メタデータ) (2025-07-15T08:25:02Z) - Scalable, Validated Code Translation of Entire Projects using Large Language Models [13.059046327936393]
大規模言語モデル(LLM)は、慣用的なコードを生成する能力のため、コード翻訳において有望であることを示す。
既存の作品では、100行以上のコードに対する翻訳の成功率が低下している。
私たちは、コードを独立した翻訳が可能な小さなコードフラグメントに分割する、トランスフォーメーションのためのモジュラーアプローチを開発しています。
我々は,最大6,600行のコードと369の関数に対して,信頼性の高いRustを一貫して生成できることを示し,平均73%の関数をI/O同値で検証した。
論文 参考訳(メタデータ) (2024-12-11T02:31:46Z) - Semantic Alignment-Enhanced Code Translation via an LLM-Based Multi-Agent System [24.52067108242477]
コード翻訳は、ソフトウェアマイグレーション、システムアブレーション、クロスプラットフォーム開発に不可欠である。
従来のルールベースのメソッドは手書きのルールに依存している。
最近では、LLM(Large Language Models)の進歩により、学習ベースのコード翻訳がさらに強化されている。
本稿では,構文誤りや意味的誤りを解消し,LLMに基づくコード翻訳を強化した新しいマルチエージェントシステムTransagENTを提案する。
論文 参考訳(メタデータ) (2024-09-30T02:53:03Z) - Investigating the Transferability of Code Repair for Low-Resource Programming Languages [57.62712191540067]
大規模言語モデル(LLM)は、コード生成タスクにおいて顕著なパフォーマンスを示している。
近年の作業は、連鎖推論や蒸留といった現代的な技術を統合することで、コード修復のプロセスを強化している。
高低資源言語と低低資源言語の両方でコード修復を蒸留する利点について検討する。
論文 参考訳(メタデータ) (2024-06-21T05:05:39Z) - Building Accurate Translation-Tailored LLMs with Language Aware Instruction Tuning [57.323716555996114]
オフターゲット翻訳は、特に低リソース言語では未解決の問題である。
最近の研究は、翻訳命令の機能を強調するために高度なプロンプト戦略を設計するか、LLMの文脈内学習能力を活用している。
本研究では,LLMの命令追従能力(特に翻訳方向)を向上させるために,2段階の微調整アルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-03-21T13:47:40Z) - A Novel Approach for Automatic Program Repair using Round-Trip
Translation with Large Language Models [50.86686630756207]
研究によると、ある文の文法的誤りは、それを他の言語に翻訳し、その語を返せば修正できる。
現在の自動プログラム修復(APR)生成モデルは、ソースコードで事前訓練され、修正のために微調整されている。
本稿では,あるプログラミング言語から別のプログラミング言語,あるいは自然言語へのコード変換,そして,その逆といった,微調整ステップをバイパスし,ラウンド・トリップ変換(RTT)を用いる手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T22:36:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。