論文の概要: Leveraging LLMs for Automated Translation of Legacy Code: A Case Study on PL/SQL to Java Transformation
- arxiv url: http://arxiv.org/abs/2508.19663v1
- Date: Wed, 27 Aug 2025 08:21:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.555971
- Title: Leveraging LLMs for Automated Translation of Legacy Code: A Case Study on PL/SQL to Java Transformation
- Title(参考訳): レガシーコードの自動翻訳のためのLLMの活用:PL/SQLからJavaへの変換を事例として
- Authors: Lola Solovyeva, Eduardo Carneiro Oliveira, Shiyu Fan, Alper Tuncay, Shamil Gareev, Andrea Capiluppi,
- Abstract要約: 約250万行のPL/コードで構成されるVTレガシシステムは、一貫したドキュメントと自動テストが欠如している。
本研究では,PL/コードをJavaに翻訳する上で,大規模言語モデル(LLM)を活用する可能性について検討する。
- 参考スコア(独自算出の注目度): 2.1242970730855135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The VT legacy system, comprising approximately 2.5 million lines of PL/SQL code, lacks consistent documentation and automated tests, posing significant challenges for refactoring and modernisation. This study investigates the feasibility of leveraging large language models (LLMs) to assist in translating PL/SQL code into Java for the modernised "VTF3" system. By leveraging a dataset comprising 10 PL/SQL-to-Java code pairs and 15 Java classes, which collectively established a domain model for the translated files, multiple LLMs were evaluated. Furthermore, we propose a customized prompting strategy that integrates chain-of-guidance reasoning with $n$-shot prompting. Our findings indicate that this methodology effectively guides LLMs in generating syntactically accurate translations while also achieving functional correctness. However, the findings are limited by the small sample size of available code files and the restricted access to test cases used for validating the correctness of the generated code. Nevertheless, these findings lay the groundwork for scalable, automated solutions in modernising large legacy systems.
- Abstract(参考訳): 約250万行のPL/SQLコードで構成されるVTレガシシステムは、一貫したドキュメンテーションと自動テストが欠如しており、リファクタリングとモダナイゼーションにおいて大きな課題となっている。
本研究では,大規模言語モデル (LLM) を活用して, PL/SQL コードを Java に翻訳し, 近代化された "VTF3" システムの実現可能性について検討する。
10のPL/SQL-to-Javaコードペアと15のJavaクラスからなるデータセットを利用して、翻訳されたファイルのドメインモデルを構築し、複数のLCMを評価した。
さらに,チェーンオブガイダンス推論と$n$-shotプロンプトを統合したカスタマイズプロンプト戦略を提案する。
本手法は, 機能的正当性を達成しつつ, 構文的に正確な翻訳を生成する上で, LLMを効果的に導くことを示唆している。
しかし、この発見は利用可能なコードファイルの小さなサンプルサイズと、生成されたコードの正確性を検証するために使用されるテストケースへの制限されたアクセスによって制限される。
それでもこれらの発見は、大規模レガシシステムの近代化において、スケーラブルで自動化されたソリューションの基礎を築いた。
関連論文リスト
- On LLM-Assisted Generation of Smart Contracts from Business Processes [0.08192907805418582]
大規模言語モデル(LLM)は、ソフトウェアの生成方法の現実を変えました。
本稿では、ビジネスプロセス記述からスマートコントラクトコードを生成するためのLCMの使用について探索的研究を行う。
以上の結果から,LLMの性能はスマートコントラクト開発に必要な信頼性に劣ることがわかった。
論文 参考訳(メタデータ) (2025-07-30T20:39:45Z) - Can the Rookies Cut the Tough Cookie? Exploring the Use of LLMs for SQL Equivalence Checking [15.42143912008553]
クエリ等価性チェックのためのSQLEquiQuestという,新しい,現実的で,十分に複雑なベンチマークを導入する。
我々は,様々なプロンプト戦略とテキスト内学習例を用いて,最先端のLLMを評価した。
解析の結果,LLMは等価性予測に強いバイアスを示し,非等価性対に対する性能は一貫して劣っていることがわかった。
論文 参考訳(メタデータ) (2024-12-07T06:50:12Z) - What's Wrong with Your Code Generated by Large Language Models? An Extensive Study [80.18342600996601]
大規模言語モデル(LLM)は、標準解に比べて短いがより複雑なコードを生成する。
3つのカテゴリと12のサブカテゴリを含む誤ったコードに対するバグの分類を開発し、一般的なバグタイプに対する根本原因を分析する。
そこで本研究では,LLMがバグタイプやコンパイラフィードバックに基づいて生成したコードを批判し,修正することのできる,自己批判を導入した新たな学習自由反復手法を提案する。
論文 参考訳(メタデータ) (2024-07-08T17:27:17Z) - ML-Bench: Evaluating Large Language Models and Agents for Machine Learning Tasks on Repository-Level Code [76.84199699772903]
ML-Benchは、既存のコードリポジトリを利用してタスクを実行する現実世界のプログラミングアプリケーションに根ざしたベンチマークである。
LLM(Large Language Model)とAIエージェントの両方を評価するために、事前に定義されたデプロイメント環境でLLMのテキスト-コード変換を評価するML-LLM-Benchと、Linuxサンドボックス環境でエンドツーエンドのタスク実行で自律エージェントをテストするML-Agent-Benchの2つの設定が採用されている。
論文 参考訳(メタデータ) (2023-11-16T12:03:21Z) - Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation [76.76046657162306]
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
論文 参考訳(メタデータ) (2023-08-29T14:59:54Z) - Querying Large Language Models with SQL [16.383179496709737]
多くのユースケースでは、情報はテキストに格納されるが、構造化データでは利用できない。
事前訓練されたLarge Language Models (LLMs) の台頭に伴い、大量のテキストコーパスから抽出された情報を保存および使用するための効果的なソリューションが現在存在する。
本稿では,従来のデータベースアーキテクチャに基づくプロトタイプであるGaloisについて紹介する。
論文 参考訳(メタデータ) (2023-04-02T06:58:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。