論文の概要: Translating PL/I Macro Procedures into Java Using Automatic Templatization and Large Language Models
- arxiv url: http://arxiv.org/abs/2512.06448v1
- Date: Sat, 06 Dec 2025 14:20:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.365832
- Title: Translating PL/I Macro Procedures into Java Using Automatic Templatization and Large Language Models
- Title(参考訳): 自動テンプレート化と大規模言語モデルを用いたPL/Iマクロ手順のJavaへの変換
- Authors: Takaaki Tateishi, Yasuharu Katsuno,
- Abstract要約: レガシーエンタープライズシステムを近代化するには、しばしばPL/IプログラムをJavaのようなモダンな言語に変換する必要がある。
PL/IマクロプロシージャはPL/Iコードを生成する文字列操作プログラムと考えられる。
本稿では,コードテンプレートの生成にシンボリック実行を用いるテンプレート化という新しい手法を提案する。
- 参考スコア(独自算出の注目度): 0.29005223064604074
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modernizing legacy enterprise systems often involves translating PL/I programs into modern languages such as Java. This task becomes significantly more complex when PL/I macro procedures are involved. The PL/I macro procedures are considered string-manipulating programs that generate PL/I code, and they make automated translation more complex. Recently, large language models (LLMs) have been explored for automated code translation. However, LLM-based code translation struggles to translate the PL/I macro procedures to Java programs that reproduce the behavior of the plain PL/I code generated by the original PL/I macro procedures. This paper proposes a novel method called templatization, which uses symbolic execution to generate code templates (code with named placeholders) as an intermediate representation. In this approach, symbolic values are treated as parts of macro-generated code. By symbolically executing macro procedures and generating code templates, our approach facilitates LLMs to generate readable and maintainable Java code. Our preliminary experiment on ten PL/I macro procedures shows that the LLM-based translation through templatization successfully generates Java programs that reproduce the behavior of the macro-generated PL/I programs.
- Abstract(参考訳): レガシーエンタープライズシステムを近代化するには、しばしばPL/IプログラムをJavaのようなモダンな言語に変換する必要がある。
PL/Iマクロプロシージャが関与すると、このタスクは大幅に複雑になる。
PL/IマクロプロシージャはPL/Iコードを生成する文字列操作プログラムとみなされており、自動翻訳をより複雑にしている。
近年,大規模な言語モデル (LLM) がコード翻訳の自動化のために研究されている。
しかし、LLMベースのコード翻訳は、PL/Iマクロプロシージャが生成した通常のPL/Iコードの振る舞いを再現するJavaプログラムにPL/Iマクロプロシージャを変換するのに苦労している。
本稿では,コードテンプレート(名前付きプレースホルダー付きコード)を中間表現として,シンボル実行を用いて生成するテンプレート化手法を提案する。
このアプローチでは、シンボル値はマクロ生成コードの一部として扱われる。
マクロプロシージャを象徴的に実行し,コードテンプレートを生成することで,LLMが可読かつメンテナンス可能なJavaコードを生成することができる。
10個のPL/Iマクロプロシージャの予備実験により,PL/Iプログラムの動作を再現するJavaプログラムの生成に成功した。
関連論文リスト
- IFEvalCode: Controlled Code Generation [69.28317223249358]
本稿では,Code LLMの命令追従能力を改善するために,前方および後方制約生成を提案する。
IFEvalCodeは、7つのプログラミング言語の1.6Kテストサンプルからなる多言語ベンチマークである。
論文 参考訳(メタデータ) (2025-07-30T08:08:48Z) - Type-Constrained Code Generation with Language Models [51.03439021895432]
本稿では,型システムを利用してコード生成を誘導する型制約デコード手法を提案する。
そこで本研究では,新しい接頭辞オートマトンと,在来型を探索する手法を開発し,LLM生成コードに適切な型付けを強制するための健全なアプローチを構築した。
提案手法は,コード合成,翻訳,修復作業において,コンパイルエラーを半分以上削減し,機能的正しさを著しく向上させる。
論文 参考訳(メタデータ) (2025-04-12T15:03:00Z) - Codellm-Devkit: A Framework for Contextualizing Code LLMs with Program Analysis Insights [9.414198519543564]
codellm-devkit (以下, CLDK') は,プログラム解析のプロセスを大幅に単純化したオープンソースライブラリである。
CLDKは開発者に対して直感的でユーザフレンドリなインターフェースを提供しています。
論文 参考訳(メタデータ) (2024-10-16T20:05:59Z) - InverseCoder: Self-improving Instruction-Tuned Code LLMs with Inverse-Instruct [43.7550233177368]
本稿では、微調整されたオープンソースモデルを用いて、追加データを生成して命令調整データセットを拡張できるかどうかを考察する。
Inverse-Instructは、微調整 LLM を用いて、独自のトレーニングデータセットからコード応答の追加命令を生成するデータ拡張手法である。
論文 参考訳(メタデータ) (2024-07-08T08:00:05Z) - Towards Large Language Model Aided Program Refinement [10.089955747110444]
プログラムの洗練には、正式なハイレベルな仕様文から実行可能なプログラムへの正当性保存の変換が含まれる。
大型言語モデル(LLM)は、非公式な自然言語仕様から自動コード生成を可能にする。
LLM4PRは,形式的プログラム改善手法と非公式なLCMベースの手法を組み合わせたツールである。
論文 参考訳(メタデータ) (2024-06-26T04:29:27Z) - MTP: A Meaning-Typed Language Abstraction for AI-Integrated Programming [8.768061489034642]
本稿では,直感的な言語レベルでの統合を自動化する新しいパラダイムであるMeaning-Typed Programming(MTP)を提案する。
我々はPythonに取って代わるプログラミング言語であるJacにMPPを実装し、MPPは精度と効率を保ちながら、コーディングの複雑さを著しく低減することがわかった。
私たちのユーザ調査では、既存のフレームワークと比較して、タスクの完了率が3.2倍速く、コード行数が45%少ないことが示されています。
論文 参考訳(メタデータ) (2024-05-14T21:12:01Z) - CodeIP: A Grammar-Guided Multi-Bit Watermark for Large Language Models of Code [56.019447113206006]
大規模言語モデル(LLM)はコード生成において顕著な進歩を遂げた。
CodeIPは、新しいマルチビット透かし技術で、出所の詳細を保持するために追加情報を挿入する。
5つのプログラミング言語にまたがる実世界のデータセットで実施された実験は、CodeIPの有効性を実証している。
論文 参考訳(メタデータ) (2024-04-24T04:25:04Z) - If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code
Empowers Large Language Models to Serve as Intelligent Agents [81.60906807941188]
大型言語モデル(LLM)は、自然言語と形式言語(コード)の組み合わせに基づいて訓練される
コードは、標準構文、論理一貫性、抽象化、モジュール性を備えた高レベルの目標を実行可能なステップに変換する。
論文 参考訳(メタデータ) (2024-01-01T16:51:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。