論文の概要: COBOLAssist: Analyzing and Fixing Compilation Errors for LLM-Powered COBOL Code Generation
- arxiv url: http://arxiv.org/abs/2604.03978v1
- Date: Sun, 05 Apr 2026 05:51:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.858194
- Title: COBOLAssist: Analyzing and Fixing Compilation Errors for LLM-Powered COBOL Code Generation
- Title(参考訳): COBOLAsist: LLMによるCOBOLコード生成のためのコンパイルエラーの解析と修正
- Authors: Anh T. V. Dau, Shin Hwei Tan, Jinqiu Yang, Nghi D. Q. Bui, Anh Tuan Nguyen,
- Abstract要約: 本稿では,コンパイルエラーの問題を考察し,これらの問題に対処するための大規模言語モデル(LLM)を利用したフレームワークを提案する。
まず、LLM生成コードの一般的なコンパイルエラーを、不完全なコードエラー、構文エラー、型関連エラーの3つのグループに分類する。
- 参考スコア(独自算出の注目度): 10.733306714499067
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Legacy programming languages such as COBOL (Common Business-Oriented Language) remain critical in business computing. However, maintaining legacy COBOL systems is increasingly challenging due to a declining pool of skilled developers and the persistence of COBOL errors that require deep domain expertise to resolve. This paper investigates the challenges of COBOL compilation errors and introduces a framework leveraging large language models (LLMs) to address these issues. We first categorize the common compilation errors in LLM-generated COBOL code into three groups: incomplete code errors, syntax errors, and type-related errors. We further propose COBOLAssist, a technique to enhance code correctness through iterative repairs guided by compilation feedback. Our evaluation using five LLMs including GPT variants and mAInframer, shows a high prevalence of incorrect program structures and function usage in COBOL programs and demonstrates the effectiveness of COBOLAssist, with the compilation success rates increasing from 29.5\% to 64.38\% for GPT-4o-mini and from 41.8\% to 95.89\% for GPT-4o. It also improves pass@1 significantly, for example from 9.1 to 22.6 for GPT-4. Notably, while mAInframer-34B achieves the highest compilation success rate, its functional correctness remains limited. This research not only highlights the limitations in current LLMs for COBOL but also demonstrates a practical path forward for automated debugging in legacy systems.
- Abstract(参考訳): COBOL(Common Business-Oriented Language)のようなレガシープログラミング言語は、ビジネスコンピューティングにおいて重要な存在である。
しかし、熟練した開発者のプールが減り、ドメインの深い専門知識を必要とするCOBOLエラーが持続しているため、レガシーなCOBOLシステムのメンテナンスはますます困難になっている。
本稿では,COBOLコンパイルエラーの問題点を考察し,これらの問題に対処するための大規模言語モデル(LLM)を活用したフレームワークを提案する。
まず,LLM生成したCOBOLコードの一般的なコンパイルエラーを,不完全なコードエラー,構文エラー,型関連エラーの3つのグループに分類する。
さらに,COBOLAssistを提案する。これは,コンパイルフィードバックによって誘導される反復的な修復によって,コードの正確性を高める手法である。
GPTとmAInframerを含む5つのLCMを用いて、COBOLプログラムにおける不正なプログラム構造と関数利用の頻度が高く、COBOLAssistの有効性を示し、GPT-4o-miniでは29.5\%から64.38\%、GPT-4oでは41.8\%から95.89\%のコンパイル成功率を示した。
GPT-4では9.1から22.6といったパス@1も大幅に改善されている。
特に、mAInframer-34Bはコンパイル成功率が最も高いが、機能的正確性は限られている。
この研究は、COBOLの現在のLLMの限界を強調するだけでなく、レガシーシステムにおける自動デバッグの実践的な道筋も示している。
関連論文リスト
- COBOL-Coder: Domain-Adapted Large Language Models for COBOL Code Generation and Translation [10.733306714499067]
既存の大規模言語モデル(LLM)は、コードを正しく生成し翻訳するのに苦労する。
本稿では,コンパイラ誘導型検証とマルチステージ類似度に基づくフィルタリングを組み合わせた自動データキュレーションパイプラインを提案する。
Code-Coderは最大73.95パーセントのコンパイル成功率と49.33のPass-1 onEvalを実現している。
論文 参考訳(メタデータ) (2026-04-05T06:12:49Z) - HELIOS: Hierarchical Graph Abstraction for Structure-Aware LLM Decompilation [11.110675371854988]
textscHELIOSは、バイナリの逆コンパイルを構造化推論タスクとして再構成するフレームワークである。
textscHELIOSは、セキュリティ設定のリバースエンジニアリングのための実用的なビルディングブロックである。
論文 参考訳(メタデータ) (2026-01-21T02:37:33Z) - Specification-Guided Repair of Arithmetic Errors in Dafny Programs using LLMs [79.74676890436174]
本稿では,障害の局所化と修復のためのオラクルとして形式仕様を用いたDafny用のAPRツールを提案する。
プログラム内の各ステートメントの状態を決定するために、Hoareロジックの使用を含む一連のステップを通じて、障害をローカライズします。
また, GPT-4o miniが74.18%と高い修理成功率を示した。
論文 参考訳(メタデータ) (2025-07-04T15:36:12Z) - Enhancing COBOL Code Explanations: A Multi-Agents Approach Using Large Language Models [1.835291631794229]
本稿では,機能,ファイル,プロジェクト全体の説明を生成するマルチエージェント手法を提案する。
提案手法の有効性を,14のオープンソースプロジェクトを用いて評価した。
論文 参考訳(メタデータ) (2025-07-02T22:28:35Z) - Type-Constrained Code Generation with Language Models [51.03439021895432]
本稿では,型システムを利用してコード生成を誘導する型制約デコード手法を提案する。
そこで本研究では,新しい接頭辞オートマトンと,在来型を探索する手法を開発し,LLM生成コードに適切な型付けを強制するための健全なアプローチを構築した。
提案手法は,コード合成,翻訳,修復作業において,コンパイルエラーを半分以上削減し,機能的正しさを著しく向上させる。
論文 参考訳(メタデータ) (2025-04-12T15:03:00Z) - Leveraging Print Debugging to Improve Code Generation in Large Language
Models [63.63160583432348]
大規模言語モデル(LLM)はコード生成タスクにおいて大きな進歩を遂げた。
しかし、複雑なデータ構造やアルゴリズムによるプログラミング問題に対処する彼らのパフォーマンスは、依然として準最適である。
そこで本稿では,LLM のデバッグを "print debugging" 手法でガイドする,コンテキスト内学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-10T18:37:59Z) - INTERVENOR: Prompting the Coding Ability of Large Language Models with the Interactive Chain of Repair [42.5403218101046]
InterVENORは、人間が観察するインタラクティブなコード修復プロセスをエミュレートするシステムである。
LLMはコード修復プロセスにおいて、コード学習者とコード教師の両方として機能し、異なる役割を担います。
論文 参考訳(メタデータ) (2023-11-16T12:55:20Z) - Dcc --help: Generating Context-Aware Compiler Error Explanations with
Large Language Models [53.04357141450459]
dcc --helpはCS1とCS2のコースにデプロイされ、2565人の学生が10週間で64,000回以上このツールを使っている。
LLMが生成した説明は、コンパイル時間の90%と実行時の75%で概念的に正確であるが、コードに解決策を提供しない命令を無視することが多かった。
論文 参考訳(メタデータ) (2023-08-23T02:36:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。