論文の概要: Specification-Based Code-Text-Code Reengineering for LLM-Mediated Software Evolution
- arxiv url: http://arxiv.org/abs/2605.25232v1
- Date: Sun, 24 May 2026 19:36:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.034971
- Title: Specification-Based Code-Text-Code Reengineering for LLM-Mediated Software Evolution
- Title(参考訳): LLMを利用したソフトウェア進化のための仕様ベースコード-テキスト-コード再設計
- Authors: Oleg Grynets, Vasyl Lyashkevych, Arsen Dolichnyi, Roman Piznak, Taras Zelenyy, Volodymyr Morozov,
- Abstract要約: 本稿では LLM を利用したソフトウェア進化のための仕様ベースの Code2Text2Code 再設計フレームワークを提案する。
提案フレームワークは,実コンテキスト抽出,Code2Text生成,ソースコードとテキスト仕様の反復的検証,Text2Code生成,ターゲットコード検証,検索拡張グラウンドディング,変換損失推定を組み合わせた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Direct Code2Code transformation remains challenging to control because it can preserve surface-level syntax while introducing semantic drift, hidden behavioral changes, loss of traceability, non-idiomatic target implementations, or incomplete reconstruction of domain logic. This paper proposes a specification-based Code2Text2Code reengineering framework for LLM-mediated software evolution. The central idea is to transform source code into a neutral textual specification that captures program behavior, identifiers, computational flow, conditions, side effects, data dependencies, and domain-specific intent without directly transferring the source language syntax. The proposed framework combines factual context extraction, Code2Text generation, iterative verification between source code and text specification, Text2Code generation, target code verification, retrieval-augmented grounding, and semantic-aware chunking, and transformation loss estimation. The knowledge representation layer integrates metadata derived from AST, graph-based dependency structures, neutral natural language specifications, technical documentation, business documentation, and architecture-level representations. The conducted experiments include a Code2Text2Code dataset built from multiple programming languages and SQL dialects, comparison of intermediate representations, retrieval evaluation, documentation transformation evaluation, and prompt tuning using DSPy. A graph formalization using structural preservation, reverse compatibility, interface stability, and total graph similarity is implemented to estimate transformation losses. The results support the interpretation of the Code2Text2Code approach not as a simple code transformation, but as a controlled specification-based reengineering process for LLM-mediated software evolution.
- Abstract(参考訳): 直接コード2Code変換は、セマンティックドリフト、隠れた振る舞いの変化、トレーサビリティの喪失、非慣用的なターゲット実装、ドメインロジックの不完全な再構築を導入しながら、表面レベルの構文を保存することができるため、制御が難しいままである。
本稿では LLM を利用したソフトウェア進化のための仕様ベースの Code2Text2Code 再設計フレームワークを提案する。
中心となる考え方は、ソースコードを中立的なテキスト仕様に変換して、プログラムの振る舞い、識別子、計算フロー、条件、副作用、データ依存、ドメイン固有のインテントを、ソースコードの構文を直接転送することなくキャプチャするというものだ。
提案するフレームワークは,実際のコンテキスト抽出,コード2Text生成,ソースコードとテキスト仕様間の反復的検証,Text2Code生成,ターゲットコード検証,検索拡張グラウンド,意味認識チャンキング,変換損失推定を組み合わせた。
知識表現層は、AST、グラフベースの依存性構造、中立的な自然言語仕様、技術ドキュメント、ビジネスドキュメント、アーキテクチャレベルの表現から派生したメタデータを統合する。
実験には、複数のプログラミング言語とSQL方言から構築されたCode2Text2Codeデータセット、中間表現の比較、検索評価、ドキュメント変換評価、DSPyを使用した即時チューニングが含まれる。
構造保存、逆互換性、インターフェース安定性、および全グラフ類似性を用いたグラフ形式化を行い、変換損失を推定する。
この結果は、単純なコード変換ではなく、LLMによるソフトウェア進化のための制御された仕様ベースの再設計プロセスとして、Code2Text2Codeアプローチの解釈をサポートする。
関連論文リスト
- Completion by Comprehension: Guiding Code Generation with Multi-Granularity Understanding [37.78627994991325]
CoCoは、大規模なコードリポジトリから複数の粒度コンテキストでコード補完を可能にする新しいフレームワークである。
CrossCodeEvalとRepoEvalベンチマークの実験は、CoCoが最先端のベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-12-04T07:37:59Z) - TIT: A Tree-Structured Instruction Tuning Approach for LLM-Based Code Translation [11.882496324328905]
LLMに基づくコード翻訳のためのツリー構造化命令チューニングパラダイムであるTITを提案する。
構文的混乱を軽減するため、構文的情報表現モジュールは言語に依存しない構文的特徴を統合する。
高品質の粒度並列データを生成するために、細粒度並列データセット拡張モジュールは、ノードとコードセグメントを整列する。
論文 参考訳(メタデータ) (2025-10-10T13:53:46Z) - Data Dependency-Aware Code Generation from Enhanced UML Sequence Diagrams [54.528185120850274]
本稿では,API2Depという新しいステップバイステップコード生成フレームワークを提案する。
まず、サービス指向アーキテクチャに適した拡張Unified Modeling Language (UML) APIダイアグラムを紹介します。
次に、データフローの重要な役割を認識し、専用のデータ依存推論タスクを導入する。
論文 参考訳(メタデータ) (2025-08-05T12:28:23Z) - IFEvalCode: Controlled Code Generation [69.28317223249358]
本稿では,Code LLMの命令追従能力を改善するために,前方および後方制約生成を提案する。
IFEvalCodeは、7つのプログラミング言語の1.6Kテストサンプルからなる多言語ベンチマークである。
論文 参考訳(メタデータ) (2025-07-30T08:08:48Z) - ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。
このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-02-17T12:38:57Z) - Bridging Code Semantic and LLMs: Semantic Chain-of-Thought Prompting for
Code Generation [22.219645213202178]
本稿では,SeCoT というコードの意味情報を抽出する "Semantic Chain-of-Thought" 手法を提案する。
本研究では,SeCoTが最先端の性能を実現し,大規模モデルやコード生成の可能性を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2023-10-16T05:09:58Z) - Towards Codable Watermarking for Injecting Multi-bits Information to LLMs [86.86436777626959]
大規模言語モデル(LLM)は、流布とリアリズムを増大させるテキストを生成する。
既存の透かし方式はエンコーディング非効率であり、多様な情報エンコーディングニーズに柔軟に対応できない。
テキスト透かしを複数ビットでカスタマイズ可能な情報を運ぶことができるCTWL (Codable Text Watermarking for LLMs) を提案する。
論文 参考訳(メタデータ) (2023-07-29T14:11:15Z) - The Whole Truth and Nothing But the Truth: Faithful and Controllable
Dialogue Response Generation with Dataflow Transduction and Constrained
Decoding [65.34601470417967]
本稿では,ニューラルネットワークモデリングとルールベース生成の強みを組み合わせた対話応答生成のためのハイブリッドアーキテクチャについて述べる。
本実験により, 本システムは, 流布性, 妥当性, 真理性の評価において, ルールベースおよび学習的アプローチの両方に優れることがわかった。
論文 参考訳(メタデータ) (2022-09-16T09:00:49Z) - StructCoder: Structure-Aware Transformer for Code Generation [13.797842927671846]
本稿では、構文とデータフローの両方をモデル化し、生成されたコードの品質を向上させる構造対応トランスフォーマーデコーダを提案する。
提案したStructCoderモデルは、コード翻訳およびテキスト・トゥ・コード生成タスクにおける最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-06-10T17:26:31Z) - Source Code Summarization with Structural Relative Position Guided
Transformer [19.828300746504148]
ソースコードの要約は、プログラミング言語の簡潔で明確な自然言語記述を生成することを目的としている。
近年の取り組みは、Transformerなどのニューラルネットワークにコードの構文構造を組み込むことに重点を置いている。
SCRIPTと呼ばれる構造相対位置案内変換器を提案する。
論文 参考訳(メタデータ) (2022-02-14T07:34:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。