論文の概要: Generating Software Architecture Description from Source Code using Reverse Engineering and Large Language Model
- arxiv url: http://arxiv.org/abs/2511.05165v1
- Date: Fri, 07 Nov 2025 11:35:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.74485
- Title: Generating Software Architecture Description from Source Code using Reverse Engineering and Large Language Model
- Title(参考訳): リバースエンジニアリングと大規模言語モデルを用いたソースコードからのソフトウェアアーキテクチャ記述の生成
- Authors: Ahmad Hatahet, Christoph Knieke, Andreas Rausch,
- Abstract要約: ソフトウェアアーキテクチャ記述(SAD)は、現代のソフトウェアシステムの本質的な複雑さを管理するために不可欠である。
SADは、しばしばシステムの実際の実装に不整合、時代遅れ、あるいは不整合である。
逆エンジニアリング(RE)技術とLarge Language Model(LLM)を統合し,ソースコードからSADを半自動生成する手法を提案する。
- 参考スコア(独自算出の注目度): 2.6126272668390373
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Software Architecture Descriptions (SADs) are essential for managing the inherent complexity of modern software systems. They enable high-level architectural reasoning, guide design decisions, and facilitate effective communication among diverse stakeholders. However, in practice, SADs are often missing, outdated, or poorly aligned with the system's actual implementation. Consequently, developers are compelled to derive architectural insights directly from source code-a time-intensive process that increases cognitive load, slows new developer onboarding, and contributes to the gradual degradation of clarity over the system's lifetime. To address these issues, we propose a semi-automated generation of SADs from source code by integrating reverse engineering (RE) techniques with a Large Language Model (LLM). Our approach recovers both static and behavioral architectural views by extracting a comprehensive component diagram, filtering architecturally significant elements (core components) via prompt engineering, and generating state machine diagrams to model component behavior based on underlying code logic with few-shots prompting. This resulting views representation offer a scalable and maintainable alternative to traditional manual architectural documentation. This methodology, demonstrated using C++ examples, highlights the potent capability of LLMs to: 1) abstract the component diagram, thereby reducing the reliance on human expert involvement, and 2) accurately represent complex software behaviors, especially when enriched with domain-specific knowledge through few-shot prompting. These findings suggest a viable path toward significantly reducing manual effort while enhancing system understanding and long-term maintainability.
- Abstract(参考訳): ソフトウェアアーキテクチャ記述(SAD)は、現代のソフトウェアシステムの本質的な複雑さを管理するために不可欠である。
高いレベルのアーキテクチャ推論を可能にし、設計決定をガイドし、多様な利害関係者間の効果的なコミュニケーションを促進する。
しかし、実際には、SADは、しばしばシステムの実際の実装と不整合である、時代遅れである、あるいは不整合である。
その結果、開発者はソースコードから直接アーキテクチャ上の洞察を導き出さざるを得なくなり、認知的負荷を増大させ、新しい開発者の参加を遅くし、システムの寿命における明確さの段階的な低下に寄与する。
これらの問題に対処するため,大言語モデル(LLM)とリバースエンジニアリング(RE)技術を統合することで,ソースコードからSADを半自動生成する手法を提案する。
我々のアプローチは、包括的なコンポーネント図を抽出し、プロンプトエンジニアリングを通じてアーキテクチャ上重要な要素(コアコンポーネント)をフィルタリングし、基礎となるコードロジックに基づいてコンポーネントの振る舞いをモデル化するステートマシン図を生成することによって、静的および振る舞いの両面を復元する。
この結果のビュー表現は、従来の手作業によるアーキテクチャ文書に代わる、スケーラブルで保守可能な代替手段を提供する。
この方法論は、C++の例を使って示されており、LLMの強力な能力を次のように強調している。
1) 構成要素図を抽象化し、人的専門家の関与への依存を減らし、
2) 複雑なソフトウェアの振る舞いを正確に表現する。
これらの結果から,システム理解と長期維持性を高めつつ,手作業の大幅な削減に向けた有効な道筋が示唆された。
関連論文リスト
- Building Specialized Software-Assistant ChatBot with Graph-Based Retrieval-Augmented Generation [0.815557531820863]
本稿では,企業Webアプリケーションをステートアクション知識グラフに自動的に変換するグラフベースのRetrieval-Augmented Generationフレームワークを紹介する。
このフレームワークは、AI企業RakaMと共同で、Lemon Learningと共同で開発された。
論文 参考訳(メタデータ) (2025-11-07T14:56:45Z) - Executable Knowledge Graphs for Replicating AI Research [65.41207324831583]
Executable Knowledge Graphs (xKG) は、科学文献から抽出された技術的洞察、コードスニペット、ドメイン固有の知識を自動的に統合するモジュラーでプラグイン可能な知識基盤である。
コードはhttps://github.com/zjunlp/xKGでリリースされる。
論文 参考訳(メタデータ) (2025-10-20T17:53:23Z) - Data Dependency-Aware Code Generation from Enhanced UML Sequence Diagrams [54.528185120850274]
本稿では,API2Depという新しいステップバイステップコード生成フレームワークを提案する。
まず、サービス指向アーキテクチャに適した拡張Unified Modeling Language (UML) APIダイアグラムを紹介します。
次に、データフローの重要な役割を認識し、専用のデータ依存推論タスクを導入する。
論文 参考訳(メタデータ) (2025-08-05T12:28:23Z) - Large-Scale Model Enabled Semantic Communication Based on Robust Knowledge Distillation [45.347078403677216]
大規模モデル(LSM)は意味表現と理解に有効なフレームワークである。
しかしながら、それらの直接的なデプロイメントは、しばしば高い計算複雑性とリソース要求によって妨げられる。
本稿では,新しい知識蒸留に基づくセマンティックコミュニケーションフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-04T07:47:18Z) - Factored Agents: Decoupling In-Context Learning and Memorization for Robust Tool Use [4.437184840125514]
本稿ではエージェントAIにおける従来の単一エージェントシステムの限界を克服する新しいファクターエージェントアーキテクチャを提案する。
提案手法はエージェントを,(1)高レベルプランナーおよびインコンテキスト学習者として機能する大規模言語モデル,(2)ツールフォーマットと出力の記憶器として機能する小型言語モデルに分解する。
経験的評価により,本アーキテクチャは,テキスト内学習と静的記憶のトレードオフを解明しつつ,計画精度と誤り回復性を著しく向上することが示された。
論文 参考訳(メタデータ) (2025-03-29T01:27:11Z) - Establishing tool support for a concept DSL [0.0]
この論文は、自己完結的で再利用可能な概念単位を用いて、ソフトウェアシステムの振る舞いをモデル化するためのDSLであるConceptualを記述している。
提案された戦略は単純なコンパイラで実装され、開発者はプログラムの推論に既存の分析ツールにアクセスして利用することができる。
論文 参考訳(メタデータ) (2025-03-07T09:18:31Z) - Specifications: The missing link to making the development of LLM systems an engineering discipline [65.10077876035417]
我々は、構造化出力、プロセスの監督、テストタイム計算など、これまでの分野の進歩について論じる。
モジュール型かつ信頼性の高いLCMシステムの開発に向けた研究の今後の方向性について概説する。
論文 参考訳(メタデータ) (2024-11-25T07:48:31Z) - Towards Living Software Architecture Diagrams [0.0]
本稿では,ソフトウェアアーチファクトを解析し,それらを包括的システム表現に統一することにより,ソフトウェアシステムのアーキテクチャ図を生成するツールを提案する。
この表現は、更新時にダイアグラムに再統合されることを保証しながら、手動で修正することができる。
論文 参考訳(メタデータ) (2024-07-25T12:31:52Z) - Inference Optimization of Foundation Models on AI Accelerators [68.24450520773688]
トランスフォーマーアーキテクチャを備えた大規模言語モデル(LLM)を含む強力な基礎モデルは、ジェネレーティブAIの新たな時代を支えている。
モデルパラメータの数が数十億に達すると、実際のシナリオにおける推論コストと高いレイテンシーが排除される。
このチュートリアルでは、AIアクセラレータを用いた補完推論最適化テクニックに関する包括的な議論を行っている。
論文 参考訳(メタデータ) (2024-07-12T09:24:34Z) - SOLO: A Single Transformer for Scalable Vision-Language Modeling [74.05173379908703]
我々はvisiOn-Language mOdelingのための単一変換器SOLOを提案する。
SOLOのような統一された単一トランスフォーマーアーキテクチャは、LVLMにおけるこれらのスケーラビリティ上の懸念に効果的に対処する。
本稿では,オープンソースの7B LVLMであるSOLOの開発のための,最初のオープンソーストレーニングレシピを紹介する。
論文 参考訳(メタデータ) (2024-07-08T22:40:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。