論文の概要: CIAO - Code In Architecture Out - Automated Software Architecture Documentation with Large Language Models
- arxiv url: http://arxiv.org/abs/2604.08293v1
- Date: Thu, 09 Apr 2026 14:29:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.960581
- Title: CIAO - Code In Architecture Out - Automated Software Architecture Documentation with Large Language Models
- Title(参考訳): CIAO - アーキテクチャのコードアウト - 大規模言語モデルによる自動ソフトウェアアーキテクチャドキュメンテーション
- Authors: Marco De Luca, Tiziano Santilli, Domenico Amalfitano, Anna Rita Fasolino, Patrizio Pelliccione,
- Abstract要約: 本稿では,大規模言語モデルを用いてGitHubリポジトリから直接システムレベルのアーキテクチャドキュメンテーションを自動生成する構造化プロセスを提案する。
このプロセスはCIAO(Code In Architecture Out)と呼ばれ、LLMベースのワークフローを定義し、レポジトリをインプットとして、システムレベルのアーキテクチャドキュメントを生成する。
筆者らは22人の開発者を対象に,コントリビュートしたリポジトリで生成されたドキュメントをレビューし,プロセスの評価を行った。
- 参考スコア(独自算出の注目度): 7.539790545610935
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software architecture documentation is essential for system comprehension, yet it is often unavailable or incomplete. While recent LLM-based techniques can generate documentation from code, they typically address local artifacts rather than producing coherent, system-level architectural descriptions. This paper presents a structured process for automatically generating system-level architectural documentation directly from GitHub repositories using Large Language Models. The process, called CIAO (Code In Architecture Out), defines an LLM-based workflow that takes a repository as input and produces system-level architectural documentation following a template derived from ISO/IEC/IEEE 42010, SEI Views \& Beyond, and the C4 model. The resulting documentation can be directly added to the target repository. We evaluated the process through a study with 22 developers, each reviewing the documentation generated for a repository they had contributed to. The evaluation shows that developers generally perceive the produced documentation as valuable, comprehensible, and broadly accurate with respect to the source code, while also highlighting limitations in diagram quality, high-level context modeling, and deployment views. We also assessed the operational cost of the process, finding that generating a complete architectural document requires only a few minutes and is inexpensive to run. Overall, the results indicate that a structured, standards-oriented approach can effectively guide LLMs in producing system-level architectural documentation that is both usable and cost-effective.
- Abstract(参考訳): ソフトウェアアーキテクチャのドキュメンテーションはシステムの理解に不可欠だが、しばしば利用できないか不完全である。
最近のLCMベースの技術は、コードからドキュメントを生成することができるが、通常は、一貫性のあるシステムレベルのアーキテクチャ記述を生成するのではなく、ローカルなアーティファクトに対処する。
本稿では,大規模言語モデルを用いてGitHubリポジトリから直接システムレベルのアーキテクチャドキュメンテーションを自動生成する構造化プロセスを提案する。
CIAO(Code In Architecture Out)と呼ばれるこのプロセスは、リポジトリを入力として、ISO/IEC/IEEE 42010、SEI Views \& Beyond、C4モデルから派生したテンプレートに従って、システムレベルのアーキテクチャドキュメントを生成するLCMベースのワークフローを定義する。
結果のドキュメントは、ターゲットリポジトリに直接追加することができる。
筆者らは22人の開発者を対象に,コントリビュートしたリポジトリで生成されたドキュメントをレビューし,プロセスの評価を行った。
評価によると、開発者は一般的に、生成したドキュメントを、ソースコードに関して価値があり、理解し、広範囲に正確であると見なすと同時に、図の品質、高レベルなコンテキストモデリング、デプロイメントビューの制限を強調している。
また、プロセスの運用コストを評価し、完全なアーキテクチャ文書を生成するのに数分しかかからず、実行するのに安価なことを発見した。
全体として、構造化された標準指向のアプローチは、システムレベルのアーキテクチャドキュメンテーションを作成する上で、LLMを効果的に導くことができる。
関連論文リスト
- Large Language Models for Analyzing Enterprise Architecture Debt in Unstructured Documentation [0.0]
エンタープライズアーキテクチャ負債(EA Debt)は、最適以下の設計決定と、組織ITの状況が経時的に悪化する可能性のあるコンポーネントの不一致から生じる。
初期の指標であるEA Smells(Enterprise Architecture Smells)は、主に手動または構造化されたアーティファクトからのみ検出されている。
本研究では,大規模言語モデル (LLM) を用いて,非構造化アーキテクチャ文書におけるEA Debtの同定と定量化を行う手法を提案する。
論文 参考訳(メタデータ) (2026-03-29T21:45:15Z) - LLM-based Automated Architecture View Generation: Where Are We Now? [0.0]
ソースコードからアーキテクチャビューを生成するLLMとエージェントアプローチの能力を評価する。
ゼロショットのプロンプトはゼロショットのベースラインに比べて、クリアリティの失敗を9.2%削減する。
カスタムエージェントアプローチは、汎用エージェントよりも一貫して優れています。
論文 参考訳(メタデータ) (2026-03-22T11:41:37Z) - CodeWiki: Evaluating AI's Ability to Generate Holistic Documentation for Large-Scale Codebases [7.75137961900221]
bftextCodeWikiは、7つのプログラミング言語にまたがるリポジトリレベルのドキュメントを自動化する統合フレームワークである。
CodeWikiは、3つの重要なイノベーションを紹介している: (i) 階層的な分解はアーキテクチャのコンテキストを複数のレベルの粒度で保存し、 (ii) スケーラブルな生成のための動的タスクデリゲートによる再帰的マルチエージェント処理、 (iii) アーキテクチャ図やデータフロー表現のようなビジュアルアーティファクトとテキスト記述を統合するマルチモーダル合成である。
CodeWikiは、プロプライエタリなモデルで68.79%の品質スコアを獲得し、クローズドソースのDeepWikiベースライン(64.06%)を4.73%上回った。
論文 参考訳(メタデータ) (2025-10-28T13:52:46Z) - Collaborative LLM Agents for C4 Software Architecture Design Automation [0.0]
本研究は,ソフトウェアアーキテクチャの自動設計とその評価手法に寄与する。
我々は,C4ソフトウェアアーキテクチャモデルを自動生成するLLMベースのマルチエージェントシステムを提案する。
5つの標準的なシステムブリーフでテストされたこのワークフローは、高速なC4モデル生成、高いコンパイル成功の維持、セマンティック忠実性の提供を実証する。
論文 参考訳(メタデータ) (2025-10-26T18:43:59Z) - Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [80.88654868264645]
Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。
AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。
結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文 参考訳(メタデータ) (2025-07-22T06:37:51Z) - Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning [70.04746094652653]
機械学習論文を機能コードリポジトリに変換するフレームワークであるPaperCoderを紹介した。
PaperCoderは3つの段階で動作する。計画、図によるシステムアーキテクチャの設計、ファイル依存の特定、構成ファイルの生成である。
次に、モデルベースおよび人的評価の両方に基づいて、機械学習論文からコード実装を生成するPaperCoderを評価する。
論文 参考訳(メタデータ) (2025-04-24T01:57:01Z) - RepoAgent: An LLM-Powered Open-Source Framework for Repository-level
Code Documentation Generation [79.83270415843857]
コードドキュメンテーションを積極的に生成、保守、更新することを目的とした、大規模な言語モデルによるオープンソースフレームワークであるRepoAgentを紹介します。
RepoAgentは高品質なリポジトリレベルのドキュメントを生成するのに優れています。
論文 参考訳(メタデータ) (2024-02-26T15:39:52Z) - A Study of Documentation for Software Architecture [7.011803832284996]
私たちは65人の参加者に、ソフトウェアアーキテクチャの理解に関する質問に答えるように頼みました。
アクティビティの適用と作成を必要とする質問に対する回答は、システムのソースコードの使用と統計的に大きく関連している。
本研究の結果は,建築文書の形式が重要であるという仮説と矛盾するものである。
論文 参考訳(メタデータ) (2023-05-26T22:14:53Z) - Language Models Enable Simple Systems for Generating Structured Views of Heterogeneous Data Lakes [54.13559879916708]
EVAPORATEは大規模言語モデル(LLM)を利用したプロトタイプシステムである。
コード合成は安価だが、各文書をLSMで直接処理するよりもはるかに正確ではない。
直接抽出よりも優れた品質を実現する拡張コード実装EVAPORATE-CODE+を提案する。
論文 参考訳(メタデータ) (2023-04-19T06:00:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。