論文の概要: ATLAS: Automated Tree-based Language Analysis System for C and C++ source programs
- arxiv url: http://arxiv.org/abs/2512.12507v1
- Date: Sun, 14 Dec 2025 01:11:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.290213
- Title: ATLAS: Automated Tree-based Language Analysis System for C and C++ source programs
- Title(参考訳): ATLAS:CとC++のソースコードの自動解析システム
- Authors: Jaid Monwar Chowdhury, Ahmad Farhan Shahriar Chowdhury, Humayra Binte Monwar, Mahmuda Naznin,
- Abstract要約: 本稿では,文レベル制御フローグラフ(CFG)と型認識データフローグラフ(DFG)を生成するPythonベースのコマンドラインインタフェース(CLI)であるATLASを紹介する。
ATLASは、下流のソフトウェアエンジニアリング(SE)と機械学習ベースのプログラム理解を改善するための実践的な基盤を提供する。
- 参考スコア(独自算出の注目度): 1.0499611180329804
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing complexity of modern software systems has highlighted the shortcomings of traditional programming analysis techniques, particularly for Software Engineering (SE) tasks. While machine learning and Large Language Models (LLMs) offer promising solutions, their effectiveness is limited by the way they interpret data. Unlike natural language, source code meaning is defined less by token adjacency and more by complex, long-range, and structural relationships and dependencies. This limitation is especially pronounced for C and C++, where flatter syntactic hierarchies, pointer aliasing, multi-level indirection, typedef-based type obfuscation, and function-pointer calls hinder accurate static analysis. To address these challenges, this paper introduces ATLAS, a Python-based Command-Line Interface (CLI) that (i) generates statement-level Control Flow Graphs (CFG) and type-aware Data Flow Graphs (DFG) that capture inter-functional dependencies for the entire program; (ii) has the ability to work on entire C and C++ projects comprising multiple files; (iii) works on both compilable and non-compilable code and (iv) produces a unified multi-view code representation using Abstract Syntax Trees (AST), CFG and DFG. By preserving essential structural and semantic information, ATLAS provides a practical foundation for improving downstream SE and machine-learning-based program understanding. Video demonstration: https://youtu.be/RACWQe5ELwY Tool repository: https://github.com/jaid-monwar/ATLAS-code-representation-tool
- Abstract(参考訳): 現代のソフトウェアシステムの複雑さの増大は、特にソフトウェア工学(SE)タスクにおいて、従来のプログラミング分析技術の欠点を浮き彫りにした。
機械学習とLarge Language Models(LLM)は有望なソリューションを提供するが、その有効性はデータの解釈方法によって制限される。
自然言語とは異なり、ソースコードの意味はトークンの隣接によって定義され、より複雑で長距離で構造的な関係や依存関係によって定義される。
この制限は特にCとC++で発音され、フラットな構文階層、ポインタエイリアス、マルチレベルの間接、型defベースの型難読化、関数ポインタ呼び出しが正確な静的解析を妨げている。
これらの課題に対処するために,PythonベースのCommand-Line Interface(CLI)であるATLASを紹介した。
i) 文レベル制御フローグラフ(CFG)と型対応データフローグラフ(DFG)を生成し、プログラム全体の機能的依存関係をキャプチャする。
i) 複数のファイルからなるCとC++プロジェクト全体に取り組むことができる。
(iii)コンパイル可能コードと非コンパイル可能コードの両方で動作する
(iv)は、抽象構文木(AST)、CFG、DFGを用いて、統一された多視点コード表現を生成する。
基本的な構造情報と意味情報を保存することにより、ATLASは下流SEと機械学習に基づくプログラム理解を改善するための実践的な基盤を提供する。
ビデオデモ: https://youtu.be/RACWQe5ELwY Tool repository: https://github.com/jaid-monwar/ATLAS-code-representation-tool
関連論文リスト
- InfCode-C++: Intent-Guided Semantic Retrieval and AST-Structured Search for C++ Issue Resolution [31.437457217953835]
INFCODE-C++は、エンドツーエンドの課題解決のための最初のC++対応自律システムである。
このシステムは、セマンティックコードインテント検索と決定論的AST構造化クエリという2つの補完的な検索メカニズムを組み合わせる。
解像度は25.58%で、MSWEエージェントのパフォーマンスを倍増する10.85ポイントで最強の先行エージェントを上回っている。
論文 参考訳(メタデータ) (2025-11-20T03:05:26Z) - Data Dependency-Aware Code Generation from Enhanced UML Sequence Diagrams [54.528185120850274]
本稿では,API2Depという新しいステップバイステップコード生成フレームワークを提案する。
まず、サービス指向アーキテクチャに適した拡張Unified Modeling Language (UML) APIダイアグラムを紹介します。
次に、データフローの重要な役割を認識し、専用のデータ依存推論タスクを導入する。
論文 参考訳(メタデータ) (2025-08-05T12:28:23Z) - LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。
LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。
LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文 参考訳(メタデータ) (2023-10-30T17:55:02Z) - Leveraging Language to Learn Program Abstractions and Search Heuristics [66.28391181268645]
LAPS(Language for Abstraction and Program Search)は、自然言語アノテーションを用いて、ライブラリとニューラルネットワークによる合成のための検索モデルの共同学習をガイドする手法である。
最先端のライブラリ学習システム(DreamCoder)に統合されると、LAPSは高品質なライブラリを生成し、検索効率と一般化を改善する。
論文 参考訳(メタデータ) (2021-06-18T15:08:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。