論文の概要: AstraAI: LLMs, Retrieval, and AST-Guided Assistance for HPC Codebases
- arxiv url: http://arxiv.org/abs/2603.27423v1
- Date: Sat, 28 Mar 2026 21:49:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.952654
- Title: AstraAI: LLMs, Retrieval, and AST-Guided Assistance for HPC Codebases
- Title(参考訳): AstraAI: HPCコードベースのためのLLM,Retrieval,AST-Guided Assistance
- Authors: Mahesh Natarajan, Xiaoye Li, Weiqun Zhang,
- Abstract要約: 本稿では,高性能コンピューティング(HPC)ソフトウェア開発のためのコマンドラインインタフェース(CLI)コーディングフレームワークであるAstraAIを紹介する。
AstraAIは、Linux端末内で直接動作し、大規模な言語モデル(LLM)とRetrieval-Augmented Generation(RAG)とAST(Abstract Syntax Tree)ベースの構造解析を統合する。
本稿では,AstraAI による AMReX における代表的 HPC コード生成タスクの実証を行う。
- 参考スコア(独自算出の注目度): 0.2580765958706854
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present AstraAI, a command-line interface (CLI) coding framework for high-performance computing (HPC) software development. AstraAI operates directly within a Linux terminal and integrates large language models (LLMs) with Retrieval-Augmented Generation (RAG) and Abstract Syntax Tree (AST)-based structural analysis to enable context-aware code generation for complex scientific codebases. The central idea is to construct a high-fidelity prompt that is passed to the LLM for inference. This prompt augments the user request with relevant code snippets retrieved from the underlying framework codebase via RAG and structural context extracted from AST analysis, providing the model with precise information about relevant functions, data structures, and overall code organization. The framework is designed to perform scoped modifications to source code while preserving structural consistency with the surrounding code. AstraAI supports both locally hosted models from Hugging Face and API-based frontier models accessible via the American Science Cloud, enabling flexible deployment across HPC environments. The system generates code that aligns with existing project structures and programming patterns. We demonstrate AstraAI on representative HPC code generation tasks within AMReX, a DOE-supported HPC software infrastructure for exascale applications.
- Abstract(参考訳): 本稿では,ハイパフォーマンスコンピューティング(HPC)ソフトウェア開発のためのコマンドラインインタフェース(CLI)コーディングフレームワークであるAstraAIを紹介する。
AstraAIは、Linux端末内で直接動作し、大規模な言語モデル(LLM)とRetrieval-Augmented Generation(RAG)とAST(Abstract Syntax Tree)ベースの構造解析を統合し、複雑な科学コードベースのコンテキスト認識コード生成を可能にする。
中心となる考え方は、推論のためにLLMに渡される高忠実性プロンプトを構築することである。
このプロンプトは、RAGを通じて基盤となるフレームワークコードベースから取得された関連するコードスニペットとAST分析から抽出された構造的コンテキストでユーザリクエストを拡張し、関連する機能やデータ構造、全体的なコード組織に関する正確な情報を提供する。
このフレームワークは、周辺のコードと構造的な一貫性を維持しながら、ソースコードのスコープ変更を実行するように設計されている。
AstraAIは、Hugging Faceからローカルにホストされたモデルと、American Science Cloud経由でアクセス可能なAPIベースのフロンティアモデルの両方をサポートし、HPC環境への柔軟なデプロイを可能にしている。
システムは既存のプロジェクト構造やプログラミングパターンに沿ったコードを生成する。
本稿では,AstraAI による AMReX における代表的 HPC コード生成タスクの実証を行う。
関連論文リスト
- ArchBench: Benchmarking Generative-AI for Software Architecture Tasks [0.0]
ArchBenchは、ソフトウェアアーキテクチャタスクで大規模言語モデルをベンチマークするための最初の統一プラットフォームである。
データセットのダウンロード、トラジェクトリロギングによる推論、自動評価のための標準化されたパイプラインを備えたコマンドラインツールを提供する。
論文 参考訳(メタデータ) (2026-03-18T15:26:46Z) - From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence [150.3696990310269]
大規模言語モデル(LLM)は、自然言語記述を直接関数コードに変換することによって、自動ソフトウェア開発を変革した。
コードLLMに関する総合的な合成と実践的ガイド(一連の解析および探索実験)を提供する。
一般LLM(GPT-4, Claude, LLaMA)とコード特殊化LLM(StarCoder, Code LLaMA, DeepSeek-Coder, QwenCoder)のコード機能の解析を行う。
論文 参考訳(メタデータ) (2025-11-23T17:09:34Z) - Context-Aware Visual Prompting: Automating Geospatial Web Dashboards with Large Language Models and Agent Self-Validation for Decision Support [1.506501956463029]
リスク分析と意思決定のためのWebベースのダッシュボードの開発は、大きな多次元データの難しさに悩まされることが多い。
ユーザ定義入力からインタラクティブな地理空間ダッシュボードの作成を自動化する生成AIフレームワークを導入する。
論文 参考訳(メタデータ) (2025-10-10T10:58:15Z) - CelloAI: Leveraging Large Language Models for HPC Software Development in High Energy Physics [2.4272174123587833]
次世代の高エネルギー物理実験は前例のないデータ量を生成する。
次世代の高エネルギー物理(HEP)実験は前例のないデータ量を生成する。
論文 参考訳(メタデータ) (2025-08-22T15:17:44Z) - HiVeGen -- Hierarchical LLM-based Verilog Generation for Scalable Chip Design [24.46771930751068]
HiVeGenは階層的なVerilog生成フレームワークで、生成タスクを階層的なサブモジュールに分解する。
自動設計空間探索(DSE)を階層対応のプロンプト生成に変換し、コードの再利用を強化するために重みに基づく検索を導入する。
エラー補正コストを低減し、生成した設計の質を大幅に向上させる。
論文 参考訳(メタデータ) (2024-12-06T19:37:53Z) - CodeGRAG: Bridging the Gap between Natural Language and Programming Language via Graphical Retrieval Augmented Generation [58.84212778960507]
CodeGRAGは、制御フローとそれらのデータフローに基づいて、コードブロックのグラフィカルなビューを構築し、プログラミングドメインの知識をよりよく解釈する。
CodeGRAGはLLMのコード生成能力を大幅に改善し、言語間コード生成のパフォーマンス向上も実現している。
論文 参考訳(メタデータ) (2024-05-03T02:48:55Z) - StepCoder: Improve Code Generation with Reinforcement Learning from
Compiler Feedback [58.20547418182074]
2つの主要コンポーネントからなるコード生成の新しいフレームワークであるStepCoderを紹介します。
CCCSは、長いシーケンスのコード生成タスクをCurriculum of Code Completion Subtaskに分割することで、探索課題に対処する。
FGOは、未実行のコードセグメントをマスクすることでのみモデルを最適化し、Fine-Grained Optimizationを提供する。
提案手法は,出力空間を探索し,対応するベンチマークにおいて最先端の手法より優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-02-02T13:14:31Z) - CodeTF: One-stop Transformer Library for State-of-the-art Code LLM [72.1638273937025]
我々は、最先端のCode LLMとコードインテリジェンスのためのオープンソースのTransformerベースのライブラリであるCodeTFを紹介する。
我々のライブラリは、事前訓練されたコードLLMモデルと人気のあるコードベンチマークのコレクションをサポートします。
CodeTFが機械学習/生成AIとソフトウェア工学のギャップを埋められることを願っている。
論文 参考訳(メタデータ) (2023-05-31T05:24:48Z) - ProgSG: Cross-Modality Representation Learning for Programs in
Electronic Design Automation [38.023395256208055]
高レベル合成(HLS)により、開発者はCとC++のソフトウェアコード形式で高レベルな記述をコンパイルできる。
HLSツールは相変わらず、プラグマで表されるマイクロアーキテクチャの決定を必要とする。
本稿では,ソースコードシーケンスのモダリティとグラフのモダリティを深く,きめ細かな方法で相互に相互作用させることができるProgSGを提案する。
論文 参考訳(メタデータ) (2023-05-18T09:44:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。