Fugu-MT 論文翻訳(概要): LLMs as Packagers of HPC Software

論文の概要: LLMs as Packagers of HPC Software

arxiv url: http://arxiv.org/abs/2511.05626v1
Date: Fri, 07 Nov 2025 00:06:51 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-11 21:18:44.508804
Title: LLMs as Packagers of HPC Software
Title（参考訳）: HPCソフトウェアのパッケージとしてのLCM
Authors: Caetano Melone, Daniel Nichols, Konstantinos Parasyris, Todd Gamblin, Harshitha Menon,
Abstract要約: Spackのようなツールは依存関係の解決と環境管理を自動化するが、その効果は手書きのビルドレシピに依存している。 SpackItは、リポジトリ分析、関連するサンプルの検索、診断フィードバックによる反復的改善を組み合わせたエンドツーエンドフレームワークである。以上の結果から,SpackItはゼロショット環境でのインストール成功率を20%から,最高の設定で80%以上に向上させることがわかった。
参考スコア（独自算出の注目度）: 2.195636219953539
License: http://creativecommons.org/licenses/by/4.0/
Abstract: High performance computing (HPC) software ecosystems are inherently heterogeneous, comprising scientific applications that depend on hundreds of external packages, each with distinct build systems, options, and dependency constraints. Tools such as Spack automate dependency resolution and environment management, but their effectiveness relies on manually written build recipes. As these ecosystems grow, maintaining existing specifications and creating new ones becomes increasingly labor-intensive. While large language models (LLMs) have shown promise in code generation, automatically producing correct and maintainable Spack recipes remains a significant challenge. We present a systematic analysis of how LLMs and context-augmentation methods can assist in the generation of Spack recipes. To this end, we introduce SpackIt, an end-to-end framework that combines repository analysis, retrieval of relevant examples, and iterative refinement through diagnostic feedback. We apply SpackIt to a representative subset of 308 open-source HPC packages to assess its effectiveness and limitations. Our results show that SpackIt increases installation success from 20% in a zero-shot setting to over 80% in its best configuration, demonstrating the value of retrieval and structured feedback for reliable package synthesis.
Abstract（参考訳）: ハイパフォーマンスコンピューティング(HPC)ソフトウェアエコシステムは本質的に異質であり、数百の外部パッケージに依存する科学アプリケーションで構成されている。 Spackのようなツールは依存関係の解決と環境管理を自動化するが、その効果は手書きのビルドレシピに依存している。これらのエコシステムが成長するにつれて、既存の仕様の維持と新たな仕様の作成がますます労働集約化している。大きな言語モデル(LLM)はコード生成において有望であることを示しているが、自動的に正しいメンテナンス可能なSpackレシピを生成することは大きな課題である。本稿では,LLMと文脈拡張手法がSpackのレシピ生成にどのように役立つのかを体系的に分析する。この目的のために,レポジトリ分析,関連事例の検索,診断フィードバックによる反復的改善を組み合わせたエンドツーエンドフレームワークであるSpackItを紹介した。 SpackItを308個のオープンソースHPCパッケージの代表的サブセットに適用し、その有効性と限界を評価する。以上の結果から,SpackItはゼロショット環境でのインストール成功率を20%から最良構成で80%以上に向上させ,信頼性の高いパッケージ合成のための検索と構造化されたフィードバックの価値を実証した。

関連論文リスト

KAPSO: A Knowledge-grounded framework for Autonomous Program Synthesis and Optimization [3.0268242725574215]
KAPSOは、自律的なプログラム合成と最適化のためのモジュラーフレームワークである。反復的にアイデア、コード合成、編集、実行、評価、学習を行い、実行可能なアーティファクトを改善する。
論文参考訳（メタデータ） (2026-01-29T10:40:54Z)
Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem [90.17610617854247]
本稿では,エージェントモデルの生産パイプラインを最適化する基盤インフラであるエージェント学習エコシステム(ALE)を紹介する。 ALEは、重量最適化のためのトレーニング後のフレームワークであるROLL、軌道生成のためのサンドボックス環境マネージャであるROCK、効率的なコンテキストエンジニアリングのためのエージェントフレームワークであるiFlow CLIの3つのコンポーネントで構成されている。 ROMEはALEが基盤として100万件以上のトラジェクトリをトレーニングしたオープンソースエージェントです。
論文参考訳（メタデータ） (2025-12-31T14:03:39Z)
LeMat-Synth: a multi-modal toolbox to curate broad synthesis procedure databases from scientific literature [60.879220305044726]
本稿では,大規模言語モデル (LLM) と視覚言語モデル (VLM) を用いて合成手順と性能データを自動抽出・整理するマルチモーダルツールボックスを提案する。 LeMat-Synth (v 1.0):35種類の合成法と16種類の材料クラスにまたがる合成手順を含むデータセット。我々は,新しいコーパスと合成ドメインへのコミュニティ主導の拡張をサポートするために設計された,モジュール形式のオープンソースライブラリをリリースする。
論文参考訳（メタデータ） (2025-10-28T17:58:18Z)
SWE-PolyBench: A multi-language benchmark for repository level evaluation of coding agents [49.73885480071402]
我々はSWE-PolyBenchを紹介した。SWE-PolyBenchは、コードエージェントのリポジトリレベル、実行ベース評価のための新しいベンチマークである。 SWE-PolyBenchには21のリポジトリから2110のインスタンスが含まれており、Java(165)、JavaScript(1017)、TypeScript(729)、Python(199)のタスクが含まれており、バグ修正、機能追加、コードを含んでいる。実験の結果,現在のエージェントは言語間で不均一なパフォーマンスを示し,複雑な問題に対処しつつ,単純なタスクで高いパフォーマンスを示すことがわかった。
論文参考訳（メタデータ） (2025-04-11T17:08:02Z)
SWE-Fixer: Training Open-Source LLMs for Effective and Efficient GitHub Issue Resolution [56.9361004704428]
大規模言語モデル(LLM)は、様々な複雑なタスクにまたがる顕著な習熟度を示している。 SWE-Fixerは、GitHubの問題を効果的かつ効率的に解決するために設計された、新しいオープンソースフレームワークである。我々は,SWE-Bench LiteとVerifiedベンチマークに対するアプローチを評価し,オープンソースモデル間の競合性能を実現する。
論文参考訳（メタデータ） (2025-01-09T07:54:24Z)
EpiCoder: Encompassing Diversity and Complexity in Code Generation [66.43738008739555]
既存のコード生成方法はシードデータとしてコードスニペットを使用する。階層的なコード機能を中心に展開する,新しい機能ツリーベースの合成フレームワークを提案する。我々のフレームワークは、生成されたコードの複雑さを正確に制御し、関数レベルの操作からマルチファイルのシナリオまで幅広い機能を実現する。
論文参考訳（メタデータ） (2025-01-08T18:58:15Z)
OmniEvalKit: A Modular, Lightweight Toolbox for Evaluating Large Language Model and its Omni-Extensions [58.46747176834132]
我々は,Large Language Models (LLMs) を評価するために設計された,新しいベンチマークツールボックスであるOmniEvalKitを紹介する。単一の側面にフォーカスする既存のベンチマークとは異なり、OmniEvalKitはモジュール化され、軽量で、自動評価システムを提供する。 Static BuilderとDynamic Data Flowで構成されるモジュールアーキテクチャで構成されており、新しいモデルとデータセットのシームレスな統合を促進する。
論文参考訳（メタデータ） (2024-12-09T17:39:43Z)
A Machine Learning-Based Approach For Detecting Malicious PyPI Packages [4.311626046942916]
現代のソフトウェア開発では、外部ライブラリやパッケージの使用が増えている。この再利用コードへの依存は、悪意のあるパッケージという形でデプロイされたソフトウェアに重大なリスクをもたらす。本稿では、機械学習と静的解析を用いて、パッケージのメタデータ、コード、ファイル、テキストの特徴を調べるデータ駆動型アプローチを提案する。
論文参考訳（メタデータ） (2024-12-06T18:49:06Z)
PVAC: Package Version Activity Categorizer, Leveraging Semantic Versioning in a Heterogeneous System [0.0]
本研究の目的は、異種パッケージマネージャエコシステム内のバージョンアクティビティを評価するための体系的手法とプロトタイプツールの導入である。 3つのコンポーネントからなるパッケージバージョンアクティビティカテゴリ(PVAC)を開発した。 PVACは、さまざまなパッケージバージョン文字列からセマンティックバージョニングの詳細を解析し、一貫した分類とバージョン変更の定量的評価を可能にする。
論文参考訳（メタデータ） (2024-09-06T19:58:20Z)
We Have a Package for You! A Comprehensive Analysis of Package Hallucinations by Code Generating LLMs [3.515912713354746]
パッケージ幻覚は、大規模な言語モデルを使用してコードを生成する際に、ファクトコンフリクトのエラーから生じる。本稿では,プログラム言語間におけるパッケージ幻覚の厳密かつ包括的評価を行う。幻覚パッケージの平均パーセンテージは、商用モデルでは少なくとも5.2%、オープンソースモデルでは21.7%である。
論文参考訳（メタデータ） (2024-06-12T03:29:06Z)
Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration [64.19431011897515]
本稿では,問題解決のためにソフトウェアリポジトリ全体を包括的に理解し,活用するために設計された,新しいソフトウェアエンジニアリング手法であるAlibaba LingmaAgentを提案する。提案手法では,重要なリポジトリ情報を知識グラフに凝縮し,複雑さを低減し,モンテカルロ木探索に基づく戦略を採用する。 Alibaba Cloudの製品展開と評価において、LingmaAgentは、開発エンジニアが直面した社内問題の16.9%を自動で解決し、手作業による介入で43.3%の問題を解決した。
論文参考訳（メタデータ） (2024-06-03T15:20:06Z)
Analyzing the Evolution of Inter-package Dependencies in Operating Systems: A Case Study of Ubuntu [7.76541950830141]
オペレーティングシステム(OS)は複数の相互依存ソフトウェアパッケージを結合し、通常は独自に開発されたアーキテクチャを持つ。進化的な努力のために、OSのデザイナや開発者たちは、個々のファイルにフォーカスするシステム全体の依存性を完全に理解することで、大きな恩恵を受けることができます。本稿では,個々のバイナリファイルのレベルでの詳細なパッケージ関係の発見を目的としたフレームワークであるDepExを提案する。
論文参考訳（メタデータ） (2023-07-10T10:12:21Z)
Language Models Enable Simple Systems for Generating Structured Views of Heterogeneous Data Lakes [54.13559879916708]
EVAPORATEは大規模言語モデル(LLM)を利用したプロトタイプシステムである。コード合成は安価だが、各文書をLSMで直接処理するよりもはるかに正確ではない。直接抽出よりも優れた品質を実現する拡張コード実装EVAPORATE-CODE+を提案する。
論文参考訳（メタデータ） (2023-04-19T06:00:26Z)
An Empirical Analysis of the R Package Ecosystem [0.0]
私たちは20年間で25,000以上のパッケージ、15万のリリース、1500万ファイルを分析しました。生態系の歴史的成長は、あらゆる手段の下で堅牢であることに気付きました。
論文参考訳（メタデータ） (2021-02-19T12:55:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。