論文の概要: Improving MPI Error Detection and Repair with Large Language Models and Bug References
- arxiv url: http://arxiv.org/abs/2604.02398v1
- Date: Thu, 02 Apr 2026 14:00:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.143492
- Title: Improving MPI Error Detection and Repair with Large Language Models and Bug References
- Title(参考訳): 大規模言語モデルとバグ参照によるMPI誤り検出と修復の改善
- Authors: Scott Piersall, Yang Gao, Shenyang Liu, Liqiang Wang,
- Abstract要約: Message Passing Interface (MPI) は高性能コンピューティングの基礎技術である。
本稿では,Few-Thought Learning,Chain-of-Shot推論,Retrieval Augmented Generationとともに,バグ検出と修復手法を設計する。
我々の実験では,バグ参照手法が他の大規模言語モデルによく応用されていることを実証した。
- 参考スコア(独自算出の注目度): 8.325950934287699
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Message Passing Interface (MPI) is a foundational technology in high-performance computing (HPC), widely used for large-scale simulations and distributed training (e.g., in machine learning frameworks such as PyTorch and TensorFlow). However, maintaining MPI programs remains challenging due to their complex interplay among processes and the intricacies of message passing and synchronization. With the advancement of large language models like ChatGPT, it is tempting to adopt such technology for automated error detection and repair. Yet, our studies reveal that directly applying large language models (LLMs) yields suboptimal results, largely because these models lack essential knowledge about correct and incorrect usage, particularly the bugs found in MPI programs. In this paper, we design a bug detection and repair technique alongside Few-Shot Learning (FSL), Chain-of-Thought (CoT) reasoning, and Retrieval Augmented Generation (RAG) techniques in LLMs to enhance the large language model's ability to detect and repair errors. Surprisingly, such enhancements lead to a significant improvement, from 44% to 77%, in error detection accuracy compared to baseline methods that use ChatGPT directly. Additionally, our experiments demonstrate our bug referencing technique generalizes well to other large language models.
- Abstract(参考訳): Message Passing Interface (MPI)はハイパフォーマンスコンピューティング(HPC)の基礎技術であり、大規模なシミュレーションや分散トレーニング(例えば、PyTorchやTensorFlowのような機械学習フレームワーク)に広く利用されている。
しかし、プロセス間の複雑な相互作用とメッセージパッシングと同期の複雑さのため、MPIプログラムのメンテナンスは依然として困難である。
ChatGPTのような大規模言語モデルの進歩により、自動エラー検出と修復にこのような技術を採用する傾向にある。
しかし,本研究では,大規模言語モデル(LLM)を直接適用することで,特にMPIプログラムで見られるバグについて,これらのモデルに重要な知識が欠如していることが判明した。
本稿では,LLMにおけるFew-Shot Learning(FSL),Chain-of-Thought(CoT)推論,Retrieval Augmented Generation(RAG)技術と併用して,大規模言語モデルの誤り検出・修正能力を高めるためのバグ検出・修復手法を設計する。
驚くべきことに、このような拡張はChatGPTを直接使用するベースラインメソッドと比較してエラー検出精度が44%から77%に向上した。
さらに,本実験では,他の大規模言語モデルに対して,バグ参照手法の一般化を実証した。
関連論文リスト
- ReGUIDE: Data Efficient GUI Grounding via Spatial Reasoning and Search [53.40810298627443]
ReGUIDEは、MLLMが自己生成的推論と空間認識的批判を通じてデータを効率的に学習することを可能にするWebグラウンドのためのフレームワークである。
実験により、ReGUIDEは複数のベンチマークでWebグラウンド性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2025-05-21T08:36:18Z) - Enhancing Large Language Models with Faster Code Preprocessing for Vulnerability Detection [0.0]
既存のSCoPEフレームワーク上に構築し、パフォーマンスを改善した拡張バージョンであるSCoPE2を導入します。
SCoPE2による処理時間を97.3%削減し,脆弱性検出のためのLarge Language Model(LLM)のF1スコアを改良した。
論文 参考訳(メタデータ) (2025-05-08T19:00:11Z) - Supporting Cross-language Cross-project Bug Localization Using Pre-trained Language Models [2.5121668584771837]
既存のテクニックは、アプリケーション固有のデータに依存しているため、一般化性とデプロイメントに苦労することが多い。
本稿では,プロジェクトと言語の境界を超越したバグローカライゼーションのための,PLMに基づく新しい言語モデルを提案する。
論文 参考訳(メタデータ) (2024-07-03T01:09:36Z) - A Deep Dive into Large Language Models for Automated Bug Localization and Repair [12.756202755547024]
大規模言語モデル(LLM)は、自動プログラム修復(APR)など、様々なソフトウェアエンジニアリングタスクにおいて顕著な効果を示している。
本研究では,LSMを用いた自動バグ修正について深く検討する。
異なるLLMを用いてバグの局所化と修正を分離することにより、多様なコンテキスト情報の効果的な統合が可能になる。
Toggleは、CodeXGLUEコード改善ベンチマークで、新しい最先端(SOTA)パフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-04-17T17:48:18Z) - Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models [102.72940700598055]
推論タスクでは、小さなエラーでも不正確な結果にカスケードすることができる。
入力の摂動に頼らず、外部リソースの導入を避ける手法を開発した。
私たちのトレーニングアプローチでは、思考の連鎖の中で特定のトークンをランダムにマスクします。
論文 参考訳(メタデータ) (2024-03-04T16:21:54Z) - Generative error correction for code-switching speech recognition using
large language models [49.06203730433107]
コードスイッチング(英: Code-switching, CS)とは、2つ以上の言語が同じ文内に混在する現象である。
本稿では,大規模言語モデル (LLM) と ASR が生成する仮説のリストを利用して,CS 問題に対処することを提案する。
論文 参考訳(メタデータ) (2023-10-17T14:49:48Z) - The Devil is in the Errors: Leveraging Large Language Models for
Fine-grained Machine Translation Evaluation [93.01964988474755]
AutoMQMは,大規模な言語モデルに対して,翻訳におけるエラーの識別と分類を求めるプロンプト技術である。
テキスト内学習と微調整によるラベル付きデータの影響について検討する。
次に, PaLM-2モデルを用いてAutoMQMを評価し, スコアのプロンプトよりも性能が向上することがわかった。
論文 参考訳(メタデータ) (2023-08-14T17:17:21Z) - Teaching Large Language Models to Self-Debug [62.424077000154945]
大規模言語モデル(LLM)は、コード生成において素晴らしいパフォーマンスを達成した。
本稿では,大規模言語モデルで予測プログラムを数発のデモでデバッグする自己デバッグを提案する。
論文 参考訳(メタデータ) (2023-04-11T10:43:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。