論文の概要: PennyLang: Pioneering LLM-Based Quantum Code Generation with a Novel PennyLane-Centric Dataset
- arxiv url: http://arxiv.org/abs/2503.02497v1
- Date: Tue, 04 Mar 2025 11:04:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:27:05.315074
- Title: PennyLang: Pioneering LLM-Based Quantum Code Generation with a Novel PennyLane-Centric Dataset
- Title(参考訳): PennyLang:新しいペニーレーン中心データセットによるLLMベースの量子コード生成のパイオニア化
- Authors: Haider Asif, Abdul Basit, Nouhaila Innan, Muhammad Kashif, Alberto Marchisio, Muhammad Shafique,
- Abstract要約: 大きな言語モデル(LLM)は、コード生成、自然言語処理、ドメイン固有の推論において顕著な機能を提供します。
量子回路の3,347ペニーレーン固有のコードサンプルからなる,新しい高品質なデータセットを提案する。
- 参考スコア(独自算出の注目度): 5.068845500478373
- License:
- Abstract: Large Language Models (LLMs) offer remarkable capabilities in code generation, natural language processing, and domain-specific reasoning. Their potential in aiding quantum software development remains underexplored, particularly for the PennyLane framework-a leading platform for hybrid quantum-classical computing. To address this gap, we introduce a novel, high-quality dataset comprising 3,347 PennyLane-specific code samples of quantum circuits and their contextual descriptions, specifically curated to train/fine-tune LLM-based quantum code assistance. Our key contributions are threefold: (1) the automatic creation and open-source release of a comprehensive PennyLane dataset leveraging quantum computing textbooks, official documentation, and open-source repositories; (2) the development of a systematic methodology for data refinement, annotation, and formatting to optimize LLM training efficiency; and (3) a thorough evaluation, based on a Retrieval-Augmented Generation (RAG) framework, demonstrating the effectiveness of our dataset in streamlining PennyLane code generation and improving quantum development workflows. Compared to existing efforts that predominantly focus on Qiskit, our dataset significantly broadens the spectrum of quantum frameworks covered in AI-driven code assistance. By bridging this gap and providing reproducible dataset-creation methodologies, we aim to advance the field of AI-assisted quantum programming, making quantum computing more accessible to both newcomers and experienced developers.
- Abstract(参考訳): 大きな言語モデル(LLM)は、コード生成、自然言語処理、ドメイン固有の推論において顕著な機能を提供します。
特にPennyLaneフレームワークは、ハイブリッド量子古典コンピューティングの先駆的なプラットフォームである。
このギャップに対処するために,3,347ペニーレーン固有の量子回路のコードサンプルとその文脈記述を含む,新しい高品質なデータセットを導入する。
1) 量子コンピューティング教科書,公式資料,オープンソースリポジトリを活用する包括的なPennyLaneデータセットの自動作成とオープンソースリリース,(2) LLMトレーニング効率を最適化するためのデータリファインメント,アノテーション,フォーマットのための体系的方法論の開発,(3) Retrieval-Augmented Generation (RAG) フレームワークに基づく徹底的な評価,PennyLaneコード生成の合理化と量子開発ワークフローの改善によるデータセットの有効性の実証。
Qiskitに主にフォーカスする既存の取り組みと比較して、私たちのデータセットは、AI駆動のコードアシストでカバーされる量子フレームワークのスペクトルを大きく広げています。
このギャップを埋めて再現可能なデータセット作成方法論を提供することで、我々は、AI支援量子プログラミングの分野を前進させ、量子コンピューティングを新参者および経験豊富な開発者の両方にとってよりアクセスしやすくすることを目指している。
関連論文リスト
- OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models [70.72097493954067]
コードのための大規模言語モデル(LLM)は、コード生成、推論タスク、エージェントシステムなど、さまざまな領域で必須になっている。
オープンアクセスのコード LLM はプロプライエタリなモデルの性能レベルに近づきつつあるが、高品質なコード LLM は依然として限られている。
トップクラスのコードLLMであるOpenCoderは、主要なモデルに匹敵するパフォーマンスを達成するだけでなく、研究コミュニティの"オープンクックブック"としても機能します。
論文 参考訳(メタデータ) (2024-11-07T17:47:25Z) - Qiskit HumanEval: An Evaluation Benchmark For Quantum Code Generative Models [1.8213213818713139]
我々は、Qiskit HumanEvalデータセットを導入し、量子コードを生成するための大規模言語モデルの能力をベンチマークするために使用します。
このデータセットは100以上の量子コンピューティングタスクから構成されており、それぞれにプロンプト、標準解、そして生成した解の正確性を評価するのに困難スケールが伴っている。
論文 参考訳(メタデータ) (2024-06-20T20:14:22Z) - Qiskit Code Assistant: Training LLMs for generating Quantum Computing Code [2.0108122340549985]
本稿では,量子コンピューティングの分野を専門とする Code LLM のトレーニングに焦点をあてる。
量子コンピューティングに特化したコードLLMは、量子コンピューティングと量子情報理論の基本的な理解を必要とする。
我々は,Qiskitライブラリを用いて,高品質な量子コードを生成するための Code LLMs のトレーニングについて論じる。
論文 参考訳(メタデータ) (2024-05-29T20:21:00Z) - Neural auto-designer for enhanced quantum kernels [59.616404192966016]
本稿では,問題固有の量子特徴写像の設計を自動化するデータ駆動型手法を提案する。
私たちの研究は、量子機械学習の進歩におけるディープラーニングの実質的な役割を強調します。
論文 参考訳(メタデータ) (2024-01-20T03:11:59Z) - Quantum Computing Enhanced Service Ecosystem for Simulation in Manufacturing [56.61654656648898]
本稿では,製造シミュレーションのための量子コンピューティングによるサービスエコシステムの枠組みを提案する。
我々は,これらの新しい計算パラダイムを定量的に評価することを目的とした2つの高価値ユースケースを分析した。
論文 参考訳(メタデータ) (2024-01-19T11:04:14Z) - ShadowNet for Data-Centric Quantum System Learning [188.683909185536]
本稿では,ニューラルネットワークプロトコルと古典的シャドウの強みを組み合わせたデータ中心学習パラダイムを提案する。
ニューラルネットワークの一般化力に基づいて、このパラダイムはオフラインでトレーニングされ、これまで目に見えないシステムを予測できる。
量子状態トモグラフィーおよび直接忠実度推定タスクにおいて、我々のパラダイムのインスタンス化を示し、60量子ビットまでの数値解析を行う。
論文 参考訳(メタデータ) (2023-08-22T09:11:53Z) - Semi-definite programming and quantum information [0.0]
本稿では,量子情報の文脈における半定値プログラミング(SDP)手法の包括的探索について述べる。
凸最適化、双対性、SDP定式化の数学的基礎について検討する。
これらのツールを活用することで、研究者や実践者は古典的および量子的相関を特徴づけ、量子状態を最適化し、効率的な量子アルゴリズムとプロトコルを設計することができる。
論文 参考訳(メタデータ) (2023-06-28T21:02:06Z) - On exploring the potential of quantum auto-encoder for learning quantum systems [60.909817434753315]
そこで我々は,古典的な3つのハードラーニング問題に対処するために,QAEに基づく効果的な3つの学習プロトコルを考案した。
私たちの研究は、ハード量子物理学と量子情報処理タスクを達成するための高度な量子学習アルゴリズムの開発に新たな光を当てています。
論文 参考訳(メタデータ) (2021-06-29T14:01:40Z) - Quantum Federated Learning with Quantum Data [87.49715898878858]
量子機械学習(QML)は、量子コンピューティングの発展に頼って、大規模な複雑な機械学習問題を探求する、有望な分野として登場した。
本稿では、量子データ上で動作し、量子回路パラメータの学習を分散的に共有できる初めての完全量子連合学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-30T12:19:27Z) - Quantum Annealing for Semi-Supervised Learning [5.714334716737985]
セミ教師付き学習は、ラベル付きデータとラベルなしデータの両方をトレーニングに使う機械学習技術である。
本稿では,量子アニール法を用いて,グラフに基づく半教師付き学習手法を提案し,理論的に解析する。
本稿では,ラベル付きデータの一部(20%)が関与している場合でも,本手法の有効性を示唆する2つの分類例を示す。
論文 参考訳(メタデータ) (2020-03-27T15:09:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。