論文の概要: QuantumLLMInstruct: A 500k LLM Instruction-Tuning Dataset with Problem-Solution Pairs for Quantum Computing
- arxiv url: http://arxiv.org/abs/2412.20956v1
- Date: Mon, 30 Dec 2024 13:53:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:05:43.366993
- Title: QuantumLLMInstruct: A 500k LLM Instruction-Tuning Dataset with Problem-Solution Pairs for Quantum Computing
- Title(参考訳): QuantumLLMインストラクト:量子コンピューティングのための問題解決ペア付き500k LLMインストラクションチューニングデータセット
- Authors: Shlomo Kashani,
- Abstract要約: 我々はQuantumLLMInstruct(QLMMI)について紹介する。
QLMMIは、量子コンピューティング専用に設計された50,000以上の厳密にキュレートされた命令追従問題解対を備えている。
- 参考スコア(独自算出の注目度): 1.90365714903665
- License:
- Abstract: We present QuantumLLMInstruct (QLMMI), an innovative dataset featuring over 500,000 meticulously curated instruction-following problem-solution pairs designed specifically for quantum computing - the largest and most comprehensive dataset of its kind. Originating from over 90 primary seed domains and encompassing hundreds of subdomains autonomously generated by LLMs, QLMMI marks a transformative step in the diversity and richness of quantum computing datasets. Designed for instruction fine-tuning, QLMMI seeks to significantly improve LLM performance in addressing complex quantum computing challenges across a wide range of quantum physics topics. While Large Language Models (LLMs) have propelled advancements in computational science with datasets like Omni-MATH and OpenMathInstruct, these primarily target Olympiad-level mathematics, leaving quantum computing largely unexplored. The creation of QLMMI follows a rigorous four-stage methodology. Initially, foundational problems are developed using predefined templates, focusing on critical areas such as synthetic Hamiltonians, QASM code generation, Jordan-Wigner transformations, and Trotter-Suzuki quantum circuit decompositions. Next, detailed and domain-specific solutions are crafted to ensure accuracy and relevance. In the third stage, the dataset is enriched through advanced reasoning techniques, including Chain-of-Thought (CoT) and Task-Oriented Reasoning and Action (ToRA), which enhance problem-solution diversity while adhering to strict mathematical standards. Lastly, a zero-shot Judge LLM performs self-assessments to validate the dataset's quality and reliability, minimizing human oversight requirements.
- Abstract(参考訳): 我々はQuantumLLMInstruct(QLMMI)という,50,000以上の厳密にキュレートされた命令追従問題解のペアを量子コンピューティング用に設計した,革新的なデータセットを提示する。
90以上のプライマリシードドメインから派生し、LLMによって自律的に生成される数百のサブドメインを含むQLMMIは、量子コンピューティングデータセットの多様性と豊かさの転換的なステップである。
命令の微調整のために設計されたQLMMIは、幅広い量子物理学のトピックにまたがる複雑な量子コンピューティングの課題に対処する上で、LLMの性能を大幅に改善することを目指している。
大規模言語モデル(LLM)はOmni-MATHやOpenMath Instructのようなデータセットによる計算科学の進歩を推進してきたが、これらは主にオリンピアードレベルの数学をターゲットとしており、量子コンピューティングはほとんど探索されていない。
QLMMIの作成は厳格な4段階の方法論に従っている。
当初、基本問題は予め定義されたテンプレートを用いて開発され、合成ハミルトン、QASM符号生成、ヨルダン・ウィグナー変換、トロッター・スズキ量子回路分解といった重要な領域に焦点を当てている。
次に、正確性と関連性を保証するために、詳細でドメイン固有のソリューションが作成されます。
第3段階では、データセットはChain-of-Thought(CoT)やTask-Oriented Reasoning and Action(ToRA)といった高度な推論技術によって豊かにされ、厳密な数学的基準を守りながら問題解決の多様性を高める。
最後に、ゼロショットの判断LDMは、データセットの品質と信頼性を検証するために自己評価を行い、人間の監視要求を最小限にする。
関連論文リスト
- QCircuitNet: A Large-Scale Hierarchical Dataset for Quantum Algorithm Design [17.747641494506087]
量子アルゴリズムの設計と実装におけるAIの能力を評価するために設計された、最初のベンチマークおよびテストデータセットであるQCircuitNetを紹介する。
従来のコードの記述にAIを使用するのとは異なり、このタスクは基本的に異なり、非常に柔軟な設計空間と複雑なキュービット操作のため、さらに複雑である。
論文 参考訳(メタデータ) (2024-10-10T14:24:30Z) - ErrorRadar: Benchmarking Complex Mathematical Reasoning of Multimodal Large Language Models Via Error Detection [60.297079601066784]
エラー検出におけるMLLMの能力を評価するために設計された最初のベンチマークであるErrorRadarを紹介する。
ErrorRadarはエラーステップ識別とエラー分類という2つのサブタスクを評価している。
2500の高品質なマルチモーダルK-12数学問題で構成され、実世界の学生相互作用から収集される。
GPT-4oの優れた性能は、まだ人間の評価に約10%遅れているため、大きな課題が残っている。
論文 参考訳(メタデータ) (2024-10-06T14:59:09Z) - Generalization Error Bound for Quantum Machine Learning in NISQ Era -- A Survey [37.69303106863453]
我々は、NISQ時代における教師付き量子機械学習(QML)の最先端の一般化について、システムマッピング研究(SMS)を実施している。
本研究は,既存の計算プラットフォームを,量子ハードウェア,データセット,最適化手法,文献に見られる境界の共通特性で体系的に要約する。
SMSはまた、NISQ時代のQMLの限界と課題を強調し、分野を前進させる今後の研究の方向性について論じている。
論文 参考訳(メタデータ) (2024-09-11T21:17:30Z) - SIaM: Self-Improving Code-Assisted Mathematical Reasoning of Large Language Models [54.78329741186446]
本稿では,コードに基づく批判モデルを用いて,質問コードデータ構築,品質管理,補完的評価などのステップをガイドする新しいパラダイムを提案する。
英語と中国語におけるドメイン内ベンチマークとドメイン外ベンチマークの両方の実験は、提案したパラダイムの有効性を実証している。
論文 参考訳(メタデータ) (2024-08-28T06:33:03Z) - Efficient Learning for Linear Properties of Bounded-Gate Quantum Circuits [63.733312560668274]
d可変RZゲートとG-dクリフォードゲートを含む量子回路を与えられた場合、学習者は純粋に古典的な推論を行い、その線形特性を効率的に予測できるだろうか?
我々は、d で線形にスケーリングするサンプルの複雑さが、小さな予測誤差を達成するのに十分であり、対応する計算の複雑さは d で指数関数的にスケールすることを証明する。
我々は,予測誤差と計算複雑性をトレードオフできるカーネルベースの学習モデルを考案し,多くの実践的な環境で指数関数からスケーリングへ移行した。
論文 参考訳(メタデータ) (2024-08-22T08:21:28Z) - Qiskit HumanEval: An Evaluation Benchmark For Quantum Code Generative Models [1.8213213818713139]
我々は、Qiskit HumanEvalデータセットを導入し、量子コードを生成するための大規模言語モデルの能力をベンチマークするために使用します。
このデータセットは100以上の量子コンピューティングタスクから構成されており、それぞれにプロンプト、標準解、そして生成した解の正確性を評価するのに困難スケールが伴っている。
論文 参考訳(メタデータ) (2024-06-20T20:14:22Z) - Quantum algorithms: A survey of applications and end-to-end complexities [90.05272647148196]
期待されている量子コンピュータの応用は、科学と産業にまたがる。
本稿では,量子アルゴリズムの応用分野について検討する。
私たちは、各領域における課題と機会を"エンドツーエンド"な方法で概説します。
論文 参考訳(メタデータ) (2023-10-04T17:53:55Z) - QKSAN: A Quantum Kernel Self-Attention Network [53.96779043113156]
量子カーネル法(Quantum Kernel Methods, QKM)のデータ表現能力とSAMの効率的な情報抽出能力を組み合わせた量子カーネル自己認識機構(Quantum Kernel Self-Attention Mechanism, QKSAM)を導入する。
量子カーネル自己保持ネットワーク(QKSAN)フレームワークは,DMP(Dederred Measurement Principle)と条件測定技術を巧みに組み込んだQKSAMに基づいて提案されている。
4つのQKSANサブモデルはPennyLaneとIBM Qiskitプラットフォームにデプロイされ、MNISTとFashion MNISTのバイナリ分類を実行する。
論文 参考訳(メタデータ) (2023-08-25T15:08:19Z) - QDataset: Quantum Datasets for Machine Learning [1.160208922584163]
QDataSetは、QMLアルゴリズムのトレーニングと開発を容易にするために設計された量子データセットである。
データセットは、機械学習の実践者がQDataSetを使用して、応用量子計算の問題を解決するために、豊富な情報を提供するように構成されている。
関連するGitHubリポジトリのデータセットは、さまざまな最適化コンテキストにおけるQDataSetの使用を実証するセットである。
論文 参考訳(メタデータ) (2021-08-15T05:30:59Z) - Quantum Federated Learning with Quantum Data [87.49715898878858]
量子機械学習(QML)は、量子コンピューティングの発展に頼って、大規模な複雑な機械学習問題を探求する、有望な分野として登場した。
本稿では、量子データ上で動作し、量子回路パラメータの学習を分散的に共有できる初めての完全量子連合学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-30T12:19:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。