論文の概要: Persistent-DPO: A novel loss function and hybrid learning for generative quantum eigensolver
- arxiv url: http://arxiv.org/abs/2509.08351v1
- Date: Wed, 10 Sep 2025 07:41:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 15:16:52.343026
- Title: Persistent-DPO: A novel loss function and hybrid learning for generative quantum eigensolver
- Title(参考訳): Persistent-DPO: 生成量子固有解法のための新しい損失関数とハイブリッド学習
- Authors: Junya Nakamura, Shinichiro Sanji,
- Abstract要約: 本稿では,量子回路を生成するために古典的生成モデルを訓練した生成量子固有解法(GQEcitenakaji2024generative,GQEcitenakaji2024generative)について検討する。
本稿では、GQEの損失関数として使用する場合の直接選好最適化(DPO)の限界を特定し、この制限の解としてパーシスタントDPO(P-DPO)を提案する。
- 参考スコア(独自算出の注目度): 0.20625936401496228
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the generative quantum eigensolver (GQE)~\cite{nakaji2024generative}, which trains a classical generative model to produce quantum circuits with desired properties such as describing molecular ground states. We introduce two methods to improve GQE. First, we identify a limitation of direct preference optimization (DPO) when used as the loss function in GQE, and propose Persistent-DPO (P-DPO) as a solution to this limitation. Second, as a method to improve the online learning during the training phase of GQE, we introduce a hybrid approach that combines online and offline learning. Using a transformer decoder implementation of GQE, we evaluate our methods through ground state search experiments on the $\mathrm{BeH_2^{}}$ molecule and observe that P-DPO achieves lower energies than DPO. The hybrid approach further improves convergence and final energy values, particularly with P-DPO.
- Abstract(参考訳): 生成量子固有解法(GQE)~\cite{nakaji2024generative} について検討し、分子基底状態を記述するなどの所望の性質を持つ量子回路を生成するために古典的生成モデルを訓練する。
GQEを改善するための2つの方法を紹介する。
まず、GQEの損失関数として使用する場合の直接選好最適化(DPO)の限界を特定し、この制限の解としてパーシスタントDPO(P-DPO)を提案する。
第2に、GQEのトレーニング段階におけるオンライン学習を改善する方法として、オンライン学習とオフライン学習を組み合わせたハイブリッドアプローチを導入する。
GQEの変圧器デコーダ実装を用いて,$\mathrm{BeH_2^{}}$分子の基底状態探索実験を行い,P-DPOがDPOよりも低いエネルギーを達成することを観察した。
ハイブリッドアプローチはさらに収束と最終エネルギー値、特にP-DPOを改善する。
関連論文リスト
- Direct Preference Optimization for Primitive-Enabled Hierarchical Reinforcement Learning [75.9729413703531]
DIPPERは階層的な政策学習を二段階最適化問題として定式化する新しいHRLフレームワークである。
DIPPERは、スパース報酬シナリオにおいて、最先端のベースラインよりも最大40%改善されていることを示す。
論文 参考訳(メタデータ) (2024-11-01T04:58:40Z) - Evolving a multi-population evolutionary-QAOA on distributed QPUs [0.0]
この進化的QAOA(E-QAOA)アプローチをMax-Cut問題に対して4ノードから26ノードの正規グラフ$d$3に対してベンチマークする。
本稿では,2つの量子処理ユニット上で並列で独立した集団を実行する分散多集団EA戦略を提案する。
論文 参考訳(メタデータ) (2024-09-16T21:16:51Z) - From $r$ to $Q^*$: Your Language Model is Secretly a Q-Function [50.812404038684505]
我々は,ベルマン方程式を満たす一般逆Q-ラーニングアルゴリズムとして,トークンレベルMDPのDPOを導出できることを示す。
本稿では,マルチターン対話における情報活用,推論,エージェント応用,マルチモデルシステムのエンドツーエンドトレーニングなど,我々の研究の応用について論じる。
論文 参考訳(メタデータ) (2024-04-18T17:37:02Z) - Human Alignment of Large Language Models through Online Preference
Optimisation [50.52545798589968]
最近のアライメント手法であるアイデンティティポリシー最適化(IPO)とNash Mirror Descent(Nash-MD)の等価性を示す。
この等価性は、オンラインバージョンのIPOを考えると証明できる。これは、両方の世代がオンラインポリシーによってサンプルされ、訓練された選好モデルによって注釈付けされる時である。
本稿では,一般的なNash-MDアルゴリズムと同様に,オンラインポリシと参照ポリシの混在したデータを生成するIPO-MDアルゴリズムを紹介する。
論文 参考訳(メタデータ) (2024-03-13T15:47:26Z) - The generative quantum eigensolver (GQE) and its application for ground
state search [6.7844469066080215]
本稿では、量子シミュレーションに古典的生成モデルを適用する新しい方法である生成量子固有解法(GQE)を紹介する。
電子構造ハミルトニアンの基底状態探索におけるGPT-QEのトレーニングと事前学習の有効性を実証する。
論文 参考訳(メタデータ) (2024-01-17T14:58:19Z) - Variational quantum solver employing the PDS energy functional [6.822193536884916]
接続モーメント展開の量子計算に基づく新しい量子アルゴリズムのクラスが、基底と励起状態エネルギーを見つけるために報告されている。
ここでは、Peeters-Devreese-Soldatov (PDS) の定式化は変分的であり、既存の変分量子インフラとさらに結合する可能性を持つ。
従来の変分量子固有解法(VQE)や元の静的PSD法と比較して、この新しい変分量子解法は、局所的なミニマに閉じ込められないようにダイナミクスをナビゲートするための効果的なアプローチを提供する。
論文 参考訳(メタデータ) (2021-01-21T10:12:38Z) - Benchmarking adaptive variational quantum eigensolvers [63.277656713454284]
VQEとADAPT-VQEの精度をベンチマークし、電子基底状態とポテンシャルエネルギー曲線を計算する。
どちらの手法もエネルギーと基底状態の優れた推定値を提供する。
勾配に基づく最適化はより経済的であり、勾配のない類似シミュレーションよりも優れた性能を提供する。
論文 参考訳(メタデータ) (2020-11-02T19:52:04Z) - Preparation of excited states for nuclear dynamics on a quantum computer [117.44028458220427]
量子コンピュータ上で励起状態を作成するための2つの異なる方法を研究する。
シミュレーションおよび実量子デバイス上でこれらの手法をベンチマークする。
これらの結果から,フォールトトレラントデバイスに優れたスケーリングを実現するために設計された量子技術が,接続性やゲート忠実性に制限されたデバイスに実用的なメリットをもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-28T17:21:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。