論文の概要: Learning pure quantum states (almost) without regret
- arxiv url: http://arxiv.org/abs/2406.18370v1
- Date: Wed, 26 Jun 2024 14:13:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-27 13:19:36.041899
- Title: Learning pure quantum states (almost) without regret
- Title(参考訳): 後悔せずに純粋な量子状態を学ぶ(ほとんど)
- Authors: Josep Lumbreras, Mikhail Terekhov, Marco Tomamichel,
- Abstract要約: 学習者は、未知の純粋量子状態にシーケンシャルなオラクルアクセスを持つ。
学習者の目標は、予想される累積的後悔をT$ラウンドで最小化することである。
累積的後悔は,新しいトモグラフィーアルゴリズムを用いて$Theta(operatornamepolylog T)$とスケールすることを示す。
- 参考スコア(独自算出の注目度): 7.988085110283119
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We initiate the study of quantum state tomography with minimal regret. A learner has sequential oracle access to an unknown pure quantum state, and in each round selects a pure probe state. Regret is incurred if the unknown state is measured orthogonal to this probe, and the learner's goal is to minimise the expected cumulative regret over $T$ rounds. The challenge is to find a balance between the most informative measurements and measurements incurring minimal regret. We show that the cumulative regret scales as $\Theta(\operatorname{polylog} T)$ using a new tomography algorithm based on a median of means least squares estimator. This algorithm employs measurements biased towards the unknown state and produces online estimates that are optimal (up to logarithmic terms) in the number of observed samples.
- Abstract(参考訳): 最小限の後悔を伴って量子状態トモグラフィーの研究を開始する。
学習者は未知の純粋な量子状態にシーケンシャルなオラクルアクセスを持ち、各ラウンドで純粋なプローブ状態を選択する。
未知の状態がこのプローブに直交して測定された場合、レグレトは発生し、学習者の目標は、T$ラウンドよりも期待される累積的後悔を最小化することである。
課題は、最も情報性の高い測定と、最小限の後悔を招く測定のバランスを見つけることである。
我々は,最小二乗推定器の中央値に基づく新しいトモグラフィーアルゴリズムを用いて,累積的後悔のスケールを$\Theta(\operatorname{polylog} T)$として示す。
このアルゴリズムは未知の状態に偏った測定を用い、観測されたサンプル数で最適(対数項まで)のオンライン推定を生成する。
関連論文リスト
- Efficient learning of quantum states prepared with few fermionic
non-Gaussian gates [0.0]
ガウスゲートの任意の数で用意された$n$フェルミオンモード上での学習状態の効率的なアルゴリズムを提案する。
我々の研究は、ガウス門をほとんど持たない状態の構造に光を当て、回路の複雑さを改良した上界を提供する。
論文 参考訳(メタデータ) (2024-02-28T19:18:27Z) - Lower bounds for learning quantum states with single-copy measurements [3.2590610391507444]
量子トモグラフィーとシャドウトモグラフィーの問題点を,未知の$d$次元状態の個々のコピーを用いて測定した。
特に、この手法は、その複雑さの観点から、フォークロアのパウリ・トモグラフィー(Pauli tomography)アルゴリズムの最適性を厳格に確立する。
論文 参考訳(メタデータ) (2022-07-29T02:26:08Z) - Quantum state tomography with tensor train cross approximation [84.59270977313619]
測定条件が最小限であるような状態に対して、完全な量子状態トモグラフィが実行可能であることを示す。
本手法は,非構造状態と局所測定のための最もよく知られたトモグラフィー法よりも指数関数的に少ない状態コピーを必要とする。
論文 参考訳(メタデータ) (2022-07-13T17:56:28Z) - Online estimation and control with optimal pathlength regret [52.28457815067461]
オンライン学習アルゴリズムを設計する際の自然なゴールは、入力シーケンスの時間的変動の観点から、アルゴリズムの後悔を束縛することである。
OCOや盗賊など、さまざまなオンライン学習問題に対して、データ依存の「病的」後悔境界が最近取得されている。
論文 参考訳(メタデータ) (2021-10-24T22:43:15Z) - Breaking the Sample Complexity Barrier to Regret-Optimal Model-Free
Reinforcement Learning [52.76230802067506]
漸進的強化学習における後悔を最小限に抑えるために,新しいモデルフリーアルゴリズムを提案する。
提案アルゴリズムは、2つのQ-ラーニングシーケンスの助けを借りて、初期設定された参照更新ルールを用いる。
初期の分散還元法の設計原理は、他のRL設定とは独立した関心を持つかもしれない。
論文 参考訳(メタデータ) (2021-10-09T21:13:48Z) - Direct Measure Matching for Crowd Counting [59.66286603624411]
そこで本研究では,予測密度マップを散乱点付基底真理に直接回帰する測度に基づく新しい計数手法を提案する。
本稿では, シンクホーンの測位損失を計測するために設計した, 半平衡型のシンクホーン発散を導出する。
論文 参考訳(メタデータ) (2021-07-04T06:37:33Z) - Quantum data hiding with continuous variable systems [8.37609145576126]
連続変数量子系のコンテキストにおけるデータ隠蔽について検討する。
ローカルな操作と古典的な通信で実装可能な測定セットである$mathcalM=mathrmLOCC$を見ていく。
非理想的ブラウンシュタイン・キンブル量子テレポーテーションプロトコルによって導入された誤差の厳密な定量的解析を行う。
論文 参考訳(メタデータ) (2021-02-01T19:00:14Z) - Fourier-style Quantum State Tomography and Purity Measurement of a
Multi-qubit System from Bloch Rotations [0.0]
量子状態トモグラフィーと状態純度推定にランダム軸測定を適用することを検討する。
単パルスX/Y回転のみに依存する単純なプロトコルを提案する。
論文 参考訳(メタデータ) (2021-01-14T20:38:39Z) - More Practical and Adaptive Algorithms for Online Quantum State Learning [11.836183463815653]
本稿では,量子状態のオンライン学習を促進するアルゴリズムを開発する。
まず,Tallis-2エントロピーを用いた正規化Follow-the-Leader (RFTL) 法により,完全な後方視でO(sqrtMT)$の総損失が得られることを示す。
次に,古典的な調整学習率スケジュールに基づくパラメータフリーアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-01T15:17:55Z) - Breaking the Sample Size Barrier in Model-Based Reinforcement Learning
with a Generative Model [50.38446482252857]
本稿では、生成モデル(シミュレータ)へのアクセスを想定して、強化学習のサンプル効率について検討する。
最初に$gamma$-discounted infinite-horizon Markov decision process (MDPs) with state space $mathcalS$ and action space $mathcalA$を考える。
対象の精度を考慮すれば,モデルに基づく計画アルゴリズムが最小限のサンプルの複雑さを実現するのに十分であることを示す。
論文 参考訳(メタデータ) (2020-05-26T17:53:18Z) - Frequentist Regret Bounds for Randomized Least-Squares Value Iteration [94.47472987987805]
有限水平強化学習(RL)における探索・探索ジレンマの検討
本稿では,ランダム化最小二乗値 (RLSVI) の楽観的な変種を紹介する。
マルコフ決定過程が低ランク遷移ダイナミクスを持つという仮定の下で、RSVIの頻繁な後悔は、$widetilde O(d2 H2 sqrtT)$$ d $ が特徴次元であり、$ H $ が地平線であり、$ T $ が総数であることを示す。
論文 参考訳(メタデータ) (2019-11-01T19:48:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。