論文の概要: Coherent Swap Regret and Channel-Proof Learning
- arxiv url: http://arxiv.org/abs/2606.02655v1
- Date: Mon, 01 Jun 2026 05:06:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.493391
- Title: Coherent Swap Regret and Channel-Proof Learning
- Title(参考訳): コヒーレントスワップレグレストとチャネル証明学習
- Authors: Sohail Sarkar,
- Abstract要約: 外部の後悔は、自分の行動が固定された代替手段によって置き換えられることに対してのみ、安定性を証明します。
このような局所的なCPTP偏差に対する後悔ベンチマークとして,コヒーレントスワップ後悔を導入する。
我々はこれらの平衡を、媒介する量子レコメンデーションプロトコルのチャネル保護性と同定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: External regret certifies stability only against replacing one's behavior by a fixed alternative. In a quantum game, this misses a natural physical move: a player can apply a local completely positive trace-preserving (CPTP) map to the state it actually received or prepared. We introduce coherent swap regret as the regret benchmark against all such local CPTP deviations, and give an algorithm achieving $O(\sqrt{dT\log d})$ coherent swap regret via entropic mirror ascent on the CPTP Choi slice with a fixed-point play rule. The main result is a three-level deviation-class landscape. Replacement channels recover ordinary external regret at rate $Θ(\sqrt{T\log d})$. Unital channels, including unitary deviations and mixtures of unitaries, have zero minimax regret. Deterministic measurement-and-preparation channels already force $Ω(\sqrt{dT\log d})$ regret in the moderate-horizon regime, and this rate is also sufficient for all CPTP deviations. Thus the hardness comes from non-unital use of the recommendation register, not from quantum coherence alone. As an application, decentralized full-information learning in finite quantum games reaches an $\varepsilon$-approximate separable quantum correlated equilibrium after $T=O(\max_i d_i\log d_i/\varepsilon^2)$ rounds. We identify these equilibria with channel-proofness of mediated quantum recommendation protocols, give an SDP audit for local CPTP exploitability applicable to arbitrary finite-dimensional states, and include a probing-bandit extension with pseudo-regret $O(d^{4/3}T^{2/3}(\log d)^{1/3})$ under Haar-random pure-state probes.
- Abstract(参考訳): 外部の後悔は、自分の行動が固定された代替手段によって置き換えられることに対してのみ、安定性を証明します。
プレイヤーは、実際に受信または準備した状態に対して、局所的に完全に正のトレース保存(CPTP)マップを適用することができる。
そこで我々は, CPTP Choiスライス上でのエントロピーミラーの上昇により, アルゴリズムが$O(\sqrt{dT\log d})$コヒーレントスワップ後悔を達成できることを示す。
主な成果は3段階の偏差クラスランドスケープである。
置換チャネルは、通常の外部の後悔を、$(\sqrt{T\log d})$で回復する。
ユニタリな偏差やユニタリの混合を含むユニタリチャネルは、ミニマックスの後悔をゼロにする。
決定論的測定・準備チャネルは、中等水平状態において既に$Ω(\sqrt{dT\log d})$後悔を強いるが、この速度は全てのCPTP偏差にも十分である。
したがって、ハードネスは、量子コヒーレンスのみからではなく、レコメンデーションレジスタの非ユニタリな使用に由来する。
応用として、有限量子ゲームにおける分散フル情報学習は、$T=O(\max_i d_i\log d_i/\varepsilon^2)のラウンドの後に、$\varepsilon$-approximateの分離可能な量子相関平衡に達する。
我々は、これらの平衡を、媒介する量子レコメンデーションプロトコルのチャネル保護性と識別し、任意の有限次元状態に適用可能な局所CPTP利用可能性のSDP監査を与え、Haar-random純状態プローブの下で擬似回帰$O(d^{4/3}T^{2/3}(\log d)^{1/3})$の確率帯域拡張を含む。
関連論文リスト
- Zeno-Enhanced Probabilistic Error Cancellation with Quantum Error Detection Codes [2.6031571481535143]
量子エラー検出符号と確率的エラーキャンセルの相補性を利用する。
我々は物理ノイズをより弱い論理チャネルにマッピングし、PECを残留チャネルにのみ適用する。
フィードバックのないQED+PECスキームはクリフォード論理ブロック、安定化器の測定、ポストセレクション、確率的キャンセルをインターリーブする。
論文 参考訳(メタデータ) (2026-05-12T14:06:27Z) - Correction and Corruption: A Two-Rate View of Error Flow in LLM Protocols [51.56484100374058]
そこで本研究では,単一プロトコルステップを正確なマッチングタスクで監査するためのペアアウトカム計測インタフェースを提案する。
各インスタンスについて、インターフェースはベースラインの正当性ビットと後ステップの正当性ビットを記録する。
これらのレートは精度の変化を予測し、種、混合物、パイプライン間でテスト可能な再利用可能な経験的インターフェースを定義する。
論文 参考訳(メタデータ) (2026-04-20T13:25:40Z) - Optimal Unconstrained Self-Distillation in Ridge Regression: Strict Improvements, Precise Asymptotics, and One-Shot Tuning [61.07540493350384]
自己蒸留(英: Self-distillation, SD)とは、教師自身の予測と地道の混合で学生を訓練する過程である。
任意の予測リスクに対して、各正規化レベルにおいて、最適に混合された学生がリッジ教師に改善されることが示される。
本稿では,グリッド探索やサンプル分割,再構成なしに$star$を推定する一貫したワンショットチューニング手法を提案する。
論文 参考訳(メタデータ) (2026-02-19T17:21:15Z) - Swap Regret Minimization Through Response-Based Approachability [66.39400409563976]
オンライン最適化において,スワップ後悔という異なる概念を最小化することの問題点を考察する。
我々は、一般凸集合に対して$O(d3/2 sqrtT)$リニアスワップ後悔を保証し、集合が中央対称であるときに$O(d sqrtT)$を保証し、より単純で効率的なアルゴリズムを開発する。
論文 参考訳(メタデータ) (2026-02-05T23:43:25Z) - A new approximate Eastin-Knill theorem [0.0]
量子誤り訂正符号はゲートの普遍的な集合をサポートし, 局所消去に対してほぼ正であることを示す。
特に、量子誤り訂正符号は、符号化と雑音チャネルのChoi状態の条件最小エントロピーが最悪の誤差確率の関数によって上界にある場合に限り、ゲートの普遍的な集合をサポートすることができることを示す。
論文 参考訳(メタデータ) (2025-05-01T09:56:26Z) - Stable Symmetry-Protected Topological Phases in Systems with Heralded Noise [0.0]
定常状態が安定な混合状態対称性保護位相(SPT)秩序を示す局所量子チャネルの族を示す。
定常状態の短距離対に誤差を閉じ込める補正プロトコルを構築する。
遮蔽ノイズの速度が増加するにつれて、SPTの順序は最終的に有向パーコレーション遷移によって失われる。
論文 参考訳(メタデータ) (2024-04-25T18:21:48Z) - Stochastic Shortest Path with Adversarially Changing Costs [57.90236104782219]
最短経路 (SSP) は計画と制御においてよく知られた問題である。
また, 時間とともにコストの逆変化を考慮に入れた逆SSPモデルを提案する。
我々は、この自然な逆SSPの設定を最初に検討し、それに対するサブ線形後悔を得る。
論文 参考訳(メタデータ) (2020-06-20T12:10:35Z) - Upper Confidence Primal-Dual Reinforcement Learning for CMDP with
Adversarial Loss [145.54544979467872]
マルコフ決定過程(CMDP)に対するオンライン学習の検討
本稿では,遷移モデルから標本化した軌跡のみを必要とする,新しいEmphupper confidence primal-dualアルゴリズムを提案する。
我々の分析では、ラグランジュ乗算過程の新たな高確率ドリフト解析を、高信頼強化学習の記念後悔解析に組み入れている。
論文 参考訳(メタデータ) (2020-03-02T05:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。