論文の概要: Adversarial Reinforcement Learning for Adaptive Eavesdropping in BB84 Quantum Key Distribution
- arxiv url: http://arxiv.org/abs/2606.22962v1
- Date: Mon, 22 Jun 2026 07:43:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 03:11:49.964984
- Title: Adversarial Reinforcement Learning for Adaptive Eavesdropping in BB84 Quantum Key Distribution
- Title(参考訳): BB84量子鍵分布における適応盗聴の逆強化学習
- Authors: Ramon Jose C. Bagunu,
- Abstract要約: BB84量子鍵分布は、あらゆる盗聴器が統計的に検出可能な方法でチャネルを乱すという物理的保証から、そのセキュリティを導出する。
学習エージェントとしてEveをモデル化した場合に何が起こるかを検討する。
Q-Learningは、検出を99.4%$から0.28%pm0.27%$で$_ch=1%$に削減し、エピソード毎に約10.5ビットの正しいビットを抽出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: BB84 quantum key distribution derives its security from a physical guarantee that any eavesdropper disturbs the channel in a statistically detectable way. Prior work evaluates this by assuming Eve attacks at a fixed, analytically optimized rate. We examine what happens when Eve is modeled instead as a learning agent. Classical reinforcement learning is used, specifically tabular Q-Learning, SARSA, and Double Q-Learning, to adaptive BB84 eavesdropping. This formulates the attacker's decision as a Markov Decision Process where the agent observes Quantum Bit Error Rate (QBER) feedback and decides, qubit by qubit, whether to intercept or pass. Experiments span three channel noise levels ($μ_{ch}\in\{1\%,3\%,5\%\}$) and are validated across five independent random seeds (45 training runs per condition, 10,000 episodes each). Against the best non-adaptive analytical baseline, Q-Learning reduces detection from $99.4\%$ to $0.28\%\pm0.27\%$ at $μ_{ch}=1\%$ while extracting approximately 10.5 correct bits per episode. This is a 355-fold reduction that is statistically significant ($p=0.020$, Mann-Whitney $U$ test). We also report the spontaneous emergence of an end-game burst, where agents independently learn to surge their attack rate at the final block. This exploit vanishes under randomized checkpoint intervals while stealth performance remains statistically indistinguishable. These results motivate the inclusion of adaptive adversary baselines in quantum cryptographic security evaluations.
- Abstract(参考訳): BB84量子鍵分布は、あらゆる盗聴器が統計的に検出可能な方法でチャネルを乱すという物理的保証から、そのセキュリティを導出する。
以前の研究は、Eve攻撃を固定的で分析的に最適化された速度で仮定することで、これを評価した。
学習エージェントとしてEveをモデル化した場合に何が起こるかを検討する。
古典的な強化学習、特に表形式のQ-Learning、SARSA、ダブルQ-Learningは、適応的なBB84eavesdroppingに使用される。
これは攻撃者の決定をマルコフ決定プロセスとして定式化し、エージェントは量子ビットエラー率(QBER)のフィードバックを観察し、クォービット単位で、インターセプトするかパスするかを決定する。
実験は3つのチャネルノイズレベル(μ_{ch}\in\{1\%,3\%,5\%\}$)にまたがって行われ、独立した5つのランダムシード(条件毎に45のトレーニングを実行し、それぞれ10,000回)で検証される。
最高の非適応分析ベースラインに対して、Q-Learningは99.4\%$から0.28\%\pm0.27\%$ at $μ_{ch}=1\%$まで検出を減らし、1回あたり約10.5ビットの正しいビットを抽出する。
これは統計的に重要な355倍の還元である(p=0.020$, Mann-Whitney $U$ test)。
また, エージェントが単独で最終ブロックで攻撃率を急上昇させることで, 終局バーストの自然発生を報告した。
このエクスプロイトはランダム化されたチェックポイント間隔で消滅するが、ステルス性能は統計的に区別できない。
これらの結果は、量子暗号セキュリティ評価における適応的逆ベースラインの導入を動機付けている。
関連論文リスト
- Bernoulli CUSUM and Bayes-Optimal Detection Ceilings for Trust Fraud in Sparse Rating Networks [0.0]
レーティングネットワークにおける逐次信頼検出は、実データで失敗する連続観測モデルに依存する。
Bitcoin-OTCでは、評価の56%が標準マッピングの下で単一の値を取り、パラメトリック検出器が要求する分散仮定を破っている。
論文 参考訳(メタデータ) (2026-06-03T16:56:15Z) - Selective Test-Time Compute Scaling for Click-Through Rate Prediction via Uncertainty-Triggered Feature Path Exploration [9.542597285477683]
テスト時間計算のスケーリングは言語モデルに非常に効果的であることが証明されているが、この機会は産業用クリックスルーレート(CTR)予測では探索されていない。
UTTSI(Uncertainty-Triggered Test-Time Selective Inference)は、トレーニング不要なモデルに依存しないフレームワークで、推論深度をインスタンスごとの不確実性に比例して拡張する。
論文 参考訳(メタデータ) (2026-05-24T10:29:10Z) - Blind Catalytic Quantum Error Correction: Target-State Estimation and Fidelity Recovery Without \textit{A Priori} Knowledge [0.0]
触媒回収前にノイズ出力のみから目標を推定するEmphblind CQECを導入する。
5つの評価方法が3つのノイズモデルに対してベンチマークされる。
論文 参考訳(メタデータ) (2026-04-13T08:27:08Z) - Spectral Sentinel: Scalable Byzantine-Robust Decentralized Federated Learning via Sketched Random Matrix Theory on Blockchain [0.0]
ビザンチンのクライアントは、不均一な(Non-IID)データの下での濃度勾配を中毒する。
本稿では,ビザンチン検出・集約フレームワークであるSpectral Sentinelを提案する。
Polygonネットワーク上でブロックチェーンを統合することで,完全なシステムを実現しています。
論文 参考訳(メタデータ) (2025-12-14T09:43:03Z) - Assimilation Matters: Model-level Backdoor Detection in Vision-Language Pretrained Models [71.44858461725893]
信頼できない第三者によって微調整されたモデルを考えると、モデルがバックドアで注入されたかどうかが重要で難しい問題である。
既存の検出方法は通常、トレーニングデータセット、バックドアトリガー、ターゲットの事前知識に依存する。
このような事前知識を伴わずに動作する新しいモデルレベルの検出フレームワークであるAssimilation Matters in DETection (AMDET)を紹介する。
論文 参考訳(メタデータ) (2025-11-29T06:20:00Z) - Uncertainty is Fragile: Manipulating Uncertainty in Large Language Models [79.76293901420146]
大規模言語モデル(LLM)は、出力の信頼性が不可欠である様々な高い領域で採用されている。
本研究では,不確実性推定の脆弱性を調査し,攻撃の可能性を探る。
攻撃者がLSMにバックドアを埋め込むことができ、入力中の特定のトリガーによって起動されると、最終的な出力に影響を与えることなくモデルの不確実性を操作できることを示す。
論文 参考訳(メタデータ) (2024-07-15T23:41:11Z) - Getting a-Round Guarantees: Floating-Point Attacks on Certified Robustness [19.380453459873298]
敵の例は、わずかな入力摂動によって機械学習分類器の決定を変更できるため、セキュリティリスクを引き起こす。
これらの保証は、ラウンドエラーを引き起こす浮動小数点表現の制限により無効化可能であることを示す。
この攻撃は、正確な認証保証を持つ線形分類器や、保守的な認証を持つニューラルネットワークに対して実行可能であることを示す。
論文 参考訳(メタデータ) (2022-05-20T13:07:36Z) - Deep learning for gravitational-wave data analysis: A resampling
white-box approach [62.997667081978825]
我々は、LIGO検出器からの単一干渉計データを用いて、畳み込みニューラルネットワーク(CNN)を用いて、コンパクトなバイナリコレッセンスにおける重力波(GW)信号を検出する。
CNNはノイズを検出するのに非常に正確だが、GW信号のリコールに十分な感度がないため、CNNはGWトリガの生成よりもノイズ低減に適している。
論文 参考訳(メタデータ) (2020-09-09T03:28:57Z) - Detection as Regression: Certified Object Detection by Median Smoothing [50.89591634725045]
この研究は、ランダム化平滑化による認定分類の最近の進歩によって動機付けられている。
我々は、$ell$-bounded攻撃に対するオブジェクト検出のための、最初のモデル非依存、トレーニング不要、認定された防御条件を得る。
論文 参考訳(メタデータ) (2020-07-07T18:40:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。