論文の概要: Quantum bandit with amplitude amplification exploration in an
adversarial environment
- arxiv url: http://arxiv.org/abs/2208.07144v2
- Date: Sat, 20 May 2023 18:57:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 05:55:28.403740
- Title: Quantum bandit with amplitude amplification exploration in an
adversarial environment
- Title(参考訳): 対向環境における振幅増幅探査による量子バンド
- Authors: Byungjin Cho, Yu Xiao, Pan Hui, and Daoyi Dong
- Abstract要約: 本稿では,学習適応型オフロード問題に対する量子インスパイアされた帯域幅学習手法を提案する。
量子理論における振幅増幅と崩壊によって引き起こされる新しい行動更新戦略と新しい確率的行動選択が採用されている。
提案アルゴリズムは、設計したマッピングにより、好ましくない動作に対する学習重量調整を改善するために一般化される。
- 参考スコア(独自算出の注目度): 9.563657204041682
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid proliferation of learning systems in an arbitrarily changing
environment mandates the need for managing tensions between exploration and
exploitation. This work proposes a quantum-inspired bandit learning approach
for the learning-and-adapting-based offloading problem where a client observes
and learns the costs of each task offloaded to the candidate resource
providers, e.g., fog nodes. In this approach, a new action update strategy and
novel probabilistic action selection are adopted, provoked by the amplitude
amplification and collapse postulate in quantum computation theory,
respectively. We devise a locally linear mapping between a quantum-mechanical
phase in a quantum domain, e.g., Grover-type search algorithm, and a distilled
probability-magnitude in a value-based decision-making domain, e.g.,
adversarial multi-armed bandit algorithm. The proposed algorithm is
generalized, via the devised mapping, for better learning weight adjustments on
favourable/unfavourable actions and its effectiveness is verified via
simulation.
- Abstract(参考訳): 任意に変化する環境における学習システムの急速な増殖は、探索と搾取の間の緊張を管理しなければならない。
本研究は,学習適応型オフロード問題に対する量子インスパイアされた帯域幅学習手法を提案する。これはクライアントが観測し,候補リソースプロバイダ(例えばフォグノード)にオフロードされる各タスクのコストを学習する。
本手法では, 量子計算理論において, 振幅増幅と崩壊仮定によって誘発される新しい動作更新戦略と新しい確率的動作選択を採用する。
本稿では,量子領域における量子力学的位相(グローバー型探索アルゴリズムなど)と,値に基づく意思決定領域(例えば逆多腕バンディットアルゴリズム)における蒸留確率マグニチュードとの局所線形マッピングを考案する。
提案アルゴリズムは,提案したマッピングを用いて,好ましくない動作に対する学習重量調整を改良し,その効果をシミュレーションにより検証する。
関連論文リスト
- A Novel Quantum Algorithm for Efficient Attractor Search in Gene Regulatory Networks [0.0978224644130106]
我々はGroverのアルゴリズムにインスパイアされた新しい量子探索アルゴリズムを量子コンピューティングプラットフォームに実装する。
このアルゴリズムは、一様重ね合わせから以前に発見された引き金の盆地に属する状態を反復的に抑制する。
ノイズに対する耐性試験は、現在のノイズ中間スケール量子コンピューティング(NISQ)時代のデバイスでも有望な性能を示している。
論文 参考訳(メタデータ) (2024-08-16T15:48:45Z) - Latent Exploration for Reinforcement Learning [87.42776741119653]
強化学習では、エージェントは環境を探索し、相互作用することでポリシーを学ぶ。
LATent TIme-Correlated Exploration (Lattice)を提案する。
論文 参考訳(メタデータ) (2023-05-31T17:40:43Z) - Optimal fidelity in implementing Grover's search algorithm on open
quantum system [0.0]
本稿では,Groverの探索アルゴリズムの完全性について,オープン量子システムに実装することで検討する。
最近報告された変動制御量子マスター方程式(FRQME)を用いたシステム力学に対する環境効果を含む。
忠実度は、駆動誘起散逸項と緩和項の両方に依存することがわかった。
論文 参考訳(メタデータ) (2023-03-03T07:48:26Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Bandit approach to conflict-free multi-agent Q-learning in view of
photonic implementation [0.0]
従来の研究では、光子の量子干渉を使って競合する多重武装バンディットの問題を解決してきた。
本研究は,より汎用的なマルチエージェント強化学習への従来のアプローチを拡張した。
成功したフォトニック強化学習方式は、学習の質に寄与するフォトニックシステムと適切なアルゴリズムの両方を必要とする。
論文 参考訳(メタデータ) (2022-12-20T00:27:29Z) - Exploring the role of parameters in variational quantum algorithms [59.20947681019466]
動的リー代数の階数を用いた変分量子回路のキャラクタリゼーションのための量子制御に着想を得た手法を提案する。
有望な接続は、リーランク、計算されたエネルギーの精度、および所定の回路アーキテクチャを介して目標状態を達成するために必要な深さとの間のものである。
論文 参考訳(メタデータ) (2022-09-28T20:24:53Z) - Optimal quantum control via genetic algorithms for quantum state
engineering in driven-resonator mediated networks [68.8204255655161]
進化的アルゴリズムに基づく量子状態工学には、機械学習によるアプローチを採用しています。
我々は、単一のモード駆動マイクロ波共振器を介して相互作用する、量子ビットのネットワーク(直接結合のない人工原子の状態に符号化された)を考える。
アルゴリズムは理想的なノイズフリー設定で訓練されているにもかかわらず、高い量子忠実度とノイズに対するレジリエンスを観測する。
論文 参考訳(メタデータ) (2022-06-29T14:34:00Z) - Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。
前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。
提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文 参考訳(メタデータ) (2022-05-13T21:09:41Z) - Grover search revisited; application to image pattern matching [0.8367938108534343]
本稿では,Groverデータベース全体の探索やパターンマッチングを行う量子アルゴリズムを提案する。
鍵となる考え方は、最近提案された近似振幅符号化法を浅い量子回路で使用することである。
論文 参考訳(メタデータ) (2021-08-24T17:30:41Z) - Noise-Robust End-to-End Quantum Control using Deep Autoregressive Policy
Networks [2.5946789143276447]
変分量子固有解法は、量子コンピューティングデバイスの使用を可能にするため、近年注目を集めている。
不確実性のある方法で連続的および離散的な自由度を同時に最適化できるハイブリッドポリシグラデーショングラデーションアルゴリズムを提案する。
我々の研究は、強化学習と量子制御の相乗効果を示す。
論文 参考訳(メタデータ) (2020-12-12T02:13:28Z) - A black-box adversarial attack for poisoning clustering [78.19784577498031]
本稿では,クラスタリングアルゴリズムのロバスト性をテストするために,ブラックボックス対逆攻撃法を提案する。
我々の攻撃は、SVM、ランダムフォレスト、ニューラルネットワークなどの教師付きアルゴリズムに対しても転送可能であることを示す。
論文 参考訳(メタデータ) (2020-09-09T18:19:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。