論文の概要: Automated Gadget Discovery in Science
- arxiv url: http://arxiv.org/abs/2212.12743v1
- Date: Sat, 24 Dec 2022 14:52:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 14:07:33.039016
- Title: Automated Gadget Discovery in Science
- Title(参考訳): 科学におけるガジェット発見の自動化
- Authors: Lea M. Trenkwalder, Andrea L\'opez Incera, Hendrik Poulsen Nautrup,
Fulvio Flamini, Hans J. Briegel
- Abstract要約: シークエンスマイニングとクラスタリングに基づくポストホック解析により,RLエージェントの学習行動に関する洞察を得る。
具体的には、与えられたタスクを解くためにエージェントが使用する頻繁でコンパクトなサブルーチンを、ガジェットとして蒸留し、様々なメトリクスでグループ化する。
学習エージェントのポリシーを分析するこのアプローチはエージェントと環境非依存であり、エージェントのポリシーに関する興味深い洞察を与えることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, reinforcement learning (RL) has become increasingly
successful in its application to science and the process of scientific
discovery in general. However, while RL algorithms learn to solve increasingly
complex problems, interpreting the solutions they provide becomes ever more
challenging. In this work, we gain insights into an RL agent's learned behavior
through a post-hoc analysis based on sequence mining and clustering.
Specifically, frequent and compact subroutines, used by the agent to solve a
given task, are distilled as gadgets and then grouped by various metrics. This
process of gadget discovery develops in three stages: First, we use an RL agent
to generate data, then, we employ a mining algorithm to extract gadgets and
finally, the obtained gadgets are grouped by a density-based clustering
algorithm. We demonstrate our method by applying it to two quantum-inspired RL
environments. First, we consider simulated quantum optics experiments for the
design of high-dimensional multipartite entangled states where the algorithm
finds gadgets that correspond to modern interferometer setups. Second, we
consider a circuit-based quantum computing environment where the algorithm
discovers various gadgets for quantum information processing, such as quantum
teleportation. This approach for analyzing the policy of a learned agent is
agent and environment agnostic and can yield interesting insights into any
agent's policy.
- Abstract(参考訳): 近年、強化学習(RL)は科学への応用や科学発見のプロセス全般において成功してきている。
しかし、RLアルゴリズムはますます複雑な問題を解くことを学習する一方で、それらが提供するソリューションを解釈することがさらに困難になる。
本研究では,時系列マイニングとクラスタリングに基づくポストホック解析により,RLエージェントの学習行動に関する洞察を得る。
具体的には、与えられたタスクを解くためにエージェントが使用する頻繁でコンパクトなサブルーチンを、ガジェットとして蒸留し、様々なメトリクスでグループ化する。
まず、RLエージェントを用いてデータを生成し、次に、マイニングアルゴリズムを用いてガジェットを抽出し、最後に、得られたガジェットを密度に基づくクラスタリングアルゴリズムでグループ化する。
2つの量子インスパイアされたRL環境に適用することで、本手法を実証する。
まず,現代の干渉計に対応するガジェットをアルゴリズムが発見する高次元多部交絡状態の設計のためのシミュレーション量子光学実験について考察する。
第2に、量子テレポーテーションなどの量子情報処理のための様々なガジェットをアルゴリズムが発見する回路ベースの量子コンピューティング環境を考える。
学習エージェントのポリシーを分析するこのアプローチはエージェントと環境非依存であり、エージェントのポリシーに関する興味深い洞察を与えることができる。
関連論文リスト
- From Easy to Hard: Tackling Quantum Problems with Learned Gadgets For Real Hardware [0.0]
強化学習は強力なアプローチであることが証明されているが、量子ビット上の可能な操作の空間の指数的スケーリングによって、多くの制限が残っている。
本稿では,合成ゲートを自動的に学習するアルゴリズム($gadgets$)を開発し,探索を容易にするための強化学習エージェントに追加のアクションとして追加する。
GRLでは,TFIMの基底状態を最大107ドルの折り畳みで推定する際の誤差を改善する,非常にコンパクトなPQCが見つかる。
論文 参考訳(メタデータ) (2024-10-31T22:02:32Z) - Hardware-efficient variational quantum algorithm in trapped-ion quantum computer [0.0]
本研究では, トラップイオン量子シミュレータ, HEA-TI に適したハードウェア効率の変動量子アルゴリズムアンサッツについて検討する。
我々は、全てのイオン間のプログラム可能な単一量子ビット回転と大域スピンスピン相互作用を活用し、従来のゲートベース手法における資源集約型2量子ビットゲートへの依存を減らす。
論文 参考訳(メタデータ) (2024-07-03T14:02:20Z) - Quantum Subroutine for Variance Estimation: Algorithmic Design and Applications [80.04533958880862]
量子コンピューティングは、アルゴリズムを設計する新しい方法の基礎となる。
どの場の量子スピードアップが達成できるかという新たな課題が生じる。
量子サブルーチンの設計は、従来のサブルーチンよりも効率的で、新しい強力な量子アルゴリズムに固い柱を向ける。
論文 参考訳(メタデータ) (2024-02-26T09:32:07Z) - Simultaneous Discovery of Quantum Error Correction Codes and Encoders with a Noise-Aware Reinforcement Learning Agent [0.0]
本研究は,QECコード発見における強化学習の能力を大幅に拡張するものである。
本稿では,所定のゲートセットに対して,QEC符号と符号化回路の両方を自動的に検出するRLエージェントを訓練する。
本稿では,様々なノイズモデルのための符号化戦略を同時に生成することを学ぶ,ノイズ対応メタエージェントの概念を紹介する。
論文 参考訳(メタデータ) (2023-11-08T15:19:16Z) - Multimodal deep representation learning for quantum cross-platform
verification [60.01590250213637]
初期の量子コンピューティングの領域において重要な取り組みであるクロスプラットフォーム検証は、同一のアルゴリズムを実行する2つの不完全な量子デバイスとの類似性を特徴づけようと試みている。
本稿では,この課題におけるデータの形式化が2つの異なるモダリティを具現化する,革新的なマルチモーダル学習手法を提案する。
我々はこれらのモダリティから知識を独立して抽出するマルチモーダルニューラルネットワークを考案し、続いて融合操作により包括的データ表現を生成する。
論文 参考訳(メタデータ) (2023-11-07T04:35:03Z) - Parametrized Complexity of Quantum Inspired Algorithms [0.0]
量子アルゴリズムの有望な領域は量子機械学習と量子最適化である。
近年の量子技術、特に量子ソフトウェアの発展により、研究と産業のコミュニティは量子アルゴリズムの新しい応用を見つけようとしている。
論文 参考訳(メタデータ) (2021-12-22T06:19:36Z) - Towards Multi-Agent Reinforcement Learning using Quantum Boltzmann
Machines [2.015864965523243]
我々は、より困難な問題を解決するために、オリジナルの概念の拡張を提案する。
我々は、経験的なリプレイバッファを追加し、ターゲットとポリシーの値を近似するために異なるネットワークを使用します。
量子サンプリングは、強化学習タスクには有望な方法であることが証明されているが、現在はQPUサイズによって制限されている。
論文 参考訳(メタデータ) (2021-09-22T17:59:24Z) - Quantum speedup for track reconstruction in particle accelerators [51.00143435208596]
我々は,各局所追跡法に存在する基本ルーチンを4つ同定し,標準追跡アルゴリズムの文脈でどのようにスケールするかを解析する。
発見された量子スピードアップは穏やかだが、これは私たちの知識の中でも最高のものであり、高エネルギーの物理データ処理タスクに対する量子上の優位性の最初の厳密な証拠である。
論文 参考訳(メタデータ) (2021-04-23T13:32:14Z) - Information Scrambling in Computationally Complex Quantum Circuits [56.22772134614514]
53量子ビット量子プロセッサにおける量子スクランブルのダイナミクスを実験的に検討する。
演算子の拡散は効率的な古典的モデルによって捉えられるが、演算子の絡み合いは指数関数的にスケールされた計算資源を必要とする。
論文 参考訳(メタデータ) (2021-01-21T22:18:49Z) - Discovering Reinforcement Learning Algorithms [53.72358280495428]
強化学習アルゴリズムは、いくつかのルールの1つに従ってエージェントのパラメータを更新する。
本稿では,更新ルール全体を検出するメタラーニング手法を提案する。
これには、一連の環境と対話することで、"何を予測するか"(例えば、値関数)と"どのように学習するか"の両方が含まれている。
論文 参考訳(メタデータ) (2020-07-17T07:38:39Z) - Quantum Geometric Machine Learning for Quantum Circuits and Control [78.50747042819503]
我々は、量子幾何学的制御問題に対するディープラーニングの適用をレビューし、拡張する。
量子回路合成問題における時間-最適制御の強化について述べる。
我々の研究結果は、時間-最適制御問題に対する機械学習と幾何学的手法を組み合わせた量子制御と量子情報理論の研究者にとって興味深いものである。
論文 参考訳(メタデータ) (2020-06-19T19:12:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。