論文の概要: Learning to stabilize nonequilibrium phases of matter with active feedback using partial information
- arxiv url: http://arxiv.org/abs/2508.06612v1
- Date: Fri, 08 Aug 2025 18:00:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.469718
- Title: Learning to stabilize nonequilibrium phases of matter with active feedback using partial information
- Title(参考訳): 部分情報を用いたアクティブフィードバックによる物質の非平衡位相の安定化学習
- Authors: Giovanni Cemin, Markus Schmitt, Marin Bukov,
- Abstract要約: 強化学習を用いた量子多体系の能動的フィードバック制御における情報の役割について検討する。
我々は,最大128量子ビットの(1+1)次元安定化回路における絡み合いを防止するために,部分状態情報を用いた強化学習エージェントを訓練する。
臨界情報しきい値を超えると、学習された準最適戦略は非グレードであり、量子ビットであり、容積法則の絡み合った定常状態を領域法則のスケーリングに還元する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate the role of information in active feedback control of quantum many-body systems using reinforcement learning. Active feedback breaks detailed balance, enabling the engineering of steady states and dynamical phases of matter otherwise inaccessible in equilibrium. We train reinforcement learning agents using partial state information to prevent entanglement spreading in (1+1)-dimensional stabilizer circuits with up to 128 qubits. We find that, above a critical information threshold, learned near-optimal strategies are non-greedy, stochastic, and reduce volume-law entangled steady states to area-law scaling. The agents achieve this by placing a series of bottlenecks that induce pyramidal structures in the long-time spatial entanglement distribution, which effectively split the system and reduce the maximum accessible entanglement. Crucially, learned strategies are inherently out of equilibrium and require real-time active feedback; we find that the learned behavior cannot be replaced by simple human-designed control rules. This work establishes the foundations for classically implemented, information-driven individual control of many interacting quantum degrees of freedom, demonstrating the capabilities of reinforcement learning to stabilize and uncover novel critical properties of many-body nonequilibrium steady states.
- Abstract(参考訳): 強化学習を用いた量子多体系の能動的フィードバック制御における情報の役割について検討する。
アクティブフィードバックは詳細なバランスを破り、定常状態の工学と、それ以外は平衡で到達不能な物質の動的相の工学を可能にする。
我々は,最大128量子ビットの(1+1)次元安定化回路における絡み合いを防止するために,部分状態情報を用いた強化学習エージェントを訓練する。
臨界情報しきい値を超えると、学習された準最適戦略は非グレードであり、確率的であり、容積法則が拘束された定常状態を領域法則スケーリングに還元することがわかった。
エージェントは、時間空間の絡み合い分布にピラミッド構造を誘導する一連のボトルネックを配置し、システムを効果的に分割し、最大限の絡み合いを低減する。
重要なことは、学習戦略は本質的に平衡から外れており、リアルタイムにアクティブなフィードバックを必要とする。
この研究は、古典的に実装され、多くの相互作用する量子自由度の情報駆動的個別制御の基礎を確立し、多体非平衡定常状態の新たな臨界特性を安定化し発見する強化学習の能力を実証する。
関連論文リスト
- SplitLoRA: Balancing Stability and Plasticity in Continual Learning Through Gradient Space Splitting [68.00007494819798]
継続的な学習には、安定性を保ちながら複数のタスクを連続的に学習するモデルが必要である。
グラディエント・プロジェクションはCLにおいて有効で一般的なパラダイムとして現れ、以前に学習したタスクの勾配空間を2つの部分空間に分割する。
新しいタスクは小部分空間内で効果的に学習され、これにより以前取得した知識との干渉が軽減される。
既存の勾配射影法は、勾配空間を適切に分割することが困難であるため、塑性と安定性の最適なバランスを達成するのに苦労する。
論文 参考訳(メタデータ) (2025-05-28T13:57:56Z) - Learning Stabilizing Policies via an Unstable Subspace Representation [0.0]
本研究では,線形時間不変系(LTI)を安定化させる学習の課題について検討する。
本稿では,まずシステムの左不安定部分空間を学習する二相アプローチを提案する。
不安定な部分空間上での操作がサンプルの複雑さを減少させることを示す。
論文 参考訳(メタデータ) (2025-05-02T15:34:36Z) - Doped stabilizer states in many-body physics and where to find them [0.0]
この研究は、ドープ安定化状態と多体量子系における固有状態の構造の基本的な関係を明らかにする。
我々は,低エネルギー固有状態の探索,クエンチダイナミクスのシミュレーション,およびこれらのシステムにおけるエンタングルメントエントロピーの計算といったタスクに対して,効率的な古典的アルゴリズムを開発する。
論文 参考訳(メタデータ) (2024-03-22T02:21:48Z) - The least-control principle for learning at equilibrium [65.2998274413952]
我々は、平衡反復ニューラルネットワーク、深層平衡モデル、メタラーニングを学ぶための新しい原理を提案する。
私たちの結果は、脳がどのように学習するかを明らかにし、幅広い機械学習問題にアプローチする新しい方法を提供します。
論文 参考訳(メタデータ) (2022-07-04T11:27:08Z) - Efficient Empowerment Estimation for Unsupervised Stabilization [75.32013242448151]
エンパワーメント原理は 直立位置での 力学系の教師なし安定化を可能にする
本稿では,ガウスチャネルとして動的システムのトレーニング可能な表現に基づく代替解を提案する。
提案手法は, サンプルの複雑さが低く, 訓練時より安定であり, エンパワーメント機能の本質的特性を有し, 画像からエンパワーメントを推定できることを示す。
論文 参考訳(メタデータ) (2020-07-14T21:10:16Z) - Understanding the Role of Training Regimes in Continual Learning [51.32945003239048]
破滅的な忘れは、ニューラルネットワークのトレーニングに影響を与え、複数のタスクを逐次学習する能力を制限する。
本研究では,タスクの局所的なミニマを拡大するトレーニング体制の形成に及ぼすドロップアウト,学習速度の低下,バッチサイズの影響について検討した。
論文 参考訳(メタデータ) (2020-06-12T06:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。