論文の概要: Quantum Decision Transformers (QDT): Synergistic Entanglement and Interference for Offline Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2512.14726v1
- Date: Tue, 09 Dec 2025 16:47:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.692589
- Title: Quantum Decision Transformers (QDT): Synergistic Entanglement and Interference for Offline Reinforcement Learning
- Title(参考訳): 量子決定変換器(QDT):オフライン強化学習のための相乗的絡み合いと干渉
- Authors: Abraham Itzhak Weinberg,
- Abstract要約: 本稿では、量子インスパイアされた計算機構を取り入れた新しいアーキテクチャである量子決定変換器(QDT)を紹介する。
提案手法は,非局所的特徴相関をキャプチャする絡み込み操作による量子刺激注意と,マルチパス処理による量子フィードフォワードネットワークと,適応計算のための学習可能な干渉の2つのコアコンポーネントを統合する。
- 参考スコア(独自算出の注目度): 0.2538209532048867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Offline reinforcement learning enables policy learning from pre-collected datasets without environment interaction, but existing Decision Transformer (DT) architectures struggle with long-horizon credit assignment and complex state-action dependencies. We introduce the Quantum Decision Transformer (QDT), a novel architecture incorporating quantum-inspired computational mechanisms to address these challenges. Our approach integrates two core components: Quantum-Inspired Attention with entanglement operations that capture non-local feature correlations, and Quantum Feedforward Networks with multi-path processing and learnable interference for adaptive computation. Through comprehensive experiments on continuous control tasks, we demonstrate over 2,000\% performance improvement compared to standard DTs, with superior generalization across varying data qualities. Critically, our ablation studies reveal strong synergistic effects between quantum-inspired components: neither alone achieves competitive performance, yet their combination produces dramatic improvements far exceeding individual contributions. This synergy demonstrates that effective quantum-inspired architecture design requires holistic co-design of interdependent mechanisms rather than modular component adoption. Our analysis identifies three key computational advantages: enhanced credit assignment through non-local correlations, implicit ensemble behavior via parallel processing, and adaptive resource allocation through learnable interference. These findings establish quantum-inspired design principles as a promising direction for advancing transformer architectures in sequential decision-making, with implications extending beyond reinforcement learning to neural architecture design more broadly.
- Abstract(参考訳): オフライン強化学習は、環境相互作用のない事前コンパイルデータセットからのポリシ学習を可能にするが、既存のDecision Transformer(DT)アーキテクチャは、長期クレジットの割り当てと複雑な状態-アクションの依存関係に苦労する。
本稿では量子決定変換器(Quantum Decision Transformer, QDT)を紹介する。
提案手法は,非局所的特徴相関をキャプチャする絡み込み操作による量子刺激注意と,マルチパス処理による量子フィードフォワードネットワークと,適応計算のための学習可能な干渉の2つのコアコンポーネントを統合する。
連続制御タスクに関する総合的な実験を通じて、標準的なDTと比べて2000倍以上の性能向上を示し、データ品質の多様さに優れた一般化を示す。
私たちのアブレーション研究は、量子にインスパイアされたコンポーネント間の強力な相乗効果を示しています。
このシナジーは、効果的な量子インスパイアされたアーキテクチャ設計には、モジュラーコンポーネントの採用よりも、相互依存機構の全体的共設計が必要であることを証明している。
本分析では,非局所的相関による信用割当の強化,並列処理による暗黙のアンサンブル動作,学習可能な干渉による適応的資源割当の3つの重要な計算上の利点を明らかにした。
これらの知見は、量子にインスパイアされた設計原則を、シーケンシャルな意思決定においてトランスフォーマーアーキテクチャを前進させる有望な方向として確立し、強化学習からニューラルアーキテクチャ設計まで幅広い意味を持つ。
関連論文リスト
- Quantum LEGO Learning: A Modular Design Principle for Hybrid Artificial Intelligence [63.39968536637762]
古典的および量子的コンポーネントを再利用可能で構成可能な学習ブロックとして扱う学習フレームワークであるQuantum LEGO Learningを紹介します。
このフレームワーク内では、トレーニング済みの古典的ニューラルネットワークがフリーズ機能ブロックとして機能し、VQCはトレーニング可能な適応モジュールとして機能する。
我々は,学習誤差を近似と推定成分に分解するブロックワイズ一般化理論を開発した。
論文 参考訳(メタデータ) (2026-01-29T14:29:21Z) - Benchmarking Quantum Data Center Architectures: A Performance and Scalability Perspective [13.628992375229247]
本研究では、分散量子回路実行遅延、リソース競合、スケーラビリティに対する4つの代表的な量子データセンターアーキテクチャの影響について検討する。
この結果から,分散量子性能はトポロジ,スケジューリングポリシ,物理層パラメータによって共同で形成されていることが明らかとなった。
論文 参考訳(メタデータ) (2026-01-04T03:48:02Z) - Rethinking the Role of Dynamic Sparse Training for Scalable Deep Reinforcement Learning [58.533203990515034]
ニューラルネットワークのスケーリングは機械学習における画期的な進歩をもたらしたが、このパラダイムは深層強化学習(DRL)では失敗している。
我々は、動的スパーストレーニング戦略が、アーキテクチャの改善によって確立された主要なスケーラビリティ基盤を補完するモジュール固有の利点を提供することを示す。
アーキテクチャ改善の利点を生かした実践的なフレームワークであるModule-Specific Training (MST) にこれらの知見を精査し、アルゴリズムの修正なしに様々なRLアルゴリズムをまたいだ大幅なスケーラビリティ向上を示す。
論文 参考訳(メタデータ) (2025-10-14T03:03:08Z) - Reinforcement Learning for Quantum Network Control with Application-Driven Objectives [53.03367590211247]
動的プログラミングと強化学習は、制御戦略を最適化するための有望なツールを提供する。
非線形で微分可能な目的関数を直接最適化する新しいRLフレームワークを提案する。
我々の研究は、RLを持つ量子ネットワークにおける非線形目的関数最適化への第一歩であり、より高度なユースケースへの道を開く。
論文 参考訳(メタデータ) (2025-09-12T18:41:10Z) - Quantum Graph Attention Network: A Novel Quantum Multi-Head Attention Mechanism for Graph Learning [0.0]
量子グラフ注意ネットワーク(Quantum Graph Attention Network、QGAT)は、変動量子回路をアテンション機構に統合するハイブリッドグラフニューラルネットワークである。
複雑な構造的依存関係を捕捉するQGATの有効性を示し、帰納的シナリオにおける一般化を改善した。
実験により、量子埋め込みは特徴や構造的ノイズに対するロバスト性を高め、実世界のノイズデータを扱う利点を示唆している。
論文 参考訳(メタデータ) (2025-08-25T03:25:48Z) - End-to-End Analysis of Charge Stability Diagrams with Transformers [0.7570270968488804]
トランスフォーマーモデルとエンドツーエンドの学習フレームワークは、人工知能の分野に急速に革命をもたらしている。
本研究では,半導体量子ドットアレイの電荷安定性図を解析するために物体検出変換器を適用する。
3つの異なるスピン量子ビットアーキテクチャの性能において、畳み込みニューラルネットワークを上回っていることを示す。
論文 参考訳(メタデータ) (2025-08-21T16:54:22Z) - Stackelberg Coupling of Online Representation Learning and Reinforcement Learning [45.70357546589222]
SCORERは,表現とQラーニングを階層型ゲームにおける2つの戦略エージェントとみなす,価値に基づくRLのためのフレームワークである。
提案するSCORERフレームワークは, 2時間スケールのアルゴリズムで解を近似する二段階最適化問題に導かれる。
論文 参考訳(メタデータ) (2025-08-10T18:36:54Z) - A Survey of Quantum Transformers: Architectures, Challenges and Outlooks [82.4736481748099]
量子変換器は古典変換器の表現力と量子コンピューティングの計算上の利点を統合する。
2022年以降、この地域の研究は急速に拡大し、様々な技術パラダイムや初期の応用がもたらされた。
本稿では,量子トランスモデルの包括的,体系的,詳細な調査を行う。
論文 参考訳(メタデータ) (2025-04-04T05:40:18Z) - UDiTQC: U-Net-Style Diffusion Transformer for Quantum Circuit Synthesis [13.380226276791818]
現在の拡散モデルは、U-Netアーキテクチャに基づくアプローチであるが、計算効率とグローバルコンテキストのモデル化に関する課題に遭遇する。
マルチスケール特徴抽出におけるU-Netの強みとグローバルコンテキストをモデル化するTransformerの機能を組み合わせた,新しいU-Netスタイルの拡散変換アーキテクチャであるUDiTを提案する。
論文 参考訳(メタデータ) (2025-01-24T15:15:50Z) - Variational Quantum Circuit Decoupling [1.0445957451908694]
システムを独立して進化するコンポーネントに分離するには、一見複雑なシステムを単純化する長い歴史がある。
本手法は量子回路合成に応用し、ターゲットユニタリダイナミクスの量子回路実装を発見する。
論文 参考訳(メタデータ) (2024-06-09T03:01:50Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Realization of arbitrary doubly-controlled quantum phase gates [62.997667081978825]
本稿では,最適化問題における短期量子優位性の提案に着想を得た高忠実度ゲートセットを提案する。
3つのトランペット四重項のコヒーレントな多レベル制御を編成することにより、自然な3量子ビット計算ベースで作用する決定論的連続角量子位相ゲートの族を合成する。
論文 参考訳(メタデータ) (2021-08-03T17:49:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。