論文の概要: Quantum Decision Transformers (QDT): Synergistic Entanglement and Interference for Offline Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2512.14726v1
- Date: Tue, 09 Dec 2025 16:47:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.692589
- Title: Quantum Decision Transformers (QDT): Synergistic Entanglement and Interference for Offline Reinforcement Learning
- Title(参考訳): 量子決定変換器(QDT):オフライン強化学習のための相乗的絡み合いと干渉
- Authors: Abraham Itzhak Weinberg,
- Abstract要約: 本稿では、量子インスパイアされた計算機構を取り入れた新しいアーキテクチャである量子決定変換器(QDT)を紹介する。
提案手法は,非局所的特徴相関をキャプチャする絡み込み操作による量子刺激注意と,マルチパス処理による量子フィードフォワードネットワークと,適応計算のための学習可能な干渉の2つのコアコンポーネントを統合する。
- 参考スコア(独自算出の注目度): 0.2538209532048867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Offline reinforcement learning enables policy learning from pre-collected datasets without environment interaction, but existing Decision Transformer (DT) architectures struggle with long-horizon credit assignment and complex state-action dependencies. We introduce the Quantum Decision Transformer (QDT), a novel architecture incorporating quantum-inspired computational mechanisms to address these challenges. Our approach integrates two core components: Quantum-Inspired Attention with entanglement operations that capture non-local feature correlations, and Quantum Feedforward Networks with multi-path processing and learnable interference for adaptive computation. Through comprehensive experiments on continuous control tasks, we demonstrate over 2,000\% performance improvement compared to standard DTs, with superior generalization across varying data qualities. Critically, our ablation studies reveal strong synergistic effects between quantum-inspired components: neither alone achieves competitive performance, yet their combination produces dramatic improvements far exceeding individual contributions. This synergy demonstrates that effective quantum-inspired architecture design requires holistic co-design of interdependent mechanisms rather than modular component adoption. Our analysis identifies three key computational advantages: enhanced credit assignment through non-local correlations, implicit ensemble behavior via parallel processing, and adaptive resource allocation through learnable interference. These findings establish quantum-inspired design principles as a promising direction for advancing transformer architectures in sequential decision-making, with implications extending beyond reinforcement learning to neural architecture design more broadly.
- Abstract(参考訳): オフライン強化学習は、環境相互作用のない事前コンパイルデータセットからのポリシ学習を可能にするが、既存のDecision Transformer(DT)アーキテクチャは、長期クレジットの割り当てと複雑な状態-アクションの依存関係に苦労する。
本稿では量子決定変換器(Quantum Decision Transformer, QDT)を紹介する。
提案手法は,非局所的特徴相関をキャプチャする絡み込み操作による量子刺激注意と,マルチパス処理による量子フィードフォワードネットワークと,適応計算のための学習可能な干渉の2つのコアコンポーネントを統合する。
連続制御タスクに関する総合的な実験を通じて、標準的なDTと比べて2000倍以上の性能向上を示し、データ品質の多様さに優れた一般化を示す。
私たちのアブレーション研究は、量子にインスパイアされたコンポーネント間の強力な相乗効果を示しています。
このシナジーは、効果的な量子インスパイアされたアーキテクチャ設計には、モジュラーコンポーネントの採用よりも、相互依存機構の全体的共設計が必要であることを証明している。
本分析では,非局所的相関による信用割当の強化,並列処理による暗黙のアンサンブル動作,学習可能な干渉による適応的資源割当の3つの重要な計算上の利点を明らかにした。
これらの知見は、量子にインスパイアされた設計原則を、シーケンシャルな意思決定においてトランスフォーマーアーキテクチャを前進させる有望な方向として確立し、強化学習からニューラルアーキテクチャ設計まで幅広い意味を持つ。
関連論文リスト
- Reinforcement Learning for Quantum Network Control with Application-Driven Objectives [53.03367590211247]
動的プログラミングと強化学習は、制御戦略を最適化するための有望なツールを提供する。
非線形で微分可能な目的関数を直接最適化する新しいRLフレームワークを提案する。
我々の研究は、RLを持つ量子ネットワークにおける非線形目的関数最適化への第一歩であり、より高度なユースケースへの道を開く。
論文 参考訳(メタデータ) (2025-09-12T18:41:10Z) - Quantum Graph Attention Network: A Novel Quantum Multi-Head Attention Mechanism for Graph Learning [0.0]
量子グラフ注意ネットワーク(Quantum Graph Attention Network、QGAT)は、変動量子回路をアテンション機構に統合するハイブリッドグラフニューラルネットワークである。
複雑な構造的依存関係を捕捉するQGATの有効性を示し、帰納的シナリオにおける一般化を改善した。
実験により、量子埋め込みは特徴や構造的ノイズに対するロバスト性を高め、実世界のノイズデータを扱う利点を示唆している。
論文 参考訳(メタデータ) (2025-08-25T03:25:48Z) - End-to-End Analysis of Charge Stability Diagrams with Transformers [0.7570270968488804]
トランスフォーマーモデルとエンドツーエンドの学習フレームワークは、人工知能の分野に急速に革命をもたらしている。
本研究では,半導体量子ドットアレイの電荷安定性図を解析するために物体検出変換器を適用する。
3つの異なるスピン量子ビットアーキテクチャの性能において、畳み込みニューラルネットワークを上回っていることを示す。
論文 参考訳(メタデータ) (2025-08-21T16:54:22Z) - Stackelberg Coupling of Online Representation Learning and Reinforcement Learning [45.70357546589222]
SCORERは,表現とQラーニングを階層型ゲームにおける2つの戦略エージェントとみなす,価値に基づくRLのためのフレームワークである。
提案するSCORERフレームワークは, 2時間スケールのアルゴリズムで解を近似する二段階最適化問題に導かれる。
論文 参考訳(メタデータ) (2025-08-10T18:36:54Z) - UDiTQC: U-Net-Style Diffusion Transformer for Quantum Circuit Synthesis [13.380226276791818]
現在の拡散モデルは、U-Netアーキテクチャに基づくアプローチであるが、計算効率とグローバルコンテキストのモデル化に関する課題に遭遇する。
マルチスケール特徴抽出におけるU-Netの強みとグローバルコンテキストをモデル化するTransformerの機能を組み合わせた,新しいU-Netスタイルの拡散変換アーキテクチャであるUDiTを提案する。
論文 参考訳(メタデータ) (2025-01-24T15:15:50Z) - Variational Quantum Circuit Decoupling [1.0445957451908694]
システムを独立して進化するコンポーネントに分離するには、一見複雑なシステムを単純化する長い歴史がある。
本手法は量子回路合成に応用し、ターゲットユニタリダイナミクスの量子回路実装を発見する。
論文 参考訳(メタデータ) (2024-06-09T03:01:50Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。