論文の概要: How Quantum Agents Can Change Which Strategies Are More Complex
- arxiv url: http://arxiv.org/abs/2508.08092v1
- Date: Mon, 11 Aug 2025 15:32:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.174721
- Title: How Quantum Agents Can Change Which Strategies Are More Complex
- Title(参考訳): 量子エージェントがどの戦略をもっと複雑にするか
- Authors: Spiros Kechrimparis, Nix Barnett, Mile Gu, Hyukjoon Kwon,
- Abstract要約: 複雑性に関する結論は、エージェントが量子情報を処理して保存できるかどうかに依存する。
古典的エージェントは戦略Bよりも実行が複雑であるのに対して、量子エージェントは反対の結論に達することができる。
- 参考スコア(独自算出の注目度): 3.6141518756781514
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Whether winning blackjack or navigating busy streets, achieving desired outcomes requires agents to execute adaptive strategies, strategies where actions depend contextually on past events. In complexity science, this motivates memory as an operational quantifier of complexity: given two strategies, the more complex one demands the agent to track more about the past. Here, we show that conclusions about complexity fundamentally depend on whether agents can process and store quantum information. Thus, while classical agents might find Strategy A more complex to execute than Strategy B, quantum agents can reach the opposite conclusion. We derive sufficient conditions for such contradictory conclusions and illustrate the phenomenon across multiple scenarios. As a byproduct, our results yield an information-theoretic lower bound on the minimal memory required by any agent - classical or quantum - to execute a given strategy.
- Abstract(参考訳): ブラックジャックに勝つか、にぎやかな通りをナビゲートするか、望ましい結果を達成するには、エージェントが適応的な戦略を実行する必要がある。
複雑性科学において、これは複雑さの操作的定量化としてメモリを動機付けている。
ここでは、複雑性に関する結論は、エージェントが量子情報を処理して保存できるかどうかに大きく依存していることを示す。
したがって、古典的エージェントは戦略Bよりも実行が複雑であるのに対して、量子エージェントは反対の結論に達することができる。
このような矛盾した結論の十分な条件を導出し、複数のシナリオにまたがる現象を説明する。
副産物として、我々の結果は、与えられた戦略を実行するために、任意のエージェント(古典的または量子的)が必要とする最小限のメモリに情報理論の低い境界をもたらす。
関連論文リスト
- The Sample Complexity of Online Strategic Decision Making with Information Asymmetry and Knowledge Transportability [93.11220429350278]
情報非対称性はマルチエージェントシステムの普及した特徴である。
本論文は,オンライン学習における基本的課題について考察する。知識伝達を必要とする場合でも,共同設立者について学ぶために,非I.d.アクションを適用できるのか?
本稿では,情報非対称性下でのシステム力学を正確に同定し,強化学習における知識伝達の課題を効果的にナビゲートするために,サンプル効率のよいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-11T17:06:57Z) - Energetic advantages for quantum agents in online execution of complex strategies [0.0]
古典的エージェントが与えられた戦略を実行するための最小のエネルギーコストを導出する。
量子エージェントはこの散逸を古典的限界以下に抑えることができることを証明している。
論文 参考訳(メタデータ) (2025-03-25T17:55:03Z) - Paths to Equilibrium in Games [6.812247730094933]
我々は、強化学習におけるポリシー更新に触発されたペアワイズ制約を満たす戦略の列について研究する。
我々の分析は、戦略的な更新を劣化させる報酬が、満足のいく道に沿って均衡に進むための鍵である、という直感的な洞察を明らかにした。
論文 参考訳(メタデータ) (2024-03-26T19:58:39Z) - Fast Peer Adaptation with Context-aware Exploration [63.08444527039578]
マルチエージェントゲームにおける学習エージェントに対するピア識別報酬を提案する。
この報酬は、効果的な探索と迅速な適応のための文脈認識ポリシーを学ぶためのエージェントのモチベーションとなる。
我々は,競争力のある(クーンポーカー),協力的(PO-Overcooked),あるいは混合的(Predator-Prey-W)な(Pedator-Prey-W)ゲームを含む多種多様なテストベッドについて評価を行った。
論文 参考訳(メタデータ) (2024-02-04T13:02:27Z) - Taming Quantum Time Complexity [45.867051459785976]
時間複雑性の設定において、正確さと遠心性の両方を達成する方法を示します。
我々は、トランスデューサと呼ばれるものに基づく量子アルゴリズムの設計に新しいアプローチを採用する。
論文 参考訳(メタデータ) (2023-11-27T14:45:19Z) - Strategy Extraction in Single-Agent Games [0.19336815376402716]
本研究では,行動戦略を用いた知識伝達を,人間の認知能力に左右される伝達可能な知識の形式として提案する。
提案手法は,Pacman, Bank Heist, Dungeon-crawling(ダンジョンクローリングゲーム)の3つの環境において有効な戦略を同定できることを示す。
論文 参考訳(メタデータ) (2023-05-22T01:28:59Z) - Coach-assisted Multi-Agent Reinforcement Learning Framework for
Unexpected Crashed Agents [120.91291581594773]
本稿では,予期せぬクラッシュを伴う協調型マルチエージェント強化学習システムの公式な定式化について述べる。
本稿では,教師支援型多エージェント強化学習フレームワークを提案する。
私たちの知る限りでは、この研究はマルチエージェントシステムにおける予期せぬクラッシュを初めて研究したものです。
論文 参考訳(メタデータ) (2022-03-16T08:22:45Z) - Quantum adaptive agents with efficient long-term memories [0.0]
エージェントが過去の経験から思い出さなければならない情報が増えるほど、必要なメモリが増えます。
メモリ圧縮の利点を最大化するために、量子エージェントが採用すべき最も一般的な形式を明らかにする。
これらのエンコーディングは、メモリ最小の古典的エージェントと比較して非常に有利なスケーリングの利点を示す。
論文 参考訳(メタデータ) (2021-08-24T17:57:05Z) - Did Aristotle Use a Laptop? A Question Answering Benchmark with Implicit
Reasoning Strategies [78.68534915690404]
StrategyQAは、必要な推論ステップが問題に暗黙的であり、戦略を使用して推論されるべきベンチマークです。
用語に基づくプライミングを組み合わせ、アノテーションーを刺激し、アノテーションーの集団を慎重に制御し、推論ショートカットを排除するための逆フィルタリングを行うデータ収集手順を提案する。
総合的に、StrategyQAには2,780の例があり、それぞれが戦略問題、その分解、証拠パラグラフで構成されている。
論文 参考訳(メタデータ) (2021-01-06T19:14:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。