論文の概要: Quantum-Inspired Reinforcement Learning in the Presence of Epistemic Ambivalence
- arxiv url: http://arxiv.org/abs/2503.04219v1
- Date: Thu, 06 Mar 2025 08:54:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 16:01:46.189281
- Title: Quantum-Inspired Reinforcement Learning in the Presence of Epistemic Ambivalence
- Title(参考訳): てんかんにおける量子インスピレーションによる強化学習
- Authors: Alireza Habibi, Saeed Ghoorchian, Setareh Maghsudi,
- Abstract要約: エピステム・アンビバレンス(EA)は、矛盾する証拠や矛盾した経験から生じる。
EA-MDPは意思決定プロセスにおけるEAの理解と制御を目的としている。
- 参考スコア(独自算出の注目度): 4.683612295430956
- License:
- Abstract: The complexity of online decision-making under uncertainty stems from the requirement of finding a balance between exploiting known strategies and exploring new possibilities. Naturally, the uncertainty type plays a crucial role in developing decision-making strategies that manage complexity effectively. In this paper, we focus on a specific form of uncertainty known as epistemic ambivalence (EA), which emerges from conflicting pieces of evidence or contradictory experiences. It creates a delicate interplay between uncertainty and confidence, distinguishing it from epistemic uncertainty that typically diminishes with new information. Indeed, ambivalence can persist even after additional knowledge is acquired. To address this phenomenon, we propose a novel framework, called the epistemically ambivalent Markov decision process (EA-MDP), aiming to understand and control EA in decision-making processes. This framework incorporates the concept of a quantum state from the quantum mechanics formalism, and its core is to assess the probability and reward of every possible outcome. We calculate the reward function using quantum measurement techniques and prove the existence of an optimal policy and an optimal value function in the EA-MDP framework. We also propose the EA-epsilon-greedy Q-learning algorithm. To evaluate the impact of EA on decision-making and the expedience of our framework, we study two distinct experimental setups, namely the two-state problem and the lattice problem. Our results show that using our methods, the agent converges to the optimal policy in the presence of EA.
- Abstract(参考訳): 不確実性の下でのオンライン意思決定の複雑さは、既知の戦略の活用と新たな可能性の探求のバランスを見つける必要性に起因している。
当然、不確実性は複雑さを効果的に管理する意思決定戦略の開発において重要な役割を果たす。
本稿では, 矛盾する証拠や矛盾する経験から生じる, 疫学的曖昧さ(EA)と呼ばれる, 特定の不確実性に焦点をあてる。
これは不確実性と信頼の微妙な相互作用を生み出し、新しい情報によって一般的に減少するてんかんの不確実性と区別する。
実際、追加の知識が獲得された後も、あいまいさは持続できる。
この現象に対処するため、我々は、意思決定プロセスにおけるEAの理解と制御を目的とした、EA-MDPと呼ばれる新しい枠組みを提案する。
この枠組みは量子力学の定式化から量子状態の概念を取り入れ、その中核はあらゆる可能な結果の確率と報酬を評価することである。
量子計測技術を用いて報酬関数を計算し、EA-MDPフレームワークにおける最適ポリシーと最適値関数の存在を証明した。
また,EA-epsilon-greedy Q-learningアルゴリズムを提案する。
EAが意思決定やフレームワークの迅速性に与える影響を評価するため,2状態問題と格子問題という2つの異なる実験装置について検討した。
本手法により,エージェントはEAの存在下での最適方針に収束することを示す。
関連論文リスト
- Agentic LLM Framework for Adaptive Decision Discourse [2.4919169815423743]
本研究では,実世界のエージェント型大規模言語モデル(LLM)フレームワークを紹介する。
従来の意思決定支援ツールとは異なり、このフレームワークは対話、トレードオフ探索、エージェント間の相互作用によって生成される創発的なシナジーを強調している。
その結果、第1次探索がいかに堅牢で公平なレコメンデーションパスを育むかが明らかとなった。
論文 参考訳(メタデータ) (2025-02-16T03:46:37Z) - Decision Making in Changing Environments: Robustness, Query-Based Learning, and Differential Privacy [59.64384863882473]
本研究では,環境が時間とともに変化する対話的意思決定の課題について考察する。
意思決定の複雑さと敵意的な設定の複雑さを提供するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-24T21:31:50Z) - Know Where You're Uncertain When Planning with Multimodal Foundation Models: A Formal Framework [54.40508478482667]
認識と計画生成の不確実性を解消し、定量化し、緩和する包括的枠組みを提案する。
本稿では,知覚と意思決定の独特な性質に合わせた手法を提案する。
この不確実性分散フレームワークは, 変動率を最大40%削減し, タスク成功率をベースラインに比べて5%向上させることを示した。
論文 参考訳(メタデータ) (2024-11-03T17:32:00Z) - Uncertainty Quantification for Forward and Inverse Problems of PDEs via
Latent Global Evolution [110.99891169486366]
本稿では,効率的かつ高精度な不確実性定量化を深層学習に基づく代理モデルに統合する手法を提案する。
本手法は,フォワード問題と逆問題の両方に対して,堅牢かつ効率的な不確実性定量化機能を備えたディープラーニングに基づく代理モデルを提案する。
提案手法は, 長期予測を含むシナリオに適合し, 拡張された自己回帰ロールアウトに対する不確かさの伝播に優れる。
論文 参考訳(メタデータ) (2024-02-13T11:22:59Z) - Explaining by Imitating: Understanding Decisions by Interpretable Policy
Learning [72.80902932543474]
観察されたデータから人間の行動を理解することは、意思決定における透明性と説明責任にとって重要である。
意思決定者の方針をモデル化することが困難である医療などの現実的な設定を考えてみましょう。
本稿では, 設計による透明性の向上, 部分観測可能性の確保, 完全にオフラインで動作可能なデータ駆動型意思決定行動の表現を提案する。
論文 参考訳(メタデータ) (2023-10-28T13:06:14Z) - On solving decision and risk management problems subject to uncertainty [91.3755431537592]
不確実性は意思決定とリスク管理において広範囲にわたる課題である。
本稿では,このような戦略を体系的に理解し,その適用範囲を判断し,それらをうまく活用するための枠組みを開発する。
論文 参考訳(メタデータ) (2023-01-18T19:16:23Z) - On the Complexity of Adversarial Decision Making [101.14158787665252]
決定推定係数は, 相手の意思決定に対する後悔度を低く抑えるのに必要であり, 十分であることを示す。
我々は、決定推定係数を他のよく知られた複雑性尺度の変種に結びつける新しい構造結果を提供する。
論文 参考訳(メタデータ) (2022-06-27T06:20:37Z) - Uncertainty quantification and exploration-exploitation trade-off in
humans [0.0]
本稿では,不確実性下における人間の意思決定戦略が情報収集(探索)と報酬獲得(探索)のトレードオフをどのように管理するかを分析する理論的枠組みを概説する。
論文 参考訳(メタデータ) (2021-02-05T16:03:04Z) - Quantum Cognitively Motivated Decision Fusion for Video Sentiment
Analysis [22.701975963984378]
あるモダリティからの感情判断は、他のモダリティの判断と相容れない可能性がある。
本稿では,感情判断予測のための新しい量子認知型融合戦略を提案する。
論文 参考訳(メタデータ) (2021-01-12T11:06:04Z) - QuLBIT: Quantum-Like Bayesian Inference Technologies for Cognition and
Decision [0.11470070927586014]
本稿では、量子論から派生した統合認知意思決定フレームワーク(QulBIT)の基礎を提供する。
本稿では,統合フレームワークの主要なモジュール,説明的分析手法について詳述し,その適用が確実な原則に反する状況で説明する。
論文 参考訳(メタデータ) (2020-05-30T09:02:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。