論文の概要: Not all uncertainty is alike: volatility, stochasticity, and exploration
- arxiv url: http://arxiv.org/abs/2605.19215v1
- Date: Tue, 19 May 2026 00:38:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.042871
- Title: Not all uncertainty is alike: volatility, stochasticity, and exploration
- Title(参考訳): すべての不確実性は似ているわけではない:ボラティリティ、確率性、探索
- Authors: Payam Piray,
- Abstract要約: 我々は、時間とともに漂流し(変動性)、うるさい結果(確率性)を通して観察される潜在報酬状態のある環境を考える。
ボラティリティはそれを高め、後続性はそれを抑制する。
我々は,同じモノトニクスを継承する制御・アズ・推論によって得られるクローズドフォーム探索ボーナスであるCAUSEを導出する。
- 参考スコア(独自算出の注目度): 0.5801621787540266
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adaptive decision-making in biological and artificial intelligence requires balancing the exploitation of known outcomes with the exploration of uncertain alternatives. Although prior work suggests that uncertainty generally promotes exploration, it has typically treated distinct sources of environmental uncertainty as equivalent. We consider environments with latent reward states that drift over time (volatility) and are observed through noisy outcomes (stochasticity). Both increase posterior uncertainty, yet we show they drive optimal exploration in opposite directions: volatility enhances it, stochasticity suppresses it. We establish this asymmetry formally by extending the Gittins index framework to Gaussian state-space bandits with latent dynamics. We further derive Cause-Aware Uncertainty-Sensitive Exploration (CAUSE), a closed-form exploration bonus obtained via control-as-inference that inherits the same monotonicities. CAUSE outperforms standard exploration strategies in environments with heterogeneous noise structure, and also improves on a Gittins-per-arm policy whose rested-bandit optimality does not transfer to restless settings. Learning and exploration are governed by the same noise-inference asymmetry, and the framework predicts that pathological noise inference produces \emph{reversed} rather than merely impaired exploration, with implications for computational accounts of psychiatric conditions.
- Abstract(参考訳): 生物学的および人工知能における適応的な意思決定は、既知の結果の搾取と不確実な代替品の探索のバランスを必要とする。
以前の研究は、不確実性は一般に探索を促進することを示唆していたが、環境不確実性の異なる源を等価とみなすのが一般的である。
我々は、時間とともに漂流し(変動性)、ノイズのある結果(確率性)を通して観察される潜在報酬状態の環境を考察する。
両者とも後続の不確実性を増大させるが、両者が正反対の方向に最適な探索を行うことを示す: ボラティリティはそれを強化するが、確率性はそれを抑制する。
我々は、Gittinsインデックスフレームワークを潜在力学を持つガウス状態空間の帯域に拡張することで、この非対称性を正式に確立する。
さらに,同じモノトニクスを継承する制御・アズ・推論によって得られたクローズドフォーム探索ボーナスであるCAUSEを導出する。
CAUSEは異質なノイズ構造を持つ環境での標準的な探索戦略よりも優れており、レストバンド最適性がレストレス環境に移行しないGittins-per-armポリシも改善されている。
学習と探索は、同じノイズ推論の非対称性によって管理され、この枠組みは、病理的なノイズ推論が単なる探索の障害ではなく「emph{reversed}」を生成することを予測し、精神状態の計算的説明に影響を及ぼす。
関連論文リスト
- Local Conformal Calibration of Dynamics Uncertainty from Semantic Images [11.10792616622245]
観測対応コンフォーマル不確実性局所校正(OCular)について紹介する。
OCcularは、認識情報を用いて不確実な定量化を保証する共形予測に基づくアルゴリズムである。
ランダムな摂動と有意なモデルミスマッチを考慮した二重積分器システムにおいて,本アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2026-05-13T05:33:42Z) - GTS: Inference-Time Scaling of Latent Reasoning with a Learnable Gaussian Thought Sampler [54.10960908347221]
我々は、学習可能な密度から条件付きサンプリングとして潜在思考探索をモデル化し、このアイデアをガウス思想サンプリング(GTS)としてインスタンス化する。
GTSは、連続的推論状態における文脈依存摂動分布を予測し、バックボーンを凍結させながらGRPOスタイルのポリシー最適化を訓練する。
論文 参考訳(メタデータ) (2026-02-15T09:57:47Z) - Randomized benchmarking with non-Markovian noise and realistic finite-time gates [0.0]
単量子ランダム化ベンチマーク実験における非マルコフ古典雑音の影響を解析する。
本フレームワークは,各ゲート列のランダムな性質を利用して,完全生存確率減衰曲線の式を導出する。
これらの効果がランダム化ベンチマーキング実験の解釈をいかに複雑にするかを論じるとともに、非マルコビアン性の調査にどのように活用するかについても論じる。
論文 参考訳(メタデータ) (2025-01-10T18:52:02Z) - A unified uncertainty-aware exploration: Combining epistemic and
aleatory uncertainty [21.139502047972684]
そこで本稿では, リスク感応探索における浮腫性およびてんかん性不確実性の複合効果を定量的に評価するアルゴリズムを提案する。
本手法は,パラメータ化された回帰分布を推定する分布RLの新たな拡張の上に構築する。
探索課題とリスク課題を伴う課題に対する実験結果から,本手法が代替手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-01-05T17:39:00Z) - Model-Based Uncertainty in Value Functions [89.31922008981735]
MDP上の分布によって引き起こされる値の分散を特徴付けることに重点を置いている。
従来の作業は、いわゆる不確実性ベルマン方程式を解くことで、値よりも後方の分散を境界にしている。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式を提案する。
論文 参考訳(メタデータ) (2023-02-24T09:18:27Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - Analyzing and Improving the Optimization Landscape of Noise-Contrastive
Estimation [50.85788484752612]
ノイズコントラスト推定(NCE)は、非正規化確率モデルを学習するための統計的に一貫した手法である。
ノイズ分布の選択がNCEの性能に不可欠であることが実験的に観察されている。
本研究では,不適切な雑音分布を用いた場合,NCEの性能低下の原因を正式に指摘する。
論文 参考訳(メタデータ) (2021-10-21T16:57:45Z) - Temporal Difference Uncertainties as a Signal for Exploration [76.6341354269013]
強化学習における探索の効果的なアプローチは、最適な政策に対するエージェントの不確実性に依存することである。
本稿では,評価値のバイアスや時間的に矛盾する点を強調した。
本稿では,時間差誤差の分布の導出に依存する値関数の不確かさを推定する手法を提案する。
論文 参考訳(メタデータ) (2020-10-05T18:11:22Z) - Contextual Linear Bandits under Noisy Features: Towards Bayesian Oracles [65.9694455739978]
特徴不確実性の下での文脈線形帯域問題について検討する。
本分析により, 最適仮説は, 雑音特性に応じて, 基礎となる実現可能性関数から著しく逸脱しうることが明らかとなった。
これは、古典的アプローチが非自明な後悔境界を保証できないことを意味する。
論文 参考訳(メタデータ) (2017-03-03T21:39:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。