論文の概要: Maxwell's Demon walks into Wall Street: Stochastic Thermodynamics meets
Expected Utility Theory
- arxiv url: http://arxiv.org/abs/2306.00449v2
- Date: Wed, 13 Dec 2023 00:34:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-14 20:52:35.806880
- Title: Maxwell's Demon walks into Wall Street: Stochastic Thermodynamics meets
Expected Utility Theory
- Title(参考訳): MaxwellのDemonがウォール街へ:確率的熱力学と期待された実用性理論
- Authors: Andres F. Ducuara, Paul Skrzypczyk, Francesco Buscemi, Peter Sidajaya,
Valerio Scarani
- Abstract要約: 我々は、前処理と逆処理の間のすべての$alpha$ R'enyi分散が、散逸した作業の「確実同値」の操作的意味を持つことを証明している。
新たな結果のうち、$alpha=0$の条件は、第二法則の過渡的違反に賭けようとするリスクを問う選手の行動を記述するものである。
- 参考スコア(独自算出の注目度): 1.999925939110439
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The interplay between thermodynamics and information theory has a long
history, but its quantitative manifestations are still being explored. We
import tools from expected utility theory from economics into stochastic
thermodynamics. We prove that, in a process obeying Crooks' fluctuation
relations, every $\alpha$ R\'enyi divergence between the forward process and
its reverse has the operational meaning of the ``certainty equivalent'' of
dissipated work (or, more generally, of entropy production) for a player with
risk aversion $r=\alpha-1$. The two known cases $\alpha=1$ and $\alpha=\infty$
are recovered and receive the new interpretation of being associated to a
risk-neutral and an extreme risk-averse player respectively. Among the new
results, the condition for $\alpha=0$ describes the behavior of a risk-seeking
player willing to bet on the transient violations of the second law. Our
approach further leads to a generalized Jarzynski equality, and generalizes to
a broader class of statistical divergences.
- Abstract(参考訳): 熱力学と情報理論の相互作用は長い歴史があるが、その定量的表現はまだ研究されている。
我々は、期待効用理論から経済学から確率的熱力学へ道具をインポートする。
クルックスのゆらぎ関係に従う過程において、すべての$\alpha$ R\'enyi が前処理と逆処理の間で分岐していることが、リスク・アバージョン $r=\alpha-1$ のプレイヤーに対して、散逸された作業(あるいはエントロピー生産)の 'certainty equivalent'' の操作的意味を持つことを証明している。
既知の2つのケース$\alpha=1$と$\alpha=\infty$は、それぞれリスクニュートラルと極端なリスクアバースプレーヤーに関連付けられているという新しい解釈を受け取る。
新しい結果のうち、$\alpha=0$の条件は、第二法則の過渡的違反に賭けようとするリスクを問う選手の行動を記述する。
我々のアプローチは、さらに一般化されたジャージンスキー等式をもたらし、より広範な統計分岐のクラスに一般化する。
関連論文リスト
- Boltzmann-Aligned Inverse Folding Model as a Predictor of Mutational Effects on Protein-Protein Interactions [48.58317905849438]
結合自由エネルギーの変化を予測する(Delta Delta G$)ことはタンパク質-タンパク質相互作用の理解と調節に不可欠である。
本稿では,事前学習した逆折り畳みモデルから$Delta Delta G$予測への知識伝達のためのボルツマンアライメント手法を提案する。
論文 参考訳(メタデータ) (2024-10-12T14:13:42Z) - Coherent states for generalized uncertainty relations as Tsallis
probability amplitudes: new route to non-extensive thermostatistics [0.0]
一般化不確実性原理(GUP)に関連するコヒーレントな状態について検討する。
我々は、このコヒーレント状態とツァリスエントロピーの組み合わせは、非膨張熱力学の観点から GUP を研究することができる自然な概念的枠組みを提供すると論じる。
論文 参考訳(メタデータ) (2023-08-23T18:16:15Z) - Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。
従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文 参考訳(メタデータ) (2023-06-15T16:30:08Z) - Fast Rates for Maximum Entropy Exploration [52.946307632704645]
エージェントが未知の環境下で活動し、報酬が得られない場合、強化学習(RL)における探索の課題に対処する。
本研究では,最大エントロピー探索問題を2つの異なるタイプで検討する。
訪問エントロピーには、$widetildemathcalO(H3S2A/varepsilon2)$ sample complexity を持つゲーム理論アルゴリズムを提案する。
軌道エントロピーに対しては,次数$widetildemathcalO(mathrmpoly(S,)の複雑さのサンプルを持つ単純なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-14T16:51:14Z) - Robust computation of optimal transport by $\beta$-potential
regularization [79.24513412588745]
最適輸送(OT)は、確率分布間の差を測定する機械学習分野で広く使われているツールである。
我々は、いわゆる$beta$-divergenceに付随するベータポテンシャル項でOTを正規化することを提案する。
提案アルゴリズムで計算した輸送行列は,外乱が存在する場合でも確率分布を頑健に推定するのに役立つことを実験的に実証した。
論文 参考訳(メタデータ) (2022-12-26T18:37:28Z) - Stability and Risk Bounds of Iterative Hard Thresholding [41.082982732100696]
アルゴリズム安定性の概念の下でIHTの新しいスパース一般化理論を導入する。
スパースレベル$k$のIHTは、スパース過剰リスクにおける収束率を$mathcaltilde O(n-1/2sqrtlog(n)log(p))$で楽しむことを示す。
理論的予測を確認するための予備的な数値的証拠が提供される。
論文 参考訳(メタデータ) (2022-03-17T16:12:56Z) - Reliability of lattice gauge theories in the thermodynamic limit [0.0]
ゲージ理論の量子シミュレーション実装では、実験的な不完全性によって妥協される。
また,ロバストゲージの不変性も,単体ゲージ保護項によって保たれていることを数値的に示す。
論文 参考訳(メタデータ) (2021-04-14T18:00:04Z) - Action Redundancy in Reinforcement Learning [54.291331971813364]
遷移エントロピーはモデル依存遷移エントロピーと作用冗長性という2つの用語で記述できることを示す。
その結果,行動冗長性は強化学習の根本的な問題であることが示唆された。
論文 参考訳(メタデータ) (2021-02-22T19:47:26Z) - Double-trace deformation in Keldysh field theory [0.0]
我々は、ヴェインベルグの制約を極大に従わせる一般的なケルディシュ作用を導入する。
駆動散逸力学は熱力学よりもはるかにリッチである。
論文 参考訳(メタデータ) (2020-12-10T00:16:47Z) - Risk-Sensitive Reinforcement Learning: Near-Optimal Risk-Sample Tradeoff
in Regret [115.85354306623368]
本研究では,未知の遷移カーネルを持つマルコフ決定過程におけるリスク感応性強化学習について検討する。
確率的に効率的なモデルレスアルゴリズムとして、リスク感性価値反復(RSVI)とリスク感性Q-ラーニング(RSQ)を提案する。
RSVIが $tildeObig(lambda(|beta| H2) cdot sqrtH3 S2AT big) に達したことを証明しています。
論文 参考訳(メタデータ) (2020-06-22T19:28:26Z) - Entropic time-energy uncertainty relations: An algebraic approach [9.881112657341788]
時間とエネルギーの間の不確実性、あるいはより正確には、観測可能な$G$の測定と$G$生成進化$e-ir G$の変位$r$の間の不確実性に対処する。
我々は、しばしば考慮される2つのシナリオにおいて、エントロピーの不確実性の低い境界を導出する。これは、推測者の役割が固定されているか、そうでないかの2つの異なる推測ゲームとして説明できる。
論文 参考訳(メタデータ) (2020-01-03T11:59:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。