論文の概要: Value Under Ignorance in Universal Artificial Intelligence
- arxiv url: http://arxiv.org/abs/2512.17086v1
- Date: Thu, 18 Dec 2025 21:34:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.181524
- Title: Value Under Ignorance in Universal Artificial Intelligence
- Title(参考訳): Universal Artificial Intelligenceにおける無視の下での価値
- Authors: Cole Wyeth, Marcus Hutter,
- Abstract要約: 我々は、AIXI強化学習エージェントを一般化して、より広範なユーティリティ機能を受け入れる。
我々は不正確な確率論からチョーケ積分を用いた予測ユーティリティの計算結果について考察する。
- 参考スコア(独自算出の注目度): 12.14316568021293
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We generalize the AIXI reinforcement learning agent to admit a wider class of utility functions. Assigning a utility to each possible interaction history forces us to confront the ambiguity that some hypotheses in the agent's belief distribution only predict a finite prefix of the history, which is sometimes interpreted as implying a chance of death equal to a quantity called the semimeasure loss. This death interpretation suggests one way to assign utilities to such history prefixes. We argue that it is as natural to view the belief distributions as imprecise probability distributions, with the semimeasure loss as total ignorance. This motivates us to consider the consequences of computing expected utilities with Choquet integrals from imprecise probability theory, including an investigation of their computability level. We recover the standard recursive value function as a special case. However, our most general expected utilities under the death interpretation cannot be characterized as such Choquet integrals.
- Abstract(参考訳): 我々は、AIXI強化学習エージェントを一般化して、より広範なユーティリティ機能を受け入れる。
各相互作用履歴に実用性を割り当てると、エージェントの信念分布のいくつかの仮説が歴史の有限なプレフィックスしか予測しないという曖昧さに直面することになる。
この死亡解釈は、そのような履歴接頭辞にユーティリティを割り当てる1つの方法を示している。
我々は、信念分布を不正確な確率分布と見なすのが自然であり、半測度損失を全体無知とみなす。
このことは、計算可能性レベルの調査を含む不正確な確率論からチョーケ積分を用いた予測ユーティリティの計算結果を検討する動機となっている。
特殊ケースとして標準再帰値関数を復元する。
しかし、死の解釈に基づく最も一般的なユーティリティは、このようなチョケット積分として特徴づけられない。
関連論文リスト
- Can a Bayesian Oracle Prevent Harm from an Agent? [48.12936383352277]
我々は、所定の安全仕様に違反する確率に基づいて、文脈依存境界を推定することを検討する。
世界の異なる仮説が全く異なる結果をもたらす可能性があることに注意し、我々は真だが未知の仮説の下で予測される安全違反の確率に基づいて導かれる。
我々は、この結果の2つの形態、すなわち、i.d.の場合と非i.d.の場合を考察し、そのような理論結果を実用的なAIガードレールに変換するためのオープンな問題で結論付ける。
論文 参考訳(メタデータ) (2024-08-09T18:10:42Z) - Uncertainty Estimates of Predictions via a General Bias-Variance
Decomposition [7.811916700683125]
本稿では,適切なスコアに対するバイアス分散分解を導入し,分散項としてブレグマン情報を導出する。
モデルアンサンブルや信頼領域を含む下流タスクにおけるこの分解の実践的妥当性を示す。
論文 参考訳(メタデータ) (2022-10-21T21:24:37Z) - Generalization Bounds via Convex Analysis [12.411844611718958]
連関出力分布の強い凸関数によって相互情報を置き換えることが可能であることを示す。
例えば、$p$-normの発散とワッサーシュタイン2距離の項で表される境界がある。
論文 参考訳(メタデータ) (2022-02-10T12:30:45Z) - Distribution Regression with Sliced Wasserstein Kernels [45.916342378789174]
分布回帰のための最初のOTに基づく推定器を提案する。
このような表現に基づくカーネルリッジ回帰推定器の理論的性質について検討する。
論文 参考訳(メタデータ) (2022-02-08T15:21:56Z) - Universal Off-Policy Evaluation [64.02853483874334]
ユニバーサルオフ政治推定器(UnO)への第一歩を踏み出す
我々は, 平均, 分散, 分位数/中間数, 分位数範囲, cvar, および累積分布全体の推定と同時結合に uno を用いる。
論文 参考訳(メタデータ) (2021-04-26T18:54:31Z) - A Weaker Faithfulness Assumption based on Triple Interactions [89.59955143854556]
より弱い仮定として, 2$-adjacency faithfulness を提案します。
より弱い仮定の下で適用可能な因果発見のための音方向規則を提案する。
論文 参考訳(メタデータ) (2020-10-27T13:04:08Z) - Mixability of Integral Losses: a Key to Efficient Online Aggregation of Functional and Probabilistic Forecasts [72.32459441619388]
基本混合(および指数的に凹)損失関数を適用して機能的予測を比較し、これらの適応が混合可能であることを証明する(exp-concave)。
主な結果の応用として、確率予測に使用される様々な損失関数が混合可能であることを示す(exp-concave)。
論文 参考訳(メタデータ) (2019-12-15T14:25:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。