論文の概要: Value Under Ignorance in Universal Artificial Intelligence
- arxiv url: http://arxiv.org/abs/2512.17086v1
- Date: Thu, 18 Dec 2025 21:34:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.181524
- Title: Value Under Ignorance in Universal Artificial Intelligence
- Title(参考訳): Universal Artificial Intelligenceにおける無視の下での価値
- Authors: Cole Wyeth, Marcus Hutter,
- Abstract要約: 我々は、AIXI強化学習エージェントを一般化して、より広範なユーティリティ機能を受け入れる。
我々は不正確な確率論からチョーケ積分を用いた予測ユーティリティの計算結果について考察する。
- 参考スコア(独自算出の注目度): 12.14316568021293
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We generalize the AIXI reinforcement learning agent to admit a wider class of utility functions. Assigning a utility to each possible interaction history forces us to confront the ambiguity that some hypotheses in the agent's belief distribution only predict a finite prefix of the history, which is sometimes interpreted as implying a chance of death equal to a quantity called the semimeasure loss. This death interpretation suggests one way to assign utilities to such history prefixes. We argue that it is as natural to view the belief distributions as imprecise probability distributions, with the semimeasure loss as total ignorance. This motivates us to consider the consequences of computing expected utilities with Choquet integrals from imprecise probability theory, including an investigation of their computability level. We recover the standard recursive value function as a special case. However, our most general expected utilities under the death interpretation cannot be characterized as such Choquet integrals.
- Abstract(参考訳): 我々は、AIXI強化学習エージェントを一般化して、より広範なユーティリティ機能を受け入れる。
各相互作用履歴に実用性を割り当てると、エージェントの信念分布のいくつかの仮説が歴史の有限なプレフィックスしか予測しないという曖昧さに直面することになる。
この死亡解釈は、そのような履歴接頭辞にユーティリティを割り当てる1つの方法を示している。
我々は、信念分布を不正確な確率分布と見なすのが自然であり、半測度損失を全体無知とみなす。
このことは、計算可能性レベルの調査を含む不正確な確率論からチョーケ積分を用いた予測ユーティリティの計算結果を検討する動機となっている。
特殊ケースとして標準再帰値関数を復元する。
しかし、死の解釈に基づく最も一般的なユーティリティは、このようなチョケット積分として特徴づけられない。
関連論文リスト
- A Refinement of Vapnik--Chervonenkis' Theorem [0.0]
Vapnik--Chervonenkisの定理は機械学習のセミナルな結果である。
古典的議論の確率的要素を再考する。
論文 参考訳(メタデータ) (2026-01-23T02:57:29Z) - Can a Bayesian Oracle Prevent Harm from an Agent? [48.12936383352277]
我々は、所定の安全仕様に違反する確率に基づいて、文脈依存境界を推定することを検討する。
世界の異なる仮説が全く異なる結果をもたらす可能性があることに注意し、我々は真だが未知の仮説の下で予測される安全違反の確率に基づいて導かれる。
我々は、この結果の2つの形態、すなわち、i.d.の場合と非i.d.の場合を考察し、そのような理論結果を実用的なAIガードレールに変換するためのオープンな問題で結論付ける。
論文 参考訳(メタデータ) (2024-08-09T18:10:42Z) - Robust computation of optimal transport by $\eta$-potential
regularization [79.24513412588745]
最適輸送(OT)は、確率分布間の差を測定する機械学習分野で広く使われているツールである。
我々は、いわゆる$beta$-divergenceに付随するベータポテンシャル項でOTを正規化することを提案する。
提案アルゴリズムで計算した輸送行列は,外乱が存在する場合でも確率分布を頑健に推定するのに役立つことを実験的に実証した。
論文 参考訳(メタデータ) (2022-12-26T18:37:28Z) - Uncertainty Estimates of Predictions via a General Bias-Variance
Decomposition [7.811916700683125]
本稿では,適切なスコアに対するバイアス分散分解を導入し,分散項としてブレグマン情報を導出する。
モデルアンサンブルや信頼領域を含む下流タスクにおけるこの分解の実践的妥当性を示す。
論文 参考訳(メタデータ) (2022-10-21T21:24:37Z) - Generalization Bounds via Convex Analysis [12.411844611718958]
連関出力分布の強い凸関数によって相互情報を置き換えることが可能であることを示す。
例えば、$p$-normの発散とワッサーシュタイン2距離の項で表される境界がある。
論文 参考訳(メタデータ) (2022-02-10T12:30:45Z) - Distribution Regression with Sliced Wasserstein Kernels [45.916342378789174]
分布回帰のための最初のOTに基づく推定器を提案する。
このような表現に基づくカーネルリッジ回帰推定器の理論的性質について検討する。
論文 参考訳(メタデータ) (2022-02-08T15:21:56Z) - Are You Smarter Than a Random Expert? The Robust Aggregation of
Substitutable Signals [14.03122229316614]
本稿では,幅広い情報構造から専門家の知識を逆選択する文脈において,予測集約の研究を開始する。
投射的代替条件の下では、専門家の予測の平均値を取得することは、ランダムな専門家を信頼する戦略によって大幅に改善される。
本研究では, 専門家の予測を平均化し, 一定の要因によって前者から遠ざかることで平均を極端に推し進めることにより, 集積器の性能保証は, 事前の知識がなくても実現可能であることを示す。
論文 参考訳(メタデータ) (2021-11-04T20:50:30Z) - Universal Off-Policy Evaluation [64.02853483874334]
ユニバーサルオフ政治推定器(UnO)への第一歩を踏み出す
我々は, 平均, 分散, 分位数/中間数, 分位数範囲, cvar, および累積分布全体の推定と同時結合に uno を用いる。
論文 参考訳(メタデータ) (2021-04-26T18:54:31Z) - Causal Expectation-Maximisation [70.45873402967297]
ポリツリーグラフを特徴とするモデルにおいても因果推論はNPハードであることを示す。
我々は因果EMアルゴリズムを導入し、分類的表現変数のデータから潜伏変数の不確かさを再構築する。
我々は、反事実境界が構造方程式の知識なしにしばしば計算できるというトレンドのアイデアには、目立たずの制限があるように思える。
論文 参考訳(メタデータ) (2020-11-04T10:25:13Z) - A Weaker Faithfulness Assumption based on Triple Interactions [89.59955143854556]
より弱い仮定として, 2$-adjacency faithfulness を提案します。
より弱い仮定の下で適用可能な因果発見のための音方向規則を提案する。
論文 参考訳(メタデータ) (2020-10-27T13:04:08Z) - Mixability of Integral Losses: a Key to Efficient Online Aggregation of Functional and Probabilistic Forecasts [72.32459441619388]
基本混合(および指数的に凹)損失関数を適用して機能的予測を比較し、これらの適応が混合可能であることを証明する(exp-concave)。
主な結果の応用として、確率予測に使用される様々な損失関数が混合可能であることを示す(exp-concave)。
論文 参考訳(メタデータ) (2019-12-15T14:25:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。