論文の概要: The Algorithmic Regulator
- arxiv url: http://arxiv.org/abs/2510.10300v2
- Date: Tue, 14 Oct 2025 14:28:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 14:23:56.90355
- Title: The Algorithmic Regulator
- Title(参考訳): アルゴリズムレギュレータ
- Authors: Giulio Ruffini,
- Abstract要約: 規制の定理は、ある条件下では、任意の最適コントローラーは、それが規制するシステムのモデルを具現化しなければならないと述べる。
この原理は、自由エネルギー原理(Free-Energy Principle)やコルモゴロフ/アルゴリトミックエージェント理論(Kolmogorov/Algorithmic Agent theory)のような神経科学と予測的脳理論の基盤となっている。
Delta$が大きければ大きいほど、高い相互アルゴリズム情報を持つワールドレギュレータペアが好まれる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The regulator theorem states that, under certain conditions, any optimal controller must embody a model of the system it regulates, grounding the idea that controllers embed, explicitly or implicitly, internal models of the controlled. This principle underpins neuroscience and predictive brain theories like the Free-Energy Principle or Kolmogorov/Algorithmic Agent theory. However, the theorem is only proven in limited settings. Here, we treat the deterministic, closed, coupled world-regulator system $(W,R)$ as a single self-delimiting program $p$ via a constant-size wrapper that produces the world output string~$x$ fed to the regulator. We analyze regulation from the viewpoint of the algorithmic complexity of the output, $K(x)$. We define $R$ to be a \emph{good algorithmic regulator} if it \emph{reduces} the algorithmic complexity of the readout relative to a null (unregulated) baseline $\varnothing$, i.e., \[ \Delta = K\big(O_{W,\varnothing}\big) - K\big(O_{W,R}\big) > 0. \] We then prove that the larger $\Delta$ is, the more world-regulator pairs with high mutual algorithmic information are favored. More precisely, a complexity gap $\Delta > 0$ yields \[ \Pr\big((W,R)\mid x\big) \le C\,2^{\,M(W{:}R)}\,2^{-\Delta}, \] making low $M(W{:}R)$ exponentially unlikely as $\Delta$ grows. This is an AIT version of the idea that ``the regulator contains a model of the world.'' The framework is distribution-free, applies to individual sequences, and complements the Internal Model Principle. Beyond this necessity claim, the same coding-theorem calculus singles out a \emph{canonical scalar objective} and implicates a \emph{planner}. On the realized episode, a regulator behaves \emph{as if} it minimized the conditional description length of the readout.
- Abstract(参考訳): 規制の定理は、ある条件下では、任意の最適制御器は、制御器が制御器の内部モデルを明示的にまたは暗黙的に埋め込むという考えを根拠として、制御器が制御するシステムのモデルを具現化しなければならないと述べる。
この原理は、自由エネルギー原理(Free-Energy Principle)やコルモゴロフ/アルゴリトミックエージェント理論(Kolmogorov/Algorithmic Agent theory)のような神経科学と予測的脳理論の基盤となっている。
しかし、この定理は限定的な設定でのみ証明される。
ここでは、決定論的でクローズドで結合されたワールドレギュレータシステム$(W,R)$を、そのレギュレータに供給される世界出力文字列~$x$を生成する定数サイズのラッパーを介して、単一の自己複製プログラム$p$として扱う。
出力のアルゴリズム的複雑さの観点から、規則を解析し、$K(x)$とする。
R$ を \emph{good algorithmic regulator} と定義する: \emph{reduces} が null (unregulated) ベースライン $\varnothing$, すなわち \[ \Delta = K\big(O_{W,\varnothing}\big) - K\big(O_{W,R}\big) > 0 に対して、読み出しのアルゴリズム的な複雑さを定義する。
より大きい$\Delta$は、高い相互アルゴリズム情報を持つより多くのワールドレギュレータペアが好まれることを示す。
より正確には、複雑性ギャップ $\Delta > 0$ yields \[ \Pr\big((W,R)\mid x\big) \le C\,2^{\,M(W{:}R)}\,2^{-\Delta}, \] が低い$M(W{:}R)$は、$\Delta$が成長するにつれて指数的に不可能になる。
これは、'the regulator are a model of the world'という考え方のAIT版である。
フレームワークは配布不要で、個々のシーケンスに適用され、内部モデル原則を補完します。
この必要条件を超えて、同じ符号理論の計算は \emph{canonical scalar objective} を単数化し、 \emph{planner} を暗示する。
実現したエピソードでは、レギュレータが \emph{as} を振舞う。
関連論文リスト
- A c-theorem for the effective central charge in the R=1 replica limit, and applications to systems with measurement-induced randomness [0.0]
infrared value of $c_texteff$ is always $textitless$ than the central charge $c$ of the unperturbed CFT $S_*$。
我々は、ナフムとヤコブセン(英語版)によって示される、上の形式の R から 1$ のレプリカの極限におけるレプリカ場理論を考える。
論文 参考訳(メタデータ) (2025-07-10T17:41:31Z) - Monge-Kantorovich Fitting With Sobolev Budgets [6.748324975906262]
我々は、$rho$が$mtext-d$集合の近くに集中しているとき、これをノイズのあるデータを持つ多様体学習問題と解釈できることを示した。
Monge-Kantorovich $p$-cost $mathbbW_pp(rho, nu)$を介して$rho$を近似する際の$nu$のパフォーマンスを定量化し、$mathrmsupp nu$を$f : mathbbRmでカバーできるようにすることで複雑さを制限します。
論文 参考訳(メタデータ) (2024-09-25T01:30:16Z) - Best-of-Both-Worlds Algorithms for Linear Contextual Bandits [11.94312915280916]
両世界のベスト・オブ・ワールドズ・アルゴリズムを$K$武器付き線形文脈包帯に対して検討する。
我々のアルゴリズムは、敵対的体制と敵対的体制の両方において、ほぼ最適の後悔の限界を提供する。
論文 参考訳(メタデータ) (2023-12-24T08:27:30Z) - Settling the Sample Complexity of Online Reinforcement Learning [92.02082223856479]
バーンインコストを発生させることなく、最小限の最適後悔を実現する方法を示す。
最適値/コストや一定の分散といった問題依存量の影響を明らかにするために、我々の理論を拡張します。
論文 参考訳(メタデータ) (2023-07-25T15:42:11Z) - Universal tripartite entanglement in one-dimensional many-body systems [0.0]
トリパルタイト絡みの2つの非負測度を g$ と $h$ で導入する。
非零$g$または$h$の状態が非自明な三部構造絡みを持つことを示す構造定理を証明する。
論文 参考訳(メタデータ) (2020-11-24T02:59:14Z) - Naive Exploration is Optimal for Online LQR [49.681825576239355]
最適後悔尺度は$widetildeTheta(sqrtd_mathbfu2 d_mathbfx T)$で、$T$は時間ステップの数、$d_mathbfu$は入力空間の次元、$d_mathbfx$はシステム状態の次元である。
我々の下界は、かつての$mathrmpoly(logT)$-regretアルゴリズムの可能性を排除する。
論文 参考訳(メタデータ) (2020-01-27T03:44:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。