論文の概要: A Mathematical Theory of Value: a synthesis on goal-directed agency under resource constraints
- arxiv url: http://arxiv.org/abs/2606.12502v1
- Date: Wed, 10 Jun 2026 16:11:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.375431
- Title: A Mathematical Theory of Value: a synthesis on goal-directed agency under resource constraints
- Title(参考訳): 価値の数学的理論--資源制約下におけるゴール指向エージェンシーの合成
- Authors: Cheng Qian,
- Abstract要約: 目的指向エージェントが生成し、破壊し、交換する価値は、情報と同じカテゴリの法的構造量であることを示す。
価格がフレームに依存していない間、価値はフレーム相対的であり、そのリソースをプールし、その知覚を融合する艦隊が天井を継承する。
- 参考スコア(独自算出の注目度): 6.057587531186626
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose that value -- the quantity goal-directed agents create, destroy, and exchange -- is a lawful structural quantity in the same category as information. Following Shannon's method, we make one ruthless abstraction: value is the rate at which an agent converts a resource into goal-progress, relative to a frame fixed by its goal. A scale-invariance axiom forces a logarithmic measure, $V=\sum_i k_i \ln e_i$; compounding of a reinvested resource forces the same form via the ergodicity argument of Peters (2019). The two routes are kin rather than independent; their agreement is a consistency check, not an over-determination. We derive a coding theorem of value: $ΔG \le I(X;Y)$, achieved by Bayes-proportional allocation; realized value decomposes as $G=D(q\|r)-D(q\|p)$, identifying misalignment with measurable waste. For populations, value is frame-relative while price is frame-independent; a fleet that pools its resource and fuses its perception inherits the ceiling $G_{\mathrm{fleet}} \le I(X;Y_{1:m}) \le H(X)$ (a corollary; an earlier sum-form claim was wrong and is corrected in v5). A dynamical layer yields an is/ought asymmetry from which alignment emerges as a control-stability condition with a closed-form residual. We test the single-frame laws on live language models in a pre-registered scale-up: perception mutual information tracks realized capability rather than parameter count (Spearman $ρ= 0.977$ pooled over 30 model$\times$domain points), out-of-sample $ΔG$ tracks $I(X;Y)$, and over-confidence is measurable dissipation; a further pre-registered test shows the bridge is shape-invariant across four task shapes ($n=42$, slope 0.953). None of the mechanisms is individually new -- generalized Kelly, Armstrong & Mindermann (2018), classical control; the contribution is their unification and the governance mapping (incentive design over oversight) that follows.
- Abstract(参考訳): 目的指向エージェントが生成し、破壊し、交換する価値は、情報と同じカテゴリの法的構造量である。
価値とは、エージェントがその目標によって固定されたフレームに対して、リソースをゴールプログレスに変換するレートである。
スケール不変公理は対数測度である$V=\sum_i k_i \ln e_i$を強制する。
2つのルートは独立ではなく親和性があり、その合意は一貫性のチェックであり、過剰な決定ではない。
我々は値の符号定理を導出する:$ΔG \le I(X;Y)$, ベイズ分布割当により達成され、実現された値は$G=D(q\|r)-D(q\|p)$と分解され、測定可能な廃棄物との不一致を識別する。
G_{\mathrm{fleet}} \le I(X;Y_{1:m}) \le H(X)$(corollary, a earlier sum-form claim was wrong, and corrected in v5) は天井を継承する。
動的層は、アライメントが閉形式残差を持つ制御安定状態として現れる等速非対称性を生じる。
スピアマン$ρ=0.977$プール(30モデル以上)、Out-of-sample $ΔG$ tracks $I(X;Y)$, and over-confidence is measurable dissipation; さらに事前登録されたテストでは、4つのタスク形状(n=42$, slope 0.953)でブリッジが形状不変であることを示す。
一般的なKelly, Armstrong & Mindermann (2018)、古典的なコントロール、その貢献は統一とガバナンスマッピング(監視以上のインセンティブデザイン)である。
関連論文リスト
- Civilizational Metamaterials: Engineering Coordination Under Capability Gradients and Structural Turbulence [0.0]
ガバナンスは規範的な規律からエンジニアリングの規律に移行しなければなりません。
メタマテリアルの物理にインスパイアされた形式的な枠組みを開発し、この遷移を定量的かつ検証可能にする。
論文 参考訳(メタデータ) (2026-05-29T18:10:00Z) - Representation Without Reward: A JEPA Audit for LLM Fine-Tuning [1.2691047660244335]
JEPA(Joint-embedding predictive Architectures)は、モデルが観測された出力よりも遅延表現を予測できるように訓練された時に、より有用な抽象化を学ぶべきであることを提案している。
自己回帰型言語モデルの微調整には、この原理はより厳密な要件を必要とする。
我々は、Llama-3.2-1B-Instruct LoRA を用いて、自然言語からレジェックス生成におけるその要件を検証した。
論文 参考訳(メタデータ) (2026-05-14T20:27:32Z) - The Geometry of Forgetting: Temporal Knowledge Drift as an Independent Axis in LLM Representations [50.43168858368539]
大規模言語モデルは自信を持って時代遅れの回答を生成し、既存の方法では検出できない。
これは工学的な失敗ではなく構造的な失敗であり、時間的ドリフトは、幾何的に残留流の方向として、正確性と不確実性の両方に符号化される。
論文 参考訳(メタデータ) (2026-05-09T22:27:31Z) - Spectral Sentinel: Scalable Byzantine-Robust Decentralized Federated Learning via Sketched Random Matrix Theory on Blockchain [0.0]
ビザンチンのクライアントは、不均一な(Non-IID)データの下での濃度勾配を中毒する。
本稿では,ビザンチン検出・集約フレームワークであるSpectral Sentinelを提案する。
Polygonネットワーク上でブロックチェーンを統合することで,完全なシステムを実現しています。
論文 参考訳(メタデータ) (2025-12-14T09:43:03Z) - Rational Adversaries and the Maintenance of Fragility: A Game-Theoretic Theory of Rational Stagnation [0.0]
本稿では、合理的な敵によって維持される均衡として、そのような「合理的な停滞」を説明する。
ソーシャルメディアのアルゴリズムや政治的信頼への応用は、敵が故意に合理性を維持する方法を示している。
論文 参考訳(メタデータ) (2025-10-25T09:28:15Z) - Simple Convergence Proof of Adam From a Sign-like Descent Perspective [58.89890024903816]
我々は、Adamが以前の$cal O(fracln TTs14)$よりも$cal O(frac1Ts14)$の最適なレートを達成することを示す。
我々の理論分析は、収束を保証する重要な要因として運動量の役割に関する新たな洞察を提供する。
論文 参考訳(メタデータ) (2025-07-08T13:19:26Z) - Federated Learning in the Presence of Adversarial Client Unavailability [16.201377650598516]
フェデレートラーニング(Federated Learning)は、生データを公開せずにコラボレーティブモデルを可能にする、分散機械学習フレームワークである。
多様なハードウェアソフトウェアに制限があるため、クライアントはサーバからの計算要求に対して常に利用できるとは限らない。
戦場のような厳しい環境では、敵は特定のクライアントを選択的に黙らせることができる。
論文 参考訳(メタデータ) (2023-05-31T15:57:07Z) - Horizon-Free and Variance-Dependent Reinforcement Learning for Latent
Markov Decision Processes [62.90204655228324]
我々は,後期マルコフ決定過程(LMDP)における強化学習(RL)の文脈を考慮した後悔の最小化について検討した。
我々は,モデル最適化と値最適化の両手法でインスタンス化できる,新しいモデルベースアルゴリズムフレームワークを設計する。
論文 参考訳(メタデータ) (2022-10-20T21:32:01Z) - Linear Contextual Bandits with Adversarial Corruptions [91.38793800392108]
本稿では,敵対的腐敗の存在下での線形文脈的包帯問題について検討する。
逆汚染レベルに適応する分散認識アルゴリズムをC$で提案する。
論文 参考訳(メタデータ) (2021-10-25T02:53:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。