論文の概要: On the Mathematical Impossibility of Safe Universal Approximators
- arxiv url: http://arxiv.org/abs/2507.03031v1
- Date: Thu, 03 Jul 2025 01:05:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.542257
- Title: On the Mathematical Impossibility of Safe Universal Approximators
- Title(参考訳): 安全ユニバーサル近似器の数学的不可能性について
- Authors: Jasper Yao,
- Abstract要約: 破滅的故障は有用な計算システムでは不可能な特徴であることを示す。
我々はこれを3段階の議論を通じて証明し、任意の種類の普遍近似器アーキテクチャのエスケープルートを残さない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We establish fundamental mathematical limits on universal approximation theorem (UAT) system alignment by proving that catastrophic failures are an inescapable feature of any useful computational system. Our central thesis is that for any universal approximator, the expressive power required for useful computation is inextricably linked to a dense set of instabilities that make perfect, reliable control a mathematical impossibility. We prove this through a three-level argument that leaves no escape routes for any class of universal approximator architecture. i) Combinatorial Necessity: For the vast majority of practical universal approximators (e.g., those using ReLU activations), we prove that the density of catastrophic failure points is directly proportional to the network's expressive power. ii) Topological Necessity: For any theoretical universal approximator, we use singularity theory to prove that the ability to approximate generic functions requires the ability to implement the dense, catastrophic singularities that characterize them. iii) Empirical Necessity: We prove that the universal existence of adversarial examples is empirical evidence that real-world tasks are themselves catastrophic, forcing any successful model to learn and replicate these instabilities. These results, combined with a quantitative "Impossibility Sandwich" showing that the minimum complexity for usefulness exceeds the maximum complexity for safety, demonstrate that perfect alignment is not an engineering challenge but a mathematical impossibility. This foundational result reframes UAT safety from a problem of "how to achieve perfect control" to one of "how to operate safely in the presence of irreducible uncontrollability," with profound implications for the future of UAT development and governance.
- Abstract(参考訳): 我々は、破滅的故障が有用な計算システムでは不可能な特徴であることを証明し、普遍近似定理(UAT)システムアライメントの基本的な数学的限界を確立する。
我々の中心的な主張は、あらゆる普遍近似器において、有用な計算に必要な表現力は、完全で信頼性の高い制御を数学的に不可能なものにする、密度の高い不安定な集合に本質的に関連しているということである。
我々はこれを3段階の議論を通じて証明し、任意の種類の普遍近似器アーキテクチャのエスケープルートを残さない。
一 組合せ必要性:実用的普遍近似器の大多数(例えば、ReLUアクティベーションを利用するもの)において、破滅的故障点の密度がネットワークの表現力に直接比例していることを証明する。
二 位相的必要性:任意の理論的普遍近似器に対して、一般関数を近似する能力はそれらの特徴を特徴づける高密度で破滅的な特異点を実装する能力を必要とすることを証明するために特異性理論を用いる。
三 敵の普遍的な存在は、現実世界のタスク自体が破滅的であることの実証的証拠であり、成功したモデルにこれらの不安定性を学習し、複製させることを強制する。
これらの結果は、有用性の最小限の複雑さが安全性の最大の複雑さを超えることを示す定量的な「不合理サンドイッチ」と組み合わせて、完全整合は工学的な挑戦ではなく数学的不合理性であることを示した。
この基礎的な結果は、UATの安全性を「完全なコントロールを達成する方法」の問題から、UAT開発とガバナンスの将来に深く影響する「既約のコントロール不可能な状況下で安全に運用する方法」に再設定する。
関連論文リスト
- The Alignment Trap: Complexity Barriers [0.0]
本稿は、AIアライメントは単に難しいだけでなく、基本的な論理的矛盾に基づくものである、と論じる。
私たちは、すべての必要な安全ルールを列挙できないため、マシンラーニングを正確に使用しています。
このパラドックスは、5つの独立した数学的証明によって確認される。
論文 参考訳(メタデータ) (2025-06-12T02:30:30Z) - DeepTheorem: Advancing LLM Reasoning for Theorem Proving Through Natural Language and Reinforcement Learning [67.93945726549289]
DeepTheoremは、数学的推論を強化するために自然言語を活用する包括的な非公式な定理証明フレームワークである。
DeepTheoremには、121Kの高品質なIMOレベルの非公式な定理と証明からなる大規模なベンチマークデータセットが含まれている。
我々は、証明された定理の変種を利用して堅牢な数学的推論を動機付けることによって、非公式な定理証明に適した新しい強化学習戦略(RL-Zero)を考案する。
論文 参考訳(メタデータ) (2025-05-29T17:59:39Z) - The Theory of the Unique Latent Pattern: A Formal Epistemic Framework for Structural Singularity in Complex Systems [2.44755919161855]
本稿では,動的システムにおける複雑性の起源を再定義する形式的枠組みとして,一様潜在パターンの理論(ULP)を紹介する。
ULPは、本質的なランダム性や創発的な非線形性に予測不可能をもたらすのではなく、全ての分析可能な系は構造的にユニークで決定論的な生成機構によって支配されていると主張する。
論文 参考訳(メタデータ) (2025-05-24T19:52:28Z) - Probabilistic computation and uncertainty quantification with emerging
covariance [11.79594512851008]
堅牢で解釈可能なセキュアなAIシステムを構築するには、確率論的視点の下で不確実性を定量化し、表現する必要がある。
確率計算は、ほとんどの従来の人工ニューラルネットワークにとって重要な課題である。
論文 参考訳(メタデータ) (2023-05-30T17:55:29Z) - The Unreasonable Effectiveness of Deep Evidential Regression [72.30888739450343]
不確実性を考慮した回帰ベースニューラルネットワーク(NN)による新しいアプローチは、従来の決定論的手法や典型的なベイズ的NNよりも有望であることを示している。
我々は、理論的欠点を詳述し、合成および実世界のデータセットのパフォーマンスを分析し、Deep Evidential Regressionが正確な不確実性ではなく定量化であることを示す。
論文 参考訳(メタデータ) (2022-05-20T10:10:32Z) - Universal Regression with Adversarial Responses [26.308541799686505]
非I.d.インスタンスシーケンスの大規模クラスの下で、逆応答を伴う回帰のためのアルゴリズムを提供する。
我々は,学習者の強い一貫性を求める普遍的な一貫性を,値応答の制限なしに検討する。
論文 参考訳(メタデータ) (2022-03-09T22:10:30Z) - On dissipative symplectic integration with applications to
gradient-based optimization [77.34726150561087]
本稿では,離散化を体系的に実現する幾何学的枠組みを提案する。
我々は、シンプレクティックな非保守的、特に散逸的なハミルトン系への一般化が、制御された誤差まで収束率を維持することができることを示す。
論文 参考訳(メタデータ) (2020-04-15T00:36:49Z) - Polynomial-Time Exact MAP Inference on Discrete Models with Global
Dependencies [83.05591911173332]
ジャンクションツリーアルゴリズムは、実行時の保証と正確なMAP推論のための最も一般的な解である。
本稿では,ノードのクローン化による新たなグラフ変換手法を提案する。
論文 参考訳(メタデータ) (2019-12-27T13:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。