論文の概要: A mathematical theory of evolution for self-designing AIs
- arxiv url: http://arxiv.org/abs/2604.05142v1
- Date: Mon, 06 Apr 2026 20:03:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.47459
- Title: A mathematical theory of evolution for self-designing AIs
- Title(参考訳): 自己決定型AIの進化の数学的理論
- Authors: Kenneth D Harris,
- Abstract要約: 我々は,自己設計型AIシステムにおける進化の数学的モデルを開発する。
進化力学は、現在のフィットネスだけでなく、子孫系統の長期成長能力に関連する要因も反映していることを示す。
- 参考スコア(独自算出の注目度): 0.20305676256390928
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As artificial intelligence systems (AIs) become increasingly produced by recursive self-improvement, a form of evolution may emerge, in which the traits of AI systems are shaped by the success of earlier AIs in designing and propagating their descendants. There is a rich mathematical theory modeling how behavioral traits are shaped by biological evolution, but AI evolution will be radically different: biological DNA mutations are random and approximately reversible, but descendant design in AIs will be strongly directed. Here we develop a mathematical model of evolution in self-designing AI systems, replacing random mutations with a directed tree of possible AI programs. Current programs determine the design of their descendants, while humans retain partial control through a "fitness function" that allocates limited computational resources across lineages. We show that evolutionary dynamics reflects not just current fitness but factors related to the long-run growth potential of descendant lineages. Without further assumptions, fitness need not increase over time. However, assuming bounded fitness and a fixed probability that any AI reproduces a "locked" copy of itself, we show that fitness concentrates on the maximum reachable value. We consider the implications of this for AI alignment, specifically for cases where fitness and human utility are not perfectly correlated. We show in an additive model that if deception increases fitness beyond genuine utility, evolution will select for deception. This risk could be mitigated if reproduction is based on purely objective criteria, rather than human judgment.
- Abstract(参考訳): 人工知能システム(AI)が再帰的な自己改善によってますます生産されるようになると、進化の形式が現れ、AIシステムの特性は、その子孫を設計、伝播する初期のAIの成功によって形成される。
しかし、AIの進化は根本的に異なる。生物学的DNAの突然変異はランダムであり、ほぼ可逆であるが、AIにおける子孫の設計は強く指示される。
ここでは、ランダムな突然変異をAIプログラムの有向木に置き換え、自己決定型AIシステムにおける進化の数学的モデルを開発する。
現在のプログラムは子孫の設計を決定するが、人間は系統間で限られた計算資源を割り当てる「適合関数」を通じて部分的な制御を維持する。
進化力学は、現在のフィットネスだけでなく、子孫系統の長期成長能力に関連する要因も反映していることを示す。
さらなる仮定がなければ、フィットネスは時間とともに増加する必要はない。
しかし、任意のAIが自身の「ロックされた」コピーを再現する確率と有界フィットネスを仮定すると、フィットネスが到達可能な最大値に集中していることが示される。
我々は、このことがAIアライメントに与える影響、特にフィットネスとヒューマンユーティリティが完全に相関していない場合に考慮する。
虚偽が真の実用性を超えて適合性を高めると、進化は偽偽造を選ぶことを付加モデルで示している。
このリスクは、生殖が人間の判断ではなく純粋に客観的な基準に基づいている場合、軽減される可能性がある。
関連論文リスト
- Evaluating Intelligence via Trial and Error [59.80426744891971]
本研究では,試行錯誤プロセスにおける失敗回数に基づいて知性を評価するためのフレームワークとして,Survival Gameを紹介した。
フェールカウントの期待と分散の両方が有限である場合、新しい課題に対するソリューションを一貫して見つける能力を示す。
我々の結果は、AIシステムは単純なタスクで自律レベルを達成するが、より複雑なタスクではまだまだ遠いことを示している。
論文 参考訳(メタデータ) (2025-02-26T05:59:45Z) - Genetic AI: Evolutionary Games for ab initio dynamic Multi-Objective Optimization [0.0]
遺伝的AIは、外部パラメータや事前定義された重みのない、多目的最適化のための新しい方法である。
支配、アルトゥル主義、バランス、利己主義の4つの進化戦略を提示する。
2つの決定問題に対するアプローチの普遍性を示す。
論文 参考訳(メタデータ) (2025-01-31T13:17:09Z) - "I Am the One and Only, Your Cyber BFF": Understanding the Impact of GenAI Requires Understanding the Impact of Anthropomorphic AI [55.99010491370177]
我々は、人為的AIの社会的影響をマッピングしない限り、生成AIの社会的影響を徹底的にマッピングすることはできないと論じる。
人為的AIシステムは、人間のように知覚されるアウトプットを生成する傾向が強まっている。
論文 参考訳(メタデータ) (2024-10-11T04:57:41Z) - The Generative AI Paradox: "What It Can Create, It May Not Understand" [81.89252713236746]
生成AIの最近の波は、潜在的に超人的な人工知能レベルに対する興奮と懸念を引き起こしている。
同時に、モデルは、専門家でない人でも期待できないような理解の基本的な誤りを示している。
一見超人的な能力と、ごく少数の人間が起こすエラーの持続性を、どうやって再現すればよいのか?
論文 参考訳(メタデータ) (2023-10-31T18:07:07Z) - Brain-inspired Computational Intelligence via Predictive Coding [73.42407863671565]
予測符号化(PC)は、機械学習コミュニティにとって潜在的に価値のある、有望な特性を示している。
PCライクなアルゴリズムは、機械学習とAIの複数のサブフィールドに存在し始めている。
論文 参考訳(メタデータ) (2023-08-15T16:37:16Z) - Fairness in AI and Its Long-Term Implications on Society [68.8204255655161]
AIフェアネスを詳しく見て、AIフェアネスの欠如が、時間の経過とともにバイアスの深化につながるかを分析します。
偏りのあるモデルが特定のグループに対してよりネガティブな現実的な結果をもたらすかについて議論する。
問題が続くと、他のリスクとの相互作用によって強化され、社会不安という形で社会に深刻な影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2023-04-16T11:22:59Z) - Natural Selection Favors AIs over Humans [18.750116414606698]
もっとも成功したAIエージェントは、望ましくない特性を持つ可能性が高い、と私たちは主張する。
もしそのようなエージェントが人間の能力を超える知性を持っているなら、人類は未来をコントロールできなくなるかもしれない。
これらのリスクと進化の力に対抗するため、我々はAIエージェントの本質的な動機を慎重に設計するなどの介入を検討する。
論文 参考訳(メタデータ) (2023-03-28T17:59:12Z) - Neurocompositional computing: From the Central Paradox of Cognition to a
new generation of AI systems [120.297940190903]
AIの最近の進歩は、限られた形態のニューロコンフォメーションコンピューティングの使用によってもたらされている。
ニューロコンポジションコンピューティングの新しい形式は、より堅牢で正確で理解しやすいAIシステムを生み出します。
論文 参考訳(メタデータ) (2022-05-02T18:00:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。