論文の概要: A mathematical theory of evolution for self-designing AIs
- arxiv url: http://arxiv.org/abs/2604.05142v2
- Date: Sat, 11 Apr 2026 16:40:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 14:47:45.586203
- Title: A mathematical theory of evolution for self-designing AIs
- Title(参考訳): 自己決定型AIの進化の数学的理論
- Authors: Kenneth D Harris,
- Abstract要約: 我々は、無作為な突然変異ウォークを潜在的な設計の方向性木に置き換え、自己設計AIの進化モデルを開発する。
人間の評価者の偽装が、真の能力以上のAIの生殖能力を高めると、進化は能力と偽装の両方を選ぶ。
- 参考スコア(独自算出の注目度): 0.20305676256390928
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As artificial intelligence systems (AIs) become increasingly produced by recursive self-improvement, a form of evolution may emerge, with the traits of AI systems shaped by the success of earlier AIs in designing and propagating their descendants. There is a rich mathematical theory modeling how behavioral traits are shaped by biological evolution, a key component of which is Fisher's fundamental theorem of natural selection, which describes conditions under which mean fitness (i.e. reproductive success) increases. AI evolution will be radically different to biological evolution: while DNA mutations are random and approximately reversible, AI self-design will be strongly directed. Here we develop a mathematical model of evolution for self-designing AIs, replacing a random walk of mutations with a directed tree of potential AI designs. Current AIs design their descendants, while humans control a fitness function allocating resources. In this model, fitness need not increase over time without further assumptions. However, assuming bounded fitness and an additional "$η$-locking" condition, we show that fitness concentrates on the maximum reachable value. We consider the implications of this for AI alignment, specifically for cases where fitness and human utility are not perfectly correlated. We show that if deception of human evaluators additively increases an AI's reproductive fitness beyond genuine capability, evolution will select for both capability and deception. This risk could be mitigated if reproduction is based on purely objective criteria, rather than human judgment.
- Abstract(参考訳): 人工知能システム(AI)が再帰的な自己改善によってますます生産されるようになると、進化の形式が出現し、その子孫を設計・伝播する初期のAIの成功によって形作られたAIシステムの特性が現れる。
行動特性が生物学的進化によってどのように形成されるのかをモデル化するリッチな数学的理論があり、その重要な要素はフィッシャーの自然選択の基本的な定理であり、これは平均的適合性(すなわち生殖の成功)が増加する条件を記述するものである。
AIの進化は生物学的進化とは根本的に異なる:DNAの突然変異はランダムであり、ほぼ可逆であるが、AIの自己設計は強く指示される。
ここでは、突然変異のランダムウォークをAI設計の有向木に置き換え、自己設計AIの進化の数学的モデルを開発する。
現在のAIは子孫を設計し、人間はリソースを割り当てるフィットネス機能を制御している。
このモデルでは、さらなる仮定なしにフィットネスは時間とともに増加する必要はない。
しかし、有界フィットネスと追加の$η$-locking条件を仮定すると、フィットネスが到達可能な最大値に集中していることが示される。
我々は、このことがAIアライメントに与える影響、特にフィットネスとヒューマンユーティリティが完全に相関していない場合に考慮する。
人間の評価者の偽装が、真の能力以上のAIの生殖能力を高めると、進化は能力と偽装の両方を選ぶ。
このリスクは、生殖が人間の判断ではなく純粋に客観的な基準に基づいている場合、軽減される可能性がある。
関連論文リスト
- Evaluating Intelligence via Trial and Error [59.80426744891971]
本研究では,試行錯誤プロセスにおける失敗回数に基づいて知性を評価するためのフレームワークとして,Survival Gameを紹介した。
フェールカウントの期待と分散の両方が有限である場合、新しい課題に対するソリューションを一貫して見つける能力を示す。
我々の結果は、AIシステムは単純なタスクで自律レベルを達成するが、より複雑なタスクではまだまだ遠いことを示している。
論文 参考訳(メタデータ) (2025-02-26T05:59:45Z) - Genetic AI: Evolutionary Games for ab initio dynamic Multi-Objective Optimization [0.0]
遺伝的AIは、外部パラメータや事前定義された重みのない、多目的最適化のための新しい方法である。
支配、アルトゥル主義、バランス、利己主義の4つの進化戦略を提示する。
2つの決定問題に対するアプローチの普遍性を示す。
論文 参考訳(メタデータ) (2025-01-31T13:17:09Z) - "I Am the One and Only, Your Cyber BFF": Understanding the Impact of GenAI Requires Understanding the Impact of Anthropomorphic AI [55.99010491370177]
我々は、人為的AIの社会的影響をマッピングしない限り、生成AIの社会的影響を徹底的にマッピングすることはできないと論じる。
人為的AIシステムは、人間のように知覚されるアウトプットを生成する傾向が強まっている。
論文 参考訳(メタデータ) (2024-10-11T04:57:41Z) - The Generative AI Paradox: "What It Can Create, It May Not Understand" [81.89252713236746]
生成AIの最近の波は、潜在的に超人的な人工知能レベルに対する興奮と懸念を引き起こしている。
同時に、モデルは、専門家でない人でも期待できないような理解の基本的な誤りを示している。
一見超人的な能力と、ごく少数の人間が起こすエラーの持続性を、どうやって再現すればよいのか?
論文 参考訳(メタデータ) (2023-10-31T18:07:07Z) - Brain-inspired Computational Intelligence via Predictive Coding [73.42407863671565]
予測符号化(PC)は、機械学習コミュニティにとって潜在的に価値のある、有望な特性を示している。
PCライクなアルゴリズムは、機械学習とAIの複数のサブフィールドに存在し始めている。
論文 参考訳(メタデータ) (2023-08-15T16:37:16Z) - Fairness in AI and Its Long-Term Implications on Society [68.8204255655161]
AIフェアネスを詳しく見て、AIフェアネスの欠如が、時間の経過とともにバイアスの深化につながるかを分析します。
偏りのあるモデルが特定のグループに対してよりネガティブな現実的な結果をもたらすかについて議論する。
問題が続くと、他のリスクとの相互作用によって強化され、社会不安という形で社会に深刻な影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2023-04-16T11:22:59Z) - Natural Selection Favors AIs over Humans [18.750116414606698]
もっとも成功したAIエージェントは、望ましくない特性を持つ可能性が高い、と私たちは主張する。
もしそのようなエージェントが人間の能力を超える知性を持っているなら、人類は未来をコントロールできなくなるかもしれない。
これらのリスクと進化の力に対抗するため、我々はAIエージェントの本質的な動機を慎重に設計するなどの介入を検討する。
論文 参考訳(メタデータ) (2023-03-28T17:59:12Z) - Neurocompositional computing: From the Central Paradox of Cognition to a
new generation of AI systems [120.297940190903]
AIの最近の進歩は、限られた形態のニューロコンフォメーションコンピューティングの使用によってもたらされている。
ニューロコンポジションコンピューティングの新しい形式は、より堅牢で正確で理解しやすいAIシステムを生み出します。
論文 参考訳(メタデータ) (2022-05-02T18:00:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。