論文の概要: Personality Requires Struggle: Three Regimes of the Baldwin Effect in Neuroevolved Chess Agents
- arxiv url: http://arxiv.org/abs/2604.03565v1
- Date: Sat, 04 Apr 2026 03:16:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.643946
- Title: Personality Requires Struggle: Three Regimes of the Baldwin Effect in Neuroevolved Chess Agents
- Title(参考訳): 神経進化型チェス剤におけるバルドウィン効果の3つのレギュム
- Authors: Diego Armando Resendez Prado,
- Abstract要約: 以前の理論では、可塑性は環境騒音に対して生物を緩衝することによって分散を減少させると予測されていた。
8つのNEAT進化型ニューラルモジュールを持つチェスエージェント、ゲーム内可塑性のHebbian、想像力を持った望ましくないドメインシグナルチェーン。
- 参考スコア(独自算出の注目度): 0.3867363075280543
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Can lifetime learning expand behavioral diversity over evolutionary time, rather than collapsing it? Prior theory predicts that plasticity reduces variance by buffering organisms against environmental noise. We test this in a competitive domain: chess agents with eight NEAT-evolved neural modules, Hebbian within-game plasticity, and a desirability-domain signal chain with imagination. Across 10~seeds per Hebbian condition, a variance crossover emerges: Hebbian ON starts with lower cross-seed variance than OFF, then surpasses it at generation~34. The crossover trend is monotonic (\r{ho} = 0.91, p < 10^{-6): plasticity's effect on behavioral variance reverses over evolutionary time, initially compressing diversity (consistent with prior predictions) then expanding it as evolved Perception differences are amplified through imagination -- a feedback loop that mutation alone cannot sustain. The result is structured behavioral divergence: evolved agents select different moves on the same positions (62\% disagreement), develop distinct opening repertoires, piece preferences, and game lengths. These are not different sampling policies -- they are reproducible behavioral signatures (ICC > 0.8) with interpretable signal chain configurations. Three regimes appear depending on opponent type: exploration (Hebbian ON, heterogeneous opponent), lottery (Hebbian OFF, elitism lock-in), and transparent (same-model opponent, brain self-erasure). The transparent regime generates a falsifiable prediction: self-play systems may systematically suppress behavioral diversity by eliminating the heterogeneity that personality requires. \textbf{Keywords: Baldwin Effect, neuroevolution, NEAT, Hebbian learning, chess, cognitive architecture, personality emergence, imagination
- Abstract(参考訳): 生涯学習は進化の時間を超えて行動の多様性を拡大できるのか?
以前の理論では、可塑性は環境騒音に対して生物を緩衝することによって分散を減少させると予測されていた。
8つのNEAT進化型ニューラルモジュールを持つチェスエージェント、ゲーム内可塑性のHebbian、想像力を持った望ましくないドメインシグナルチェーン。
ヘビアン On は、OF よりも低いクロスシード分散から始まり、それから世代~34 でそれを上回る。
クロスオーバートレンドはモノトニック(\r{ho} = 0.91, p < 10^{-6): 塑性が行動分散に与える影響は、進化時間とともに逆転し、最初は多様性を圧縮し(以前の予測と一致)、進化と共にそれを拡張する。知覚差は、想像力によって増幅される -- 突然変異だけでは持続できないフィードバックループである。結果として、構造化された振る舞いのばらつき: 進化的エージェントは同じ位置で異なる動き(62\%の一致)を選択し、異なるオープンレパートリー、ピース選好、ゲーム長を開発する。これらは異なるサンプリングポリシーではない。それらは、解釈可能な信号チェーン構成を持つ再現可能な行動シグネチャ(ICC > 0.8)である。
探索(ヘビアンオン、異種相手)、宝くじ(ヘビアンオフ、エリート主義ロックイン)、透明(サメモデル相手、脳自己評価)の3つの体制が存在する。
自己プレイシステムは、パーソナリティが要求する不均一性を排除することによって、行動の多様性を体系的に抑制することができる。
\textbf{Keywords: Baldwin effect, Neuroevolution, NEAT, Hebbian learning, chess, Cognitive Architecture, personality appearance,imagation
関連論文リスト
- Engineering Verifiable Modularity in Transformers via Per-Layer Supervision [0.0]
分散冗長性は損傷を補うため、資本化にとって重要なものとして認識される注目ヘッドを非難することは、最小限の行動変化をもたらす。
アーキテクチャの介入が隠されたモジュール性を公開することを実証します。
このことは、受動的観察から能動的制御への解釈可能性変換の方法論を台無しにしている。
論文 参考訳(メタデータ) (2026-03-08T05:18:14Z) - Investigating VLM Hallucination from a Cognitive Psychology Perspective: A First Step Toward Interpretation with Intriguing Observations [60.63340688538124]
幻覚は、視覚言語モデル(VLM)で積極的に研究されている長年の問題である。
既存の研究は、幻覚は技術的な制限や梅毒のバイアスによるもので、後者はモデルがユーザの期待に沿う誤った回答を生み出す傾向があることを意味している。
本研究では, VLMの認知バイアスを分類し, サイコフィナンシー, 論理的不整合, 新たに同定された VLM の行動, 権威へのアピールなど, 幻覚へと導く。
論文 参考訳(メタデータ) (2025-07-03T19:03:16Z) - Adversarial Coevolutionary Illumination with Generational Adversarial MAP-Elites [3.4524024382493774]
QD(Quality-Diversity)アルゴリズムは、振る舞い空間にまたがる多様なハイパフォーマンスなソリューションを見つけ出そうとする。
本稿では,各世代でどの側が進化するかを交互に比較することによって,両面を進化させる共進化QDアルゴリズムであるジェネレーション・アドバイサルMAP-Elites(GAME)を提案する。
論文 参考訳(メタデータ) (2025-05-10T12:00:48Z) - EgoAgent: A Joint Predictive Agent Model in Egocentric Worlds [119.02266432167085]
EgoAgentは単一変換器内での表現、予測、動作を同時に学習する統合エージェントモデルである。
EgoAgentは、タスクをインターリーブされた状態とアクションのシーケンスとして定式化することで、これらの能力間の因果的および時間的依存関係を明示的にモデル化する。
EgoAgentの画像分類,エゴセントリックな将来の状態予測,3次元人間の動作予測といった代表的課題に対する総合的な評価は,本手法の優位性を示している。
論文 参考訳(メタデータ) (2025-02-09T11:28:57Z) - ADIOS: Antibody Development via Opponent Shaping [49.26728828005039]
抗ウイルス療法は通常、ウイルスの現在の株のみを標的とするように設計されている。
しかし、治療によって誘導される選択的圧力は、新しいウイルス株の出現を引き起こす。
私たちの治療法はウイルスの進化を防御し、積極的に影響を及ぼすことができます。
論文 参考訳(メタデータ) (2024-09-16T14:56:27Z) - DARLEI: Deep Accelerated Reinforcement Learning with Evolutionary
Intelligence [77.78795329701367]
本稿では,進化アルゴリズムと並列化強化学習を組み合わせたフレームワークであるDARLEIを提案する。
我々はDARLEIの性能を様々な条件で特徴付け、進化形態の多様性に影響を与える要因を明らかにした。
今後DARLEIを拡張して、よりリッチな環境における多様な形態素間の相互作用を取り入れていきたいと考えています。
論文 参考訳(メタデータ) (2023-12-08T16:51:10Z) - Learning signatures of decision making from many individuals playing the
same game [54.33783158658077]
我々は、個人の「行動スタイル」を符号化する表現を学習する予測フレームワークを設計する。
我々は,3本腕のバンディットタスクを行う1,000人の人間による大規模行動データセットに本手法を適用した。
論文 参考訳(メタデータ) (2023-02-21T21:41:53Z) - The Introspective Agent: Interdependence of Strategy, Physiology, and
Sensing for Embodied Agents [51.94554095091305]
本論では, 環境の文脈において, 自己能力を考慮した内省的エージェントについて論じる。
自然と同じように、私たちは戦略を1つのツールとして再編成して、環境において成功させたいと考えています。
論文 参考訳(メタデータ) (2022-01-02T20:14:01Z) - Evolutionary Strategies with Analogy Partitions in p-guessing Games [0.0]
不安定なpゲーム環境における学習のダイナミクスを研究するために,学習の進化過程を導入する。
我々の遺伝的アルゴリズムは、ナッシュ平衡に収束して、持続的な環境における過去の結果と一貫して振る舞うことを示す。
論文 参考訳(メタデータ) (2021-03-26T10:28:23Z) - A multi-agent evolutionary robotics framework to train spiking neural
networks [35.90048588096738]
スパイクニューラルネットワーク(snn)を訓練するための新しいマルチエージェント進化ロボティクス(er)ベースのフレームワーク
SNNの集団の重みと制御するボットの形態学的パラメータは表現型として扱われる。
フレームワークのルールは、特定のボットとそのSNNを選択して、競争環境において食物を捕獲する効果に基づいて、その除去を行う。
論文 参考訳(メタデータ) (2020-12-07T07:26:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。