論文の概要: Emergent Specialization in Learner Populations: Competition as the Source of Diversity
- arxiv url: http://arxiv.org/abs/2601.19943v1
- Date: Fri, 16 Jan 2026 23:11:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 02:21:38.571553
- Title: Emergent Specialization in Learner Populations: Competition as the Source of Diversity
- Title(参考訳): 学習者集団における創発的特殊化--多様性の源泉としての競争
- Authors: Yuhao Li,
- Abstract要約: 我々は,学習者が自然に,競争力によって異なる環境体制のスペシャリストに分割することを示す。
競合排除とニッチ親和性追跡を組み合わせた単純な機構であるNichePopulationアルゴリズムを導入する。
提案手法は, MARLのベースラインを4.3倍, 4倍高速化する。
- 参考スコア(独自算出の注目度): 2.531259476052011
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: How can populations of learners develop coordinated, diverse behaviors without explicit communication or diversity incentives? We demonstrate that competition alone is sufficient to induce emergent specialization -- learners spontaneously partition into specialists for different environmental regimes through competitive dynamics, consistent with ecological niche theory. We introduce the NichePopulation algorithm, a simple mechanism combining competitive exclusion with niche affinity tracking. Validated across six real-world domains (cryptocurrency trading, commodity prices, weather forecasting, solar irradiance, urban traffic, and air quality), our approach achieves a mean Specialization Index of 0.75 with effect sizes of Cohen's d > 20. Key findings: (1) At lambda=0 (no niche bonus), learners still achieve SI > 0.30, proving specialization is genuinely emergent; (2) Diverse populations outperform homogeneous baselines by +26.5% through method-level division of labor; (3) Our approach outperforms MARL baselines (QMIX, MAPPO, IQL) by 4.3x while being 4x faster.
- Abstract(参考訳): 学習者の集団は、明示的なコミュニケーションや多様性のインセンティブなしに、協調的で多様な行動を開発することができるのか?
我々は、競争だけでは創発的な特殊化を誘発するのに十分であることを実証する。学習者は、生態的ニッチ理論と整合した競争力学を通して、様々な環境体制の専門家に自発的に分割する。
競合排除とニッチ親和性追跡を組み合わせた単純な機構であるNichePopulationアルゴリズムを導入する。
実世界の6つの領域(暗号通貨取引、商品価格、天気予報、太陽放射、都市交通、空気質)で検証され、コーエンのd>20の効力を有する平均特殊度指数0.75に達する。
主な発見:(1)ラムダ=0(ニッチなボーナスなし)では、学習者はSI > 0.30 を依然として達成し、真の特殊化を達成し、(2) 多様な集団は、メソッドレベルの分業によって、+26.5%の均一なベースラインを上回り、(3) MARLのベースライン(QMIX、MAPPO、IQL)は4.3倍の速さで4.3倍に向上する。
関連論文リスト
- Diverse Approaches to Optimal Execution Schedule Generation [0.0]
本稿では,品質多様性アルゴリズムMAP-Elitesの取引実行への応用について述べる。
MAP-Elitesは、単一の最適政策を探すのではなく、流動性とボラティリティの条件によって索引付けされた、多種多様な体制-特殊主義戦略のポートフォリオを生成する。
個々の専門家は行動ニッチの中で8~10%のパフォーマンス改善を達成する一方、他の細胞は劣化を示す。
論文 参考訳(メタデータ) (2026-01-29T18:41:52Z) - Enabling Population-Based Architectures for Neural Combinatorial Optimization [48.248213281039334]
我々は,Nuural Combinatorial Optimization(NCO)を,候補解の集合に作用する学習ポリシーによって明示的に人口ベースにする方法を研究する。
これらのアイデアを2つの補完的なツールで具体化します。1つは、全人口間で共有される情報を使って既存のソリューションを改善するもので、もう1つは、高品質と多様性とのバランスを明確にした新しい候補ソリューションを生成します。
論文 参考訳(メタデータ) (2026-01-13T16:19:34Z) - Discovering Quality-Diversity Algorithms via Meta-Black-Box Optimization [8.5083347559272]
品質多様性(Quality-Diversity)は、高性能なソリューションの多様な集団を生成する進化アルゴリズムのファミリーである。
メタラーニングを用いて,新しい品質多様性アルゴリズムの自動発見を提案する。
論文 参考訳(メタデータ) (2025-02-04T10:13:13Z) - NitroFusion: High-Fidelity Single-Step Diffusion through Dynamic Adversarial Training [57.20761595019967]
我々は,動的対向フレームワークを通じて高品質な生成を実現する単一ステップ拡散に対する基本的に異なるアプローチであるNitroFusionを紹介した。
本フレームワークは, (i) 動的識別器プールと, 生成品質向上のための特殊識別器グループ, (ii) 識別器過適合を防止する戦略的リフレッシュ機構, (iii) マルチスケール品質評価のためのグローバルな識別器ヘッドを組み合わせる。
論文 参考訳(メタデータ) (2024-12-02T23:20:35Z) - Expert-Token Resonance MoE: Bidirectional Routing with Efficiency Affinity-Driven Active Selection [19.365009652356793]
エキスパート-トークン共鳴(ETR)は、専門家-トークン相互作用を再想像する理論的な双方向ルーティング機構である。
ETRは、ベースラインのMoE実装と比較して、エンドツーエンドのトレーニング効率が5.4%-46.6%向上している。
論文 参考訳(メタデータ) (2024-05-24T02:50:44Z) - MaxMin-RLHF: Alignment with Diverse Human Preferences [101.57443597426374]
Reinforcement Learning from Human Feedback (RLHF) は、言語モデルと人間の嗜好を一致させる。
予測最大化アルゴリズムを用いて嗜好分布の混合を学習し、人間の嗜好をよりよく表現する。
従来のRLHFアルゴリズムよりも16%以上の勝利率向上を実現している。
論文 参考訳(メタデータ) (2024-02-14T03:56:27Z) - Generalizable Heterogeneous Federated Cross-Correlation and Instance
Similarity Learning [60.058083574671834]
本稿では,新しいFCCL+,フェデレーション相関と非ターゲット蒸留との類似性学習を提案する。
不均一な問題に対しては、無関係な公開データを通信に活用する。
局所的な更新段階における破滅的な忘れ物として、FCCL+はFederated Non Target Distillationを導入している。
論文 参考訳(メタデータ) (2023-09-28T09:32:27Z) - Equity Promotion in Online Resource Allocation [23.53645438932742]
我々は、政府のような非営利組織によって限られた、あるいは少ないリソースが管理される、典型的な非営利の環境下で、オンラインリソースの割り当てについて検討する。
我々は、到着要求者は、要求のような外部要因に関して均質であるが、人口統計のような内部属性では異質であると仮定して、内部等価性に焦点を当てる。
論文 参考訳(メタデータ) (2021-12-08T08:34:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。