論文の概要: Evolving Personalities in Chaos: An LLM-Augmented Framework for Character Discovery in the Iterated Prisoners Dilemma under Environmental Stress
- arxiv url: http://arxiv.org/abs/2601.02407v1
- Date: Thu, 01 Jan 2026 18:34:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.634462
- Title: Evolving Personalities in Chaos: An LLM-Augmented Framework for Character Discovery in the Iterated Prisoners Dilemma under Environmental Stress
- Title(参考訳): カオスにおけるパーソナリティの進化:環境ストレス下における反復的囚人ジレンマにおける文字発見のためのLLM拡張フレームワーク
- Authors: Oguzhan Yildirim,
- Abstract要約: カオス的条件下で進化した戦略は、優れたレジリエンスを示し、行動表現型を示すことを示す。
この作業は、進化的計算を説明可能なAIでブリッジし、マルチエージェントシステムにおける自動エージェントキャラクタリゼーションのためのテンプレートを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Standard simulations of the Iterated Prisoners Dilemma (IPD) operate in deterministic, noise-free environments, producing strategies that may be theoretically optimal but fragile when confronted with real-world uncertainty. This paper addresses two critical gaps in evolutionary game theory research: (1) the absence of realistic environmental stressors during strategy evolution, and (2) the Interpretability Gap, where evolved genetic strategies remain opaque binary sequences devoid of semantic meaning. We introduce a novel framework combining stochastic environmental perturbations (God Mode) with Large Language Model (LLM)-based behavioral profiling to transform evolved genotypes into interpretable character archetypes. Our experiments demonstrate that strategies evolved under chaotic conditions exhibit superior resilience and present distinct behavioral phenotypes, ranging from Ruthless Capitalists to Diplomatic Enforcers. These phenotypes are readily classified by LLMs but remain nearly impossible to interpret through manual genome inspection alone. This work bridges evolutionary computation with explainable AI and provides a template for automated agent characterization in multi-agent systems.
- Abstract(参考訳): 反復囚人ジレンマ(IPD)の標準的なシミュレーションは、決定論的でノイズのない環境で動作し、理論上最適であるが現実の不確実性に直面した場合に脆弱な戦略を生成する。
本稿では,進化型ゲーム理論研究において,(1)戦略進化における現実的な環境ストレスの欠如,(2)進化型遺伝的戦略が意味を欠く不透明なバイナリ配列に留まる解釈可能性ギャップという2つの重要なギャップについて論じる。
確率的環境摂動(ゴッドモード)とLarge Language Model(LLM)に基づく行動プロファイリングを組み合わせた新しい枠組みを導入し、進化したジェノタイプを解釈可能な文字アーキタイプに変換する。
我々の実験は、カオス条件下での戦略が優れたレジリエンスを示し、Ruthless Capitalists から Diplomatic Enforcers まで異なる行動表現型を示すことを示した。
これらの表現型はLLMによって容易に分類されるが、手動のゲノム検査だけでは解釈がほとんど不可能である。
この作業は、進化的計算を説明可能なAIでブリッジし、マルチエージェントシステムにおける自動エージェントキャラクタリゼーションのためのテンプレートを提供する。
関連論文リスト
- Managing Ambiguity: A Proof of Concept of Human-AI Symbiotic Sense-making based on Quantum-Inspired Cognitive Mechanism of Rogue Variable Detection [39.146761527401424]
この研究は、あいまいさを一級構成とすることで管理理論に寄与する。
VUCA環境における組織的レジリエンスに対する人間-AI共生の実践的価値を示す。
論文 参考訳(メタデータ) (2025-12-17T11:23:18Z) - Grounded Test-Time Adaptation for LLM Agents [75.62784644919803]
大規模言語モデル(LLM)ベースのエージェントは、新規で複雑な環境への一般化に苦慮している。
環境特化情報を活用することで, LLMエージェントを適応するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2025-11-06T22:24:35Z) - Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents [58.69865074060139]
エージェントの自己進化が意図しない方法で逸脱し、望ましくない結果や有害な結果に至る場合について検討する。
我々の経験から、誤進化は広範囲にわたるリスクであり、最上位のLSM上に構築されたエージェントにも影響を及ぼすことが判明した。
我々は、より安全で信頼性の高い自己進化型エージェントを構築するためのさらなる研究を促すための潜在的な緩和戦略について議論する。
論文 参考訳(メタデータ) (2025-09-30T14:55:55Z) - From Pheromones to Policies: Reinforcement Learning for Engineered Biological Swarms [0.0]
本研究では, フェロモンを介するセロモン凝集と強化学習(RL)の理論的等価性を確立する。
我々は,フェロモンが数学的に相互学習の更新を反映していることを示し,捕食作業を行う線虫群をモデル化した。
この結果から, 環境信号が外部メモリとして機能する分散RLプロセスは, スティグマイシン系が本質的にコード化されていることが示唆された。
論文 参考訳(メタデータ) (2025-09-24T13:16:35Z) - Predictability Shapes Adaptation: An Evolutionary Perspective on Modes of Learning in Transformers [51.992454203752686]
トランスフォーマーモデルは、IWL(In-weights Learning)とICL(In-context Learning)の2つの異なるモードで学習する。
我々は進化生物学の類似した適応戦略である遺伝的エンコーディングと表現型可塑性からインスピレーションを得ている。
我々はこれらの予測可能性の次元を実験的に運用し、トランスフォーマーのICL/IWLバランスへの影響について検討する。
論文 参考訳(メタデータ) (2025-05-14T23:31:17Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - Agent Alignment in Evolving Social Norms [65.45423591744434]
本稿では,エージェント進化とアライメントのための進化的フレームワークであるEvolutionaryAgentを提案する。
社会規範が継続的に進化する環境では、エージェントは現在の社会規範に適応し、生存と増殖の確率が高くなる。
進化的エージェントは、一般的なタスクにおいてその能力を維持しながら、進化する社会規範と徐々に整合できることを示す。
論文 参考訳(メタデータ) (2024-01-09T15:44:44Z) - The Quality-Diversity Transformer: Generating Behavior-Conditioned
Trajectories with Decision Transformers [3.185440619417202]
品質多様性アルゴリズムは、多様かつ効率的なポリシーのレパートリーを生成するのに有効であることが証明されている。
不確実な環境では、ポリシーは堅牢性と再現性に欠ける可能性がある。
本稿では,2つのメカニズムに基づく行動条件付き軌道生成を実現するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-27T19:39:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。