論文の概要: Prosociality by Coupling, Not Mere Observation: Homeostatic Sharing in an Inspectable Recurrent Artificial Life Agent
- arxiv url: http://arxiv.org/abs/2604.10760v1
- Date: Sun, 12 Apr 2026 18:09:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.203232
- Title: Prosociality by Coupling, Not Mere Observation: Homeostatic Sharing in an Inspectable Recurrent Artificial Life Agent
- Title(参考訳): 単なる観察ではなく結合による社会性:検査可能なリカレントな人工生命体におけるホメオスタティックシェアリング
- Authors: Aishik Sanyal,
- Abstract要約: ReCoN-Ipsundrumをベースとして、明示的なホメオスタットとソーシャルカップリングチャネルを追加し、厳格な自己指揮の計画を維持します。
1ステップのFoodShareToyでは、正確なソルバがデフォルト状態に対して0.91$でEATからPASSへのシャープなスイッチを見つける。
カップリングはヘルプレートとパートナーのリカバリを0から1にフリップし、救助のレイテンシを18から9ステップに削減し、相互の生存率を0.15から0.33に引き上げる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial agents can be made to "help" for many reasons, including explicit social reward, hard-coded prosocial bonuses, or direct access to another agent's internal state. Those possibilities make minimal prosocial behavior hard to interpret. Building on ReCoN-Ipsundrum, an inspectable recurrent controller with affect-coupled regulation, I add an explicit homeostat and a social coupling channel while keeping planning strictly self-directed: the agent scores only its own predicted internal state, and no partner-welfare reward term is introduced. I compare four matched conditions in two toy worlds. In a one-step FoodShareToy, an exact solver finds a sharp switch from EAT to PASS at $λ* \approx 0.91$ for the default state. In the experimental runs, the self-only and partner-observing conditions never help, whereas the affectively coupled conditions always do. In a multi-step SocialCorridorWorld, the same dissociation reappears: coupling flips help rate and partner recovery from 0 to 1 and cuts rescue latency from 18 to 9 steps, while raising mutual viability from 0.15 to 0.33. Sham lesions preserve helping, but coupling-off and shuffled-partner lesions abolish it in both tasks. A coupling sweep shows a load-dependent feasibility boundary: under low load, helping appears for $λ \geq 0.25$, whereas under medium and high loads no tested value rescues the partner within horizon. The result is a narrow claim for artificial life: in this minimal architecture, helping appears when another's need is routed into self-regulation.
- Abstract(参考訳): 人工エージェントは、明示的な社会的報酬、ハードコードされた社会的ボーナス、他のエージェントの内部状態への直接アクセスなど、多くの理由で「ヘルプ」することができる。
これらの可能性によって、社会的行動の最小化が困難になる。
ReCoN-Ipsundrumをベースとして、感情結合型リカレントコントローラを構築し、明示的なホメオスタットとソーシャルカップリングチャネルを追加し、厳密な自己指揮の計画を維持しながら、エージェントは、予測された内部状態のみをスコアし、パートナー・ウェルフェア報酬項は導入しない。
私は2つのおもちゃの世界でマッチした4つの条件を比較します。
1ステップのFoodShareToyでは、デフォルト状態に対して EAT から PASS へのシャープなスイッチが $λ* \approx 0.91$ で見つかる。
実験では、自己排他的かつパートナー保護的条件は役に立たないが、情緒的な結合的条件は常に有効である。
カップリングはヘルプレートとパートナーのリカバリを0から1にフリップし、救助のレイテンシを18から9ステップに削減し、相互の生存率を0.15から0.33に引き上げる。
シャム病変は助けを保ちますが、カップリングオフとシャッフルパートナーの病変は両方のタスクでそれを廃止します。
低負荷下では、λ \geq 0.25$の助けとなるが、中高負荷では、テストされた価値は、水平線内でパートナーを救える。
この最小限のアーキテクチャでは、他の人のニーズが自己規制へと導かれるのに役立つ。
関連論文リスト
- Tight Convergence Rates for Online Distributed Linear Estimation with Adversarial Measurements [66.94250413799232]
分散パラメータ-サーバ-ワーカー設定における乱数ベクトル$X$の推定について検討する。
主な課題は、敵の計測と非同期である。
その結果, 分散線形推定におけるロバスト性, 識別性, 統計的効率の統一的有限時間評価が得られた。
論文 参考訳(メタデータ) (2026-04-07T11:45:55Z) - ReCoN-Ipsundrum: An Inspectable Recurrent Persistence Loop Agent with Affect-Coupled Control and Mechanism-Linked Consciousness Indicator Assays [0.0]
ハンフリーのイプスンドラム仮説に触発され、ReCoN-イプスンドラムを実装した。
我々はハンフリーの準友愛を、親しみやすい制御された景観と重複する経路選択として運用する。
非有効変種は新規性に敏感である。
論文 参考訳(メタデータ) (2026-02-26T17:11:08Z) - Multi-Head Attention Is a Multi-Player Game [0.0]
クロスエントロピートレーニングは、頭の中で暗黙の潜在的なゲームを引き起こす。
勾配降下は、潜在的に非有界な非効率でナッシュ平衡に収束する。
我々はこれを GAME-LoRA として、Barlow Twins decorrelation と対数行列座標圧を組み合わせる。
論文 参考訳(メタデータ) (2026-01-31T18:49:49Z) - INC: An Indirect Neural Corrector for Auto-Regressive Hybrid PDE Solvers [61.84396402100827]
本稿では,学習した補正を支配方程式に統合する間接ニューラルコレクタ(mathrmINC$)を提案する。
$mathrmINC$は、$t-1 + L$の順番でエラー増幅を減らし、$t$はタイムステップ、$L$はリプシッツ定数である。
大規模なベンチマークで$mathrmINC$をテストし、1Dカオスシステムから3D乱流まで、多くの異なる解法、神経バックボーン、テストケースをカバーした。
論文 参考訳(メタデータ) (2025-11-16T20:14:28Z) - Co-rewarding: Stable Self-supervised RL for Eliciting Reasoning in Large Language Models [56.055015597319674]
検証可能な報酬(RLVR)を用いた強化学習は,大規模言語モデル(LLM)の推論能力の向上に有効である
近年の自己回帰法は LLM の推論能力を解き放つためのラベルフリーな代替手段について検討している。
我々は、他の視点から補完的な監督を求めることにより、トレーニングの安定性を向上させる新しい自己監督型RLフレームワークであるtextitCo-rewardingを提案する。
論文 参考訳(メタデータ) (2025-08-01T08:09:14Z) - Homeostatic Coupling for Prosocial Behavior [0.276240219662896]
ホメオスタティック・セルフレギュレーションによる自律エージェントの社会的行動の出現について検討した。
エージェント間でホメオスタティックな状態を共有するための共感的なメカニズムを導入する。
本研究は, ホメオスタティックカップリング下でのみ, 社会的行動が生じることを示す。
論文 参考訳(メタデータ) (2025-06-15T15:49:21Z) - Collaborative Mean Estimation Among Heterogeneous Strategic Agents: Individual Rationality, Fairness, and Truthful Contribution [11.371461065112422]
我々は、$m$エージェントがベクトル$mu =(mu_k, sigma2)_kin[d]$を推定しようとする協調学習問題を研究する。
独立して作業する代わりに、エージェントはデータを交換し、より安価なサンプルを収集し、コストのかかるデータと引き換えにそれらを共有できるため、コストと推定エラーの両方を削減できる。
論文 参考訳(メタデータ) (2024-07-20T17:45:40Z) - On Tractable $Φ$-Equilibria in Non-Concave Games [53.212133025684224]
非コンケーブゲームにおいて、抽出可能な$Phi$-equilibriaについて検討する。
Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。
論文 参考訳(メタデータ) (2024-03-13T01:51:30Z) - Stochastic Shortest Path with Adversarially Changing Costs [57.90236104782219]
最短経路 (SSP) は計画と制御においてよく知られた問題である。
また, 時間とともにコストの逆変化を考慮に入れた逆SSPモデルを提案する。
我々は、この自然な逆SSPの設定を最初に検討し、それに対するサブ線形後悔を得る。
論文 参考訳(メタデータ) (2020-06-20T12:10:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。