論文の概要: Body-Reservoir Governance in Repeated Games: Embodied Decision-Making, Dynamic Sentinel Adaptation, and Complexity-Regularized Optimization
- arxiv url: http://arxiv.org/abs/2602.20846v1
- Date: Tue, 24 Feb 2026 12:36:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.748348
- Title: Body-Reservoir Governance in Repeated Games: Embodied Decision-Making, Dynamic Sentinel Adaptation, and Complexity-Regularized Optimization
- Title(参考訳): 繰り返しゲームにおけるボディー・Reservoirガバナンス--身体的意思決定、動的センチネル適応、複雑度規則化最適化
- Authors: Yuki Nakamura,
- Abstract要約: 本稿では,3層構造であるBody-Reservoirガバナンスアーキテクチャを提案する。
戦略複雑性コストは、貯水池の状態分布と習慣化されたベースラインとのKLの分岐として定義される。
ボディガバナンスは、このコストを削減し、アクションの分散は、次元$d$の1600Times$まで減少します。
体をオーバーライドすると、内部状態の歪みに比例して熱力学的コストが発生する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Standard game theory explains cooperation in repeated games through conditional strategies such as Tit-for-Tat (TfT), but these require continuous computation that imposes physical costs on embodied agents. We propose a three-layer Body-Reservoir Governance (BRG) architecture: (1) a body reservoir (echo state network) whose $d$-dimensional state performs implicit inference over interaction history, serving as both decision-maker and anomaly detector, (2) a cognitive filter providing costly strategic tools activated on demand, and (3) a metacognitive governance layer with receptivity parameter $α\in [0,1]$. At full body governance ($α=1$), closed-loop dynamics satisfy a self-consistency equation: cooperation is expressed as the reservoir's fixed point, not computed. Strategy complexity cost is defined as the KL divergence between the reservoir's state distribution and its habituated baseline. Body governance reduces this cost, with action variance decreasing up to $1600\times$ with dimension $d$. A dynamic sentinel generates a composite discomfort signal from the reservoir's own state, driving adaptive $α(t)$: near baseline during cooperation, rapidly dropping upon defection to activate cognitive retaliation. Overriding the body incurs thermodynamic cost proportional to internal state distortion. The sentinel achieves the highest payoff across all conditions, outperforming static body governance, TfT, and EMA baselines. A dimension sweep ($d \in \{5,\ldots,100\}$) shows implicit inference scales with bodily richness ($23\times$ to $1600\times$ variance reduction), attributable to reservoir dynamics. A phase diagram in $(d, τ_{\mathrm{env}})$ space reveals governance regime transitions near $d \approx 20$. The framework reinterprets cooperation as the minimum-dissipation response of an adapted dynamical system -- emergent from embodied dynamics rather than computed.
- Abstract(参考訳): 標準的なゲーム理論は、Tit-for-Tat (TfT)のような条件付き戦略を通じて繰り返しゲームにおける協調を説明するが、これらはエンボディエージェントに物理的コストを課す連続計算を必要とする。
本稿では,(1)$d$次元の状態が相互作用履歴に対して暗黙的な推論を行う身体貯水池 (echo state network) アーキテクチャ,(2)需要に応じて活性化される高価な戦略ツールを提供する認知フィルタ,(3)受容パラメータが$α\in [0,1]$のメタ認知的ガバナンス層を提案する。
完全なボディガバナンス(α=1$)では、閉ループ力学は自己整合方程式を満たす: 協調は貯水池の固定点として表され、計算されない。
戦略複雑性コストは、貯水池の状態分布と習慣化されたベースラインとのKLの分岐として定義される。
ボディガバナンスは、このコストを削減し、アクションの分散は、次元$d$の1600\times$まで減少します。
動的センチネルは貯水池自身の状態から複合的な不快信号を生成し、協調中に適応的な$α(t)$:をベースライン付近で駆動し、欠陥によって急速に低下して認知的報復を活性化する。
体をオーバーライドすると、内部状態の歪みに比例して熱力学的コストが発生する。
センチネルは、静的ボディガバナンス、TfT、EMAベースラインよりも優れたパフォーマンスで、すべての条件で最も高いペイオフを達成する。
次元スイープ(d \in \{5,\ldots,100\}$)は、暗黙の推論スケール(23\times$ to $1600\times$ variance reduction)で、貯水池力学に起因する。
a phase diagram in $(d, τ_{\mathrm{env}})$ space reveals governance regime transitions near $d \approx 20$。
このフレームワークは、協調を、適応された力学系の最小散逸応答として再解釈する。
関連論文リスト
- Constrained Dynamic Gaussian Splatting [47.982650444869336]
Constrained Dynamic Gaussian Splatting (CDGS)は、動的シーン再構成を予算制約付き最適化問題として定式化する新しいフレームワークである。
本報告では,CDGSは,最先端手法に比べて3倍以上の圧縮を実現し,キャパシティの限界下で最適なレンダリング品質を提供することを示す。
論文 参考訳(メタデータ) (2026-02-03T13:53:29Z) - Phase Transition for Budgeted Multi-Agent Synergy [41.486076708302456]
マルチエージェントシステムは信頼性を向上させることができるが、固定された推論予算の下では、しばしば役立つか、飽和するか、崩壊するかさえある。
我々は、現代のエージェントスタックの3つの束縛制約からこれらの状態を予測する最小限の校正可能な理論を開発する。
論文 参考訳(メタデータ) (2026-01-24T05:32:50Z) - Balancing Centralized Learning and Distributed Self-Organization: A Hybrid Model for Embodied Morphogenesis [0.0]
本研究では,学習可能な脳様のコントローラを細胞様のグレースコット基質に結合して,最小限の努力でステアパターン形成を行う方法について検討する。
コンパクトな畳み込みポリシは、微分可能なPyTorch反応拡散シミュレータに埋め込まれる。
論文 参考訳(メタデータ) (2025-11-13T09:05:27Z) - Comprehensive Validation of Replica Symmetry Breaking via Quantum Annealing: From Ground States to Topological Collapse [0.0]
我々はジョルジョ・パリシのシェリントン・カークパトリックスピンガラスの正確な解を4000スピンに拡張する。
レプリカ対称性の破れの出現と崩壊を調査する。
この包括的検証は、複素系における基本的な統計力学を探索するための量子的優位性を確立する。
論文 参考訳(メタデータ) (2025-11-09T14:33:22Z) - Hierarchical Federated Graph Attention Networks for Scalable and Resilient UAV Collision Avoidance [0.5505634045241287]
衝突回避を実践するためにバランスをとる必要がある最も重要な指標は、リアルタイムのパフォーマンス、敵のレジリエンス、プライバシー保護である。
我々は適応型微分プライバシー機構を提案し,実時間脅威の評価に基づいて雑音レベル$(in [0.1, 1.0])$を動的に低減する。
このアーキテクチャは500UAVのスケーラブルなシナリオを提供し、衝突速度は2.0%$、ビザンティンの耐障害性は$f n/3$である。
論文 参考訳(メタデータ) (2025-11-05T12:01:00Z) - Rational Adversaries and the Maintenance of Fragility: A Game-Theoretic Theory of Rational Stagnation [0.0]
本稿では、合理的な敵によって維持される均衡として、そのような「合理的な停滞」を説明する。
ソーシャルメディアのアルゴリズムや政治的信頼への応用は、敵が故意に合理性を維持する方法を示している。
論文 参考訳(メタデータ) (2025-10-25T09:28:15Z) - On Tractable $Φ$-Equilibria in Non-Concave Games [53.212133025684224]
非コンケーブゲームにおいて、抽出可能な$Phi$-equilibriaについて検討する。
Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。
論文 参考訳(メタデータ) (2024-03-13T01:51:30Z) - Optimization of Time-Dependent Decoherence Rates and Coherent Control
for a Qutrit System [77.34726150561087]
非コヒーレント制御は、特定の制御方法で時間に応じてデコヒーレンス率を決定する。
我々は、システムの最終状態$rho(T)$と与えられたターゲット状態$rho_rmターゲットとの間のヒルベルト・シュミットの重なりを最大化する問題を考察する。
論文 参考訳(メタデータ) (2023-08-08T01:28:50Z) - Robust Online Control with Model Misspecification [96.23493624553998]
本研究では,未知の非線形力学系のモデル不特定性を考慮したオンライン制御について検討する。
本研究は, 線形近似からの偏差を許容できる程度に測定できるロバスト性に着目した。
論文 参考訳(メタデータ) (2021-07-16T07:04:35Z) - Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。
本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。
より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文 参考訳(メタデータ) (2021-05-25T19:48:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。