論文の概要: Q-Learning-Driven Adaptive Rewiring for Cooperative Control in Heterogeneous Networks
- arxiv url: http://arxiv.org/abs/2509.01057v2
- Date: Wed, 03 Sep 2025 03:24:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.521115
- Title: Q-Learning-Driven Adaptive Rewiring for Cooperative Control in Heterogeneous Networks
- Title(参考訳): 不均一ネットワークにおける協調制御のためのQラーニング駆動適応リウィリング
- Authors: Yi-Ning Weng, Hsuan-Wei Lee,
- Abstract要約: そこで本研究では,本論文で研究されるメカニズムに基づく適応的リウィリングのQラーニングに基づく変種を提案する。
ネットワーク構成を体系的に探索することで,完全適応的なリワイアリングにより協調レベルが向上することを示す。
本研究は,複雑な適応システムにおけるインテリジェンス駆動の協調パターン形成を理解するための新しいパラダイムを構築した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cooperation emergence in multi-agent systems represents a fundamental statistical physics problem where microscopic learning rules drive macroscopic collective behavior transitions. We propose a Q-learning-based variant of adaptive rewiring that builds on mechanisms studied in the literature. This method combines temporal difference learning with network restructuring so that agents can optimize strategies and social connections based on interaction histories. Through neighbor-specific Q-learning, agents develop sophisticated partnership management strategies that enable cooperator cluster formation, creating spatial separation between cooperative and defective regions. Using power-law networks that reflect real-world heterogeneous connectivity patterns, we evaluate emergent behaviors under varying rewiring constraint levels, revealing distinct cooperation patterns across parameter space rather than sharp thermodynamic transitions. Our systematic analysis identifies three behavioral regimes: a permissive regime (low constraints) enabling rapid cooperative cluster formation, an intermediate regime with sensitive dependence on dilemma strength, and a patient regime (high constraints) where strategic accumulation gradually optimizes network structure. Simulation results show that while moderate constraints create transition-like zones that suppress cooperation, fully adaptive rewiring enhances cooperation levels through systematic exploration of favorable network configurations. Quantitative analysis reveals that increased rewiring frequency drives large-scale cluster formation with power-law size distributions. Our results establish a new paradigm for understanding intelligence-driven cooperation pattern formation in complex adaptive systems, revealing how machine learning serves as an alternative driving force for spontaneous organization in multi-agent networks.
- Abstract(参考訳): マルチエージェントシステムにおける協調の出現は、微視的学習規則がマクロ的な集団的行動遷移を駆動する基本的な統計物理問題である。
そこで本研究では,本論文で研究されるメカニズムに基づく適応的リウィリングのQラーニングに基づく変種を提案する。
本手法は時間差学習とネットワーク再構成を組み合わせることで,インタラクション履歴に基づいてエージェントが戦略や社会的つながりを最適化する。
隣り合ったQ-ラーニングを通じて、エージェントは協調的なクラスタ形成を可能にする高度なパートナーシップ管理戦略を開発し、協調的な領域と欠陥のある領域を空間的に分離する。
実世界のヘテロジニアス接続パターンを反映したパワーローネットワークを用いて、変動する制約レベルの下での創発的挙動を評価し、鋭い熱力学遷移ではなくパラメータ空間間で異なる協調パターンを明らかにする。
組織的分析では, 迅速な協調クラスタ形成を可能にする許容的体制(低制約), ジレンマ強度に敏感な中間体制(高制約), 戦略的集積がネットワーク構造を徐々に最適化する患者体制(高制約)の3つの行動体制を同定した。
シミュレーションの結果, 適度な制約は, 協調を抑制した遷移型ゾーンを生成する一方で, 完全適応リワイアリングは, ネットワーク構成の体系的探索を通じて協調レベルを向上することがわかった。
定量的解析により、スイッチング周波数の増加は、パワー・ローサイズの分布を伴う大規模クラスタ形成を誘導することが明らかとなった。
本研究は,複雑な適応システムにおけるインテリジェンス駆動の協調パターン形成を理解するための新しいパラダイムを構築し,機械学習がマルチエージェントネットワークにおける自発的な組織構築の代替的推進力としてどのように機能するかを明らかにする。
関連論文リスト
- Power Grid Control with Graph-Based Distributed Reinforcement Learning [60.49805771047161]
この作業は、リアルタイムでスケーラブルなグリッド管理のためのグラフベースの分散強化学習フレームワークを前進させる。
グラフニューラルネットワーク(GNN)を使用して、ネットワークのトポロジ情報を単一の低レベルエージェントの観測内にエンコードする。
Grid2Opシミュレーション環境での実験は、このアプローチの有効性を示している。
論文 参考訳(メタデータ) (2025-09-02T22:17:25Z) - Synchronization Dynamics of Heterogeneous, Collaborative Multi-Agent AI Systems [0.0]
本稿では,同期理論とマルチエージェントAIシステムを橋渡しする新たな学際的枠組みを提案する。
我々は,複雑なタスク実行に関わる異種AIエージェントの集合力学を記述するために,倉本モデルを適用した。
論文 参考訳(メタデータ) (2025-08-17T10:16:41Z) - Connecting the geometry and dynamics of many-body complex systems with message passing neural operators [1.8434042562191815]
我々は,多体複雑なシステムのマルチスケール進化演算子を学習するためのスケーラブルなAIフレームワークであるROMAを紹介する。
注意機構は局所部分グラフの幾何学的表現と動的演算子の接続によるマルチスケール相互作用のモデル化に使用される。
我々はROMAフレームワークが予測タスクと効果的な動的タスク間のスケーラビリティとポジティブな転送を改善することを実証した。
論文 参考訳(メタデータ) (2025-02-21T20:04:09Z) - Evolving Neural Networks Reveal Emergent Collective Behavior from Minimal Agent Interactions [0.0]
ニューラルネットワークが動的環境におけるエージェントの行動を制御するためにどのように進化するかを検討する。
レーン形成や層流のような単純な挙動は、より線形なネットワーク操作によって特徴づけられる。
中程度のノイズ、広い視野、低いエージェント密度といった特定の環境パラメータは、非線形ネットワークの進化を促進する。
論文 参考訳(メタデータ) (2024-10-25T17:43:00Z) - Navigating the swarm: Deep neural networks command emergent behaviours [2.7059353835118602]
エージェント間相互作用ルールを微調整することにより,グローバルなパターンを意図した集合行動の協調構造を生成することができることを示す。
私たちの戦略では、望ましい構造を指示する相互作用ルールを見つけるために、ダイナミックスの法則に従うディープニューラルネットワークを採用しています。
本研究は, ロボット群操作, アクティブ物質組織, 生体システムにおける不明瞭な相互作用規則の解明における新たな応用の道を開くものである。
論文 参考訳(メタデータ) (2024-07-16T02:46:11Z) - Distributed Autonomous Swarm Formation for Dynamic Network Bridging [40.27919181139919]
離散化された部分観測可能なマルコフ決定過程(Dec-POMDP)における動的ネットワークブリッジ問題について定式化する。
グラフ畳み込み強化学習(DGN)に基づく問題に対するマルチエージェント強化学習(MARL)アプローチを提案する。
提案手法はシミュレーション環境で評価し,将来性を示す集中型ベースラインと比較した。
論文 参考訳(メタデータ) (2024-04-02T01:45:03Z) - Leveraging Low-Rank and Sparse Recurrent Connectivity for Robust
Closed-Loop Control [63.310780486820796]
繰り返し接続のパラメータ化が閉ループ設定のロバスト性にどのように影響するかを示す。
パラメータが少ないクローズドフォーム連続時間ニューラルネットワーク(CfCs)は、フルランクで完全に接続されたニューラルネットワークよりも優れています。
論文 参考訳(メタデータ) (2023-10-05T21:44:18Z) - A game-theoretic analysis of networked system control for common-pool
resource management using multi-agent reinforcement learning [54.55119659523629]
マルチエージェント強化学習は近年,ネットワーク型システム制御へのアプローチとして大きな可能性を秘めている。
共通プールの資源は耕作可能な土地、淡水、湿地、野生生物、魚類資源、森林、大気である。
論文 参考訳(メタデータ) (2020-10-15T14:12:26Z) - An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。
この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文 参考訳(メタデータ) (2020-06-19T22:05:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。