論文の概要: Amortized Network Intervention to Steer the Excitatory Point Processes
- arxiv url: http://arxiv.org/abs/2310.04159v1
- Date: Fri, 6 Oct 2023 11:17:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-09 18:51:44.543472
- Title: Amortized Network Intervention to Steer the Excitatory Point Processes
- Title(参考訳): amortized network interventionによる興奮点過程の制御
- Authors: Zitao Song, Wendi Ren, Shuang Li
- Abstract要約: 本稿では,感染拡大や交通渋滞制御などの排他的プロセスを導くための大規模ネットワーク介入の課題に対処する。
提案手法は,GD-MPC(Gradient-Descent based Model Predictive Control)を取り入れ,事前の知識と制約を満たすためのポリシーの柔軟性を提供する。
- 参考スコア(独自算出の注目度): 9.166060286816755
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We tackle the challenge of large-scale network intervention for guiding
excitatory point processes, such as infectious disease spread or traffic
congestion control. Our model-based reinforcement learning utilizes neural ODEs
to capture how the networked excitatory point processes will evolve subject to
the time-varying changes in network topology. Our approach incorporates
Gradient-Descent based Model Predictive Control (GD-MPC), offering policy
flexibility to accommodate prior knowledge and constraints. To address the
intricacies of planning and overcome the high dimensionality inherent to such
decision-making problems, we design an Amortize Network Interventions (ANI)
framework, allowing for the pooling of optimal policies from history and other
contexts, while ensuring a permutation equivalent property. This property
enables efficient knowledge transfer and sharing across diverse contexts. Our
approach has broad applications, from curbing infectious disease spread to
reducing carbon emissions through traffic light optimization, and thus has the
potential to address critical societal and environmental challenges.
- Abstract(参考訳): 我々は,感染症の拡散や交通渋滞制御といった興奮点過程を誘導するための大規模ネットワーク介入の課題に取り組む。
モデルに基づく強化学習ではニューラルネットワークのODEを用いて,ネットワークトポロジの変化による興奮点過程の進化を捉える。
提案手法は,GD-MPC(Gradient-Descent based Model Predictive Control)を取り入れ,事前知識と制約を満たすためのポリシー柔軟性を提供する。
このような意思決定問題に内在する高次元を克服し,計画の複雑さに対処するため,ネットワーク介入(ani)フレームワークの設計を行い,置換同値性を確保しつつ,歴史や他の文脈からの最適ポリシーのプール化を可能にした。
この特性により、多様な文脈における効率的な知識伝達と共有が可能となる。
本手法は, 感染症の感染拡大抑制から, 交通光量最適化による二酸化炭素排出量削減まで, 幅広い応用が可能であり, 社会問題や環境問題への対処の可能性も秘めている。
関連論文リスト
- Self Expanding Convolutional Neural Networks [1.4330085996657045]
本稿では,学習中の畳み込みニューラルネットワーク(CNN)を動的に拡張する新しい手法を提案する。
我々は、単一のモデルを動的に拡張する戦略を採用し、様々な複雑さのレベルでチェックポイントの抽出を容易にする。
論文 参考訳(メタデータ) (2024-01-11T06:22:40Z) - Multi-Agent Reinforcement Learning for Power Control in Wireless
Networks via Adaptive Graphs [1.1861167902268832]
多エージェント深部強化学習(MADRL)は、電力制御のような幅広い複雑な最適化問題に対処するための有望な手法として登場した。
本稿では,これらの課題を緩和する有効な手段として,分散エージェント間の通信誘導構造としてグラフを用いることを提案する。
論文 参考訳(メタデータ) (2023-11-27T14:25:40Z) - Provably Efficient Reinforcement Learning for Online Adaptive Influence
Maximization [53.11458949694947]
本稿では,リアルタイムフィードバックに基づいてシードノードを逐次活性化する,コンテンツ依存型オンライン影響問題の適応バージョンについて検討する。
提案アルゴリズムは,最適政策を楽観的に改善しつつ,ネットワークモデルの推定を保守し,適応的にシードを選択する。
論文 参考訳(メタデータ) (2022-06-29T18:17:28Z) - Graph Neural Network Reinforcement Learning for Autonomous
Mobility-on-Demand Systems [42.08603087208381]
我々は、AMoD制御問題は自然にノードワイドな意思決定問題として位置づけられていると論じる。
グラフニューラルネットワークによるAMoDシステムの再バランスを制御するための深層強化学習フレームワークを提案する。
重要可搬性タスクに直面した場合、学習したポリシーがゼロショット転送能力を有望に示す方法を示す。
論文 参考訳(メタデータ) (2021-04-23T06:42:38Z) - On Topology Optimization and Routing in Integrated Access and Backhaul
Networks: A Genetic Algorithm-based Approach [70.85399600288737]
IABネットワークにおけるトポロジ最適化とルーティングの問題について検討する。
我々は、IABノード配置と非IABバックホールリンク分布の両方に効率的な遺伝的アルゴリズムベースのスキームを開発する。
メッシュベースのIABネットワークを実現する上での課題について論じる。
論文 参考訳(メタデータ) (2021-02-14T21:52:05Z) - Active Screening for Recurrent Diseases: A Reinforcement Learning
Approach [29.78172882606022]
我々は,Deep Q-Networks(DQN)に基づく新しい強化学習(RL)手法を提案する。
実世界の複数のネットワーク上でRLアルゴリズムを評価する。
論文 参考訳(メタデータ) (2021-01-07T21:07:35Z) - Controlling Graph Dynamics with Reinforcement Learning and Graph Neural
Networks [86.05566365115729]
本稿では,グラフ上の部分的に観測された動的過程を,限られた数の介入で制御する問題を考察する。
この問題は、ウイルス検査をスケジュールして流行を抑えるといった文脈で自然に発生する。
これを時間グラフプロセス上の決定問題として定式化する。
論文 参考訳(メタデータ) (2020-10-11T18:44:50Z) - Differentiable Causal Discovery from Interventional Data [141.41931444927184]
本稿では、介入データを活用可能なニューラルネットワークに基づく理論的基盤化手法を提案する。
提案手法は,様々な環境下での美術品の状態と良好に比較できることを示す。
論文 参考訳(メタデータ) (2020-07-03T15:19:17Z) - An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。
この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文 参考訳(メタデータ) (2020-06-19T22:05:19Z) - Network Diffusions via Neural Mean-Field Dynamics [52.091487866968286]
本稿では,ネットワーク上の拡散の推論と推定のための新しい学習フレームワークを提案する。
本研究の枠組みは, ノード感染確率の正確な進化を得るために, モリ・ズワンジッヒ形式から導かれる。
我々のアプローチは、基礎となる拡散ネットワークモデルのバリエーションに対して多用途で堅牢である。
論文 参考訳(メタデータ) (2020-06-16T18:45:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。