論文の概要: Amortized Network Intervention to Steer the Excitatory Point Processes
- arxiv url: http://arxiv.org/abs/2310.04159v2
- Date: Mon, 15 Apr 2024 12:52:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-18 01:59:49.441751
- Title: Amortized Network Intervention to Steer the Excitatory Point Processes
- Title(参考訳): 興奮点プロセスのステアリングのための記憶ネットワーク干渉
- Authors: Zitao Song, Wendi Ren, Shuang Li,
- Abstract要約: 動的グラフ上に発生する励起点過程(すなわちイベントフロー)は、時間と空間を通じて離散事象がどのように広がるかを把握するためのきめ細かいモデルを提供する。
動的グラフ構造を変更してイベントフローを効果的に操縦する方法は、感染症の拡散を抑制する動機となる興味深い問題である。
我々はAmortized Network Interventionsフレームワークを設計し、履歴やその他のコンテキストから最適なポリシーをプールできるようにする。
- 参考スコア(独自算出の注目度): 8.15558505134853
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Excitatory point processes (i.e., event flows) occurring over dynamic graphs (i.e., evolving topologies) provide a fine-grained model to capture how discrete events may spread over time and space. How to effectively steer the event flows by modifying the dynamic graph structures presents an interesting problem, motivated by curbing the spread of infectious diseases through strategically locking down cities to mitigating traffic congestion via traffic light optimization. To address the intricacies of planning and overcome the high dimensionality inherent to such decision-making problems, we design an Amortized Network Interventions (ANI) framework, allowing for the pooling of optimal policies from history and other contexts while ensuring a permutation equivalent property. This property enables efficient knowledge transfer and sharing across diverse contexts. Each task is solved by an H-step lookahead model-based reinforcement learning, where neural ODEs are introduced to model the dynamics of the excitatory point processes. Instead of simulating rollouts from the dynamics model, we derive an analytical mean-field approximation for the event flows given the dynamics, making the online planning more efficiently solvable. We empirically illustrate that this ANI approach substantially enhances policy learning for unseen dynamics and exhibits promising outcomes in steering event flows through network intervention using synthetic and real COVID datasets.
- Abstract(参考訳): 動的グラフ(トポロジーの進化)上で発生する励起点過程(すなわちイベントフロー)は、離散事象が時間と空間を通してどのように広がるかを把握するためのきめ細かいモデルを提供する。
動的グラフ構造を変更してイベントフローを効果的に操縦する方法は興味深い問題であり、都市を戦略的に封鎖して交通渋滞を緩和し、交通光の最適化によって感染症の拡散を抑えることによって動機付けられる。
このような意思決定問題に固有の高次元性を克服し、計画の難しさに対処するために、歴史やその他の文脈から最適なポリシーをプーリングし、置換等価性を確保しつつ、ANI(Amortized Network Interventions)フレームワークを設計する。
この特性により、多様な文脈における効率的な知識の伝達と共有が可能となる。
それぞれのタスクはHステップのルックアヘッドモデルに基づく強化学習によって解決される。
ダイナミックスモデルからロールアウトをシミュレートする代わりに、動的に与えられたイベントフローの解析的平均場近似を導出し、オンラインプランニングをより効率的に解けるようにする。
このANIアプローチは、目に見えないダイナミクスに対するポリシー学習を大幅に強化し、合成および実際のCOVIDデータセットを用いたネットワーク介入によるイベントフローのステアリングにおいて有望な結果を示すことを実証的に説明します。
関連論文リスト
- Energy-Guided Data Sampling for Traffic Prediction with Mini Training Datasets [13.065729535009925]
本稿では、畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)アーキテクチャを融合して、トラフィックフローのダイナミクスを予測する革新的なソリューションを提案する。
本研究の重要な成果は,小規模な交通システムを対象としたシミュレーションから,大規模交通システムのトレーニングデータをサンプリングできることである。
論文 参考訳(メタデータ) (2024-03-27T15:57:42Z) - Online Boosting Adaptive Learning under Concept Drift for Multistream
Classification [34.64751041290346]
マルチストリーム分類は,コンセプトドリフトを伴う動的ストリーミングプロセスにおいて,迅速な適応の必要性から,重要な課題となっている。
本稿では,異なるストリーム間の動的相関を適応的に学習する新しいオンラインブースティング適応学習法を提案する。
論文 参考訳(メタデータ) (2023-12-17T23:10:39Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - GINK: Graph-based Interaction-aware Kinodynamic Planning via
Reinforcement Learning for Autonomous Driving [10.782043595405831]
都市部などの構造環境下での自律運転に深部強化学習(D)を適用するには,多くの課題がある。
本稿では,グラフに基づく意図表現と動的計画のための強化学習を効果的に組み合わせた新しいフレームワークを提案する。
この実験は,既存のベースラインと比較して,我々のアプローチの最先端性能を示すものである。
論文 参考訳(メタデータ) (2022-06-03T10:37:25Z) - Data-Driven Traffic Assignment: A Novel Approach for Learning Traffic
Flow Patterns Using a Graph Convolutional Neural Network [1.3706331473063877]
本稿では,交通ネットワークのトラフィックフローパターンを学習する新しいデータ駆動手法を提案する。
我々は、グラフ畳み込みニューラルネットワーク(GCNN)と呼ばれるニューラルネットワークベースのフレームワークを開発し、その問題を解決する。
モデルのトレーニングが完了すると、大規模ネットワークのトラフィックフローを即座に決定できる。
論文 参考訳(メタデータ) (2022-02-21T19:45:15Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - A purely data-driven framework for prediction, optimization, and control
of networked processes: application to networked SIS epidemic model [0.8287206589886881]
我々は,大規模ネットワーク上での非線形力学の同定と制御を行う演算子理論に基づくデータ駆動型フレームワークを開発した。
提案手法では、ネットワーク構造に関する事前の知識は必要とせず、状態の2段階のスナップショットのみを用いて基礎となるダイナミクスを識別する。
論文 参考訳(メタデータ) (2021-08-01T03:57:10Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。
この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文 参考訳(メタデータ) (2020-06-19T22:05:19Z) - Network Diffusions via Neural Mean-Field Dynamics [52.091487866968286]
本稿では,ネットワーク上の拡散の推論と推定のための新しい学習フレームワークを提案する。
本研究の枠組みは, ノード感染確率の正確な進化を得るために, モリ・ズワンジッヒ形式から導かれる。
我々のアプローチは、基礎となる拡散ネットワークモデルのバリエーションに対して多用途で堅牢である。
論文 参考訳(メタデータ) (2020-06-16T18:45:20Z) - Context-aware Dynamics Model for Generalization in Model-Based
Reinforcement Learning [124.9856253431878]
グローバルなダイナミクスモデルを学習するタスクを,(a)ローカルなダイナミクスをキャプチャするコンテキスト潜在ベクトルを学習し,(b)次に条件付き状態を予測するという2つの段階に分割する。
本研究では,コンテキスト潜在ベクトルに動的情報をエンコードするために,コンテキスト潜在ベクトルを前方と後方の両方のダイナミクスを予測するのに役立つような新しい損失関数を導入する。
提案手法は,既存のRL方式と比較して,様々なシミュレーションロボットや制御タスクの一般化能力に優れる。
論文 参考訳(メタデータ) (2020-05-14T08:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。