Fugu-MT 論文翻訳(概要): Amortized Network Intervention to Steer the Excitatory Point Processes

論文の概要: Amortized Network Intervention to Steer the Excitatory Point Processes

arxiv url: http://arxiv.org/abs/2310.04159v1
Date: Fri, 6 Oct 2023 11:17:28 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-09 18:51:44.543472
Title: Amortized Network Intervention to Steer the Excitatory Point Processes
Title（参考訳）: amortized network interventionによる興奮点過程の制御
Authors: Zitao Song, Wendi Ren, Shuang Li
Abstract要約: 本稿では,感染拡大や交通渋滞制御などの排他的プロセスを導くための大規模ネットワーク介入の課題に対処する。提案手法は,GD-MPC(Gradient-Descent based Model Predictive Control)を取り入れ,事前の知識と制約を満たすためのポリシーの柔軟性を提供する。
参考スコア（独自算出の注目度）: 9.166060286816755
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: We tackle the challenge of large-scale network intervention for guiding excitatory point processes, such as infectious disease spread or traffic congestion control. Our model-based reinforcement learning utilizes neural ODEs to capture how the networked excitatory point processes will evolve subject to the time-varying changes in network topology. Our approach incorporates Gradient-Descent based Model Predictive Control (GD-MPC), offering policy flexibility to accommodate prior knowledge and constraints. To address the intricacies of planning and overcome the high dimensionality inherent to such decision-making problems, we design an Amortize Network Interventions (ANI) framework, allowing for the pooling of optimal policies from history and other contexts, while ensuring a permutation equivalent property. This property enables efficient knowledge transfer and sharing across diverse contexts. Our approach has broad applications, from curbing infectious disease spread to reducing carbon emissions through traffic light optimization, and thus has the potential to address critical societal and environmental challenges.
Abstract（参考訳）: 我々は,感染症の拡散や交通渋滞制御といった興奮点過程を誘導するための大規模ネットワーク介入の課題に取り組む。モデルに基づく強化学習ではニューラルネットワークのODEを用いて,ネットワークトポロジの変化による興奮点過程の進化を捉える。提案手法は,GD-MPC(Gradient-Descent based Model Predictive Control)を取り入れ,事前知識と制約を満たすためのポリシー柔軟性を提供する。このような意思決定問題に内在する高次元を克服し,計画の複雑さに対処するため,ネットワーク介入(ani)フレームワークの設計を行い,置換同値性を確保しつつ,歴史や他の文脈からの最適ポリシーのプール化を可能にした。この特性により、多様な文脈における効率的な知識伝達と共有が可能となる。本手法は, 感染症の感染拡大抑制から, 交通光量最適化による二酸化炭素排出量削減まで, 幅広い応用が可能であり, 社会問題や環境問題への対処の可能性も秘めている。

関連論文リスト

Model-Based Diffusion Sampling for Predictive Control in Offline Decision Making [48.998030470623384]
オフラインの意思決定は、さらなるインタラクションを伴わずに、固定データセットからの信頼性の高い振る舞いを必要とする。 i)タスク整列軌道を多様に生成するプランナー,(ii)システム力学との整合性を強制するダイナミクスモデル,(iii)タスク目標に整合した動作を選択するランサーモジュールからなる構成モデルに基づく拡散フレームワークを提案する。
論文参考訳（メタデータ） (2025-12-09T06:26:02Z)
Flow Matching-Based Autonomous Driving Planning with Advanced Interactive Behavior Modeling [26.71028572181775]
複雑なシナリオにおけるインタラクティブな運転行動のモデリングは、自動運転計画の根本的な課題である。データモデリング、モデルアーキテクチャ、学習スキームの協調的な革新を通じて、これらの問題に対処するフロープランナを提案する。 Flow Plannerは、複雑な運転シナリオにおけるインタラクティブな振る舞いを効果的にモデル化しながら、学習ベースのアプローチ間で最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2025-10-13T07:25:13Z)
Situationally-Aware Dynamics Learning [57.698553219660376]
隠れ状態表現のオンライン学習のための新しいフレームワークを提案する。提案手法は、非観測パラメータが遷移力学と報酬構造の両方に与える影響を明示的にモデル化する。シミュレーションと実世界の両方の実験は、データ効率、ポリシー性能、安全で適応的なナビゲーション戦略の出現を著しく改善した。
論文参考訳（メタデータ） (2025-05-26T06:40:11Z)
Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文参考訳（メタデータ） (2025-05-23T03:28:25Z)
Latent Diffusion Planning for Imitation Learning [78.56207566743154]
Latent Diffusion Planning (LDP) は、プランナーと逆ダイナミクスモデルからなるモジュラーアプローチである。行動予測からプランニングを分離することにより、LDPは最適なデータと行動自由データのより密集した監視信号の恩恵を受けることができる。シミュレーションされた視覚ロボット操作タスクにおいて、LDPは最先端の模倣学習アプローチより優れている。
論文参考訳（メタデータ） (2025-04-23T17:53:34Z)
Learning from Reward-Free Offline Data: A Case for Planning with Latent Dynamics Models [79.2162092822111]
我々は,一連のナビゲーションタスクにおいて,強化学習(RL)と制御に基づく手法を体系的に評価する。我々は、JEPA(Joint Embedding Predictive Architecture)を使用して、潜在ダイナミクスモデルを使用し、それを計画に使用します。その結果,モデルベースプランニングではレイアウトが不明瞭になるのに対して,モデルフリーのRLは高品質なデータから恩恵を受けることがわかった。
論文参考訳（メタデータ） (2025-02-20T18:39:41Z)
Learning Effective Dynamics across Spatio-Temporal Scales of Complex Flows [4.798951413107239]
本稿では,グラフニューラルネットワーク(GNN)とアテンションに基づく自己回帰モデルを活用したグラフベース効果的ダイナミクス学習(Graph-LED)を提案する。本研究では,シリンダーを過ぎる流れや,レイノルズ数の範囲の後方方向のステップを流れる流れなど,流体力学の一連の問題に対する提案手法を評価する。
論文参考訳（メタデータ） (2025-02-11T22:14:30Z)
Non-Progressive Influence Maximization in Dynamic Social Networks [3.7618284656539878]
インフルエンス(IM)問題は、ネットワーク接続を通じてインフルエンスの拡大を最大化できる、ソーシャルネットワーク内のキーパーソナリティの集合を特定することである。本稿では,実世界のソーシャルネットワークの動的性質を考察する,動的非プログレッシブIM問題に焦点をあてる。本稿では,グラフ埋め込みを効果的に活用して動的ネットワークの時間変化を捉え,深層強化学習とシームレスに統合するアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-12-10T10:52:32Z)
Optimal Transport-Based Displacement Interpolation with Data Augmentation for Reduced Order Modeling of Nonlinear Dynamical Systems [0.0]
本稿では,複雑なシステムにおける非線形力学の表現を強化するために,最適輸送理論と変位を利用した新しいリダクション・オーダー・モデル(ROM)を提案する。複雑なシステム挙動の予測における精度と効率の向上を示し、計算物理学や工学における幅広い応用の可能性を示している。
論文参考訳（メタデータ） (2024-11-13T16:29:33Z)
Off-dynamics Conditional Diffusion Planners [15.321049697197447]
この研究は、オフラインRLにおけるデータ不足の課題に対処するために、より容易に利用できるオフダイナミックスデータセットの使用を探求する。本研究では,DPMを用いた大規模オフダイナミックスデータセットと限定ターゲットデータセットの連成分布の学習手法を提案する。
論文参考訳（メタデータ） (2024-10-16T04:56:43Z)
End-to-end Driving in High-Interaction Traffic Scenarios with Reinforcement Learning [24.578178308010912]
これらの問題に対処するために,Ranmble というエンドツーエンドモデルベース RL アルゴリズムを提案する。環境のダイナミックスモデルを学ぶことで、Rambleは今後のトラフィックイベントを予測し、より情報に富んだ戦略的決定を下すことができる。 Rambleは、CARLA Leaderboard 2.0におけるルート完了率と運転スコアに関する最先端のパフォーマンスを達成し、複雑でダイナミックな交通状況を管理する上での有効性を示している。
論文参考訳（メタデータ） (2024-10-03T06:45:59Z)
Learning from Demonstration with Implicit Nonlinear Dynamics Models [16.26835655544884]
本研究では、時間的ダイナミクスをモデル化するための可変な動的特性を持つ固定非線形力学系を含むリカレントニューラルネットワーク層を開発する。 LASA Human Handwriting データセットを用いて人間の手書き動作を再現する作業において,ニューラルネットワーク層の有効性を検証する。
論文参考訳（メタデータ） (2024-09-27T14:12:49Z)
Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文参考訳（メタデータ） (2022-12-17T00:26:31Z)
Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文参考訳（メタデータ） (2021-09-06T13:10:37Z)
A purely data-driven framework for prediction, optimization, and control of networked processes: application to networked SIS epidemic model [0.8287206589886881]
我々は,大規模ネットワーク上での非線形力学の同定と制御を行う演算子理論に基づくデータ駆動型フレームワークを開発した。提案手法では、ネットワーク構造に関する事前の知識は必要とせず、状態の2段階のスナップショットのみを用いて基礎となるダイナミクスを識別する。
論文参考訳（メタデータ） (2021-08-01T03:57:10Z)
Learning to Continuously Optimize Wireless Resource in a Dynamic Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文参考訳（メタデータ） (2021-05-03T07:23:39Z)
An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文参考訳（メタデータ） (2020-06-19T22:05:19Z)
Network Diffusions via Neural Mean-Field Dynamics [52.091487866968286]
本稿では,ネットワーク上の拡散の推論と推定のための新しい学習フレームワークを提案する。本研究の枠組みは, ノード感染確率の正確な進化を得るために, モリ・ズワンジッヒ形式から導かれる。我々のアプローチは、基礎となる拡散ネットワークモデルのバリエーションに対して多用途で堅牢である。
論文参考訳（メタデータ） (2020-06-16T18:45:20Z)
Context-aware Dynamics Model for Generalization in Model-Based Reinforcement Learning [124.9856253431878]
グローバルなダイナミクスモデルを学習するタスクを,(a)ローカルなダイナミクスをキャプチャするコンテキスト潜在ベクトルを学習し,(b)次に条件付き状態を予測するという2つの段階に分割する。本研究では,コンテキスト潜在ベクトルに動的情報をエンコードするために,コンテキスト潜在ベクトルを前方と後方の両方のダイナミクスを予測するのに役立つような新しい損失関数を導入する。提案手法は,既存のRL方式と比較して,様々なシミュレーションロボットや制御タスクの一般化能力に優れる。
論文参考訳（メタデータ） (2020-05-14T08:10:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。