論文の概要: Inferring Causal Graph Temporal Logic Formulas to Expedite Reinforcement Learning in Temporally Extended Tasks
- arxiv url: http://arxiv.org/abs/2601.02666v1
- Date: Tue, 06 Jan 2026 02:25:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.777441
- Title: Inferring Causal Graph Temporal Logic Formulas to Expedite Reinforcement Learning in Temporally Extended Tasks
- Title(参考訳): 時間拡張タスクにおける因果グラフ時間論理式による強化学習の高速化
- Authors: Hadi Partovi Aria, Zhe Xu,
- Abstract要約: ブラックボックス強化学習は、ローカルな変化がネットワーク構造を通してどのように広がるかを見落としている。
本稿では、ポリシーを同時に学習し、Causal Graph Temporal Logic (Causal GTL) 仕様をマイニングするクローズドループフレームワークであるGTL-CIRLを提案する。
- 参考スコア(独自算出の注目度): 3.7707776780297375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decision-making tasks often unfold on graphs with spatial-temporal dynamics. Black-box reinforcement learning often overlooks how local changes spread through network structure, limiting sample efficiency and interpretability. We present GTL-CIRL, a closed-loop framework that simultaneously learns policies and mines Causal Graph Temporal Logic (Causal GTL) specifications. The method shapes rewards with robustness, collects counterexamples when effects fail, and uses Gaussian Process (GP) driven Bayesian optimization to refine parameterized cause templates. The GP models capture spatial and temporal correlations in the system dynamics, enabling efficient exploration of complex parameter spaces. Case studies in gene and power networks show faster learning and clearer, verifiable behavior compared to standard RL baselines.
- Abstract(参考訳): 決定的タスクは時空間力学を持つグラフ上に展開されることが多い。
ブラックボックス強化学習は、しばしば、局所的な変化がネットワーク構造を通してどのように広がるかを見落とし、サンプル効率と解釈可能性を制限する。
本稿では、ポリシーを同時に学習し、Causal Graph Temporal Logic (Causal GTL) 仕様をマイニングするクローズドループフレームワークであるGTL-CIRLを提案する。
この方法は、ロバスト性で報酬を形作り、効果が失敗すると反例を収集し、ガウス過程(GP)駆動のベイズ最適化を用いてパラメータ化された原因テンプレートを洗練する。
GPモデルはシステム力学における空間的および時間的相関を捉え、複雑なパラメータ空間の効率的な探索を可能にする。
遺伝子とパワーネットワークのケーススタディでは、標準のRLベースラインに比べて学習が速く、明確で、検証可能な振る舞いを示している。
関連論文リスト
- T-GRAB: A Synthetic Diagnostic Benchmark for Learning on Temporal Graphs [6.199165061105655]
時間的グラフ推論ベンチマーク(T-GRAB)を導入し,TGNNの時間的推論能力を体系的に探究する。
T-GRABは、主要な時間的スキルを分離する制御された解釈可能なタスクを提供する。
これらの課題に対して,11の時間グラフ学習手法を評価し,時間パターンを一般化する能力の根本的な欠点を明らかにした。
論文 参考訳(メタデータ) (2025-07-14T11:47:43Z) - Multivariate Long-term Time Series Forecasting with Fourier Neural Filter [42.60778405812048]
我々はFNFをバックボーンとして、DBDをアーキテクチャとして導入し、空間時間モデルのための優れた学習能力と最適な学習経路を提供する。
FNFは、局所時間領域とグローバル周波数領域の情報処理を単一のバックボーン内で統合し、空間的モデリングに自然に拡張することを示す。
論文 参考訳(メタデータ) (2025-06-10T18:40:20Z) - STRAP: Spatio-Temporal Pattern Retrieval for Out-of-Distribution Generalization [29.10084723132903]
本稿では,時空間探索型パターン学習フレームワークSTRAPを提案する。
推論中、STRAPは現在の入力と類似性に基づいてライブラリから関連するパターンを検索し、プラグイン・アンド・プレイ・プロンプト機構を介してモデルに注入する。
複数の実世界のストリーミンググラフデータセットに対する実験によると、STRAPはSTOODタスクの最先端STGNNベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-26T06:11:05Z) - DyG-Mamba: Continuous State Space Modeling on Dynamic Graphs [59.434893231950205]
動的グラフ学習は、現実世界のシステムにおける進化の法則を明らかにすることを目的としている。
動的グラフ学習のための新しい連続状態空間モデルDyG-Mambaを提案する。
我々はDyG-Mambaがほとんどのデータセットで最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-08-13T15:21:46Z) - EasyDGL: Encode, Train and Interpret for Continuous-time Dynamic Graph Learning [92.71579608528907]
本稿では,3つのモジュールから構成される使い勝手の良いパイプライン(EasyDGL)を設計することを目的とする。
EasyDGLは、進化するグラフデータからモデルが学習する周波数コンテンツの予測力を効果的に定量化することができる。
論文 参考訳(メタデータ) (2023-03-22T06:35:08Z) - Space-Time Graph Neural Networks [104.55175325870195]
本研究では、時空間グラフニューラルネットワーク(ST-GNN)を導入し、時間変動ネットワークデータの時空間トポロジを共同処理する。
解析の結果,システムのネットワークトポロジと時間進化の変動はST-GNNの性能に大きく影響しないことがわかった。
論文 参考訳(メタデータ) (2021-10-06T16:08:44Z) - Efficient and Stable Graph Scattering Transforms via Pruning [86.76336979318681]
グラフ散乱変換(GST)は、グラフデータから特徴を抽出する訓練のないディープGCNモデルを提供する。
GSTが支払う価格は、層の数によって増加する空間と時間の指数関数的な複雑さである。
本研究は, GST の複雑性の限界に対処し, 効率的な (p) GST アプローチを導入する。
論文 参考訳(メタデータ) (2020-01-27T16:05:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。