論文の概要: Stratifying Reinforcement Learning with Signal Temporal Logic
- arxiv url: http://arxiv.org/abs/2604.04923v1
- Date: Mon, 06 Apr 2026 17:58:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.332458
- Title: Stratifying Reinforcement Learning with Signal Temporal Logic
- Title(参考訳): 信号時間論理を用いた階層強化学習
- Authors: Justin Curry, Alberto Speranzon,
- Abstract要約: 本研究では,信号時間論理(STL)の階層化に基づく意味論を開発し,各原子述語を成層空間におけるメンバシップテストとして解釈する。
この観点は、成層理論とSTLの間の新しい対応原理を明らかにし、ほとんどのSTL公式が時空の成層化を誘導すると考えられることを示す。
- 参考スコア(独自算出の注目度): 0.18682913407152388
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we develop a stratification-based semantics for Signal Temporal Logic (STL) in which each atomic predicate is interpreted as a membership test in a stratified space. This perspective reveals a novel correspondence principle between stratification theory and STL, showing that most STL formulas can be viewed as inducing a stratification of space-time. The significance of this interpretation is twofold. First, it offers a fresh theoretical framework for analyzing the structure of the embedding space generated by deep reinforcement learning (DRL) and relates it to the geometry of the ambient decision space. Second, it provides a principled framework that both enables the reuse of existing high-dimensional analysis tools and motivates the creation of novel computational techniques. To ground the theory, we (1) illustrate the role of stratification theory in Minigrid games and (2) apply numerical techniques to the latent embeddings of a DRL agent playing such a game where the robustness of STL formulas is used as the reward. In the process, we propose computationally efficient signatures that, based on preliminary evidence, appear promising for uncovering the stratification structure of such embedding spaces.
- Abstract(参考訳): 本稿では,信号時間論理(STL)の階層化に基づくセマンティクスを開発し,各原子述語を成層空間におけるメンバシップテストとして解釈する。
この観点は、成層理論とSTLの間の新しい対応原理を明らかにし、ほとんどのSTL公式が時空の成層化を誘導すると考えられることを示す。
この解釈の意義は2つある。
まず、深部強化学習(DRL)によって生成された埋め込み空間の構造を解析し、環境決定空間の幾何学と関連付けるための新しい理論的枠組みを提供する。
第二に、既存の高次元解析ツールの再利用を可能にし、新しい計算技法の創出を動機付ける、原則化されたフレームワークを提供する。
この理論を基礎として、(1)ミニグリッドゲームにおける成層理論の役割を説明し、(2)STL式が堅牢であるようなゲームを行うDRLエージェントの潜伏埋め込みに数値的手法を適用する。
このプロセスでは,予備的証拠に基づいて,そのような埋め込み空間の成層構造を明らかにすることを約束する計算効率の良いシグネチャを提案する。
関連論文リスト
- On Multi-Step Theorem Prediction via Non-Parametric Structural Priors [50.16583672681106]
本研究では,インコンテキスト学習(ICL)のレンズによる学習自由な定理予測について検討する。
本稿では,過去の解の時間的依存関係を有向グラフとしてエンコードし,推論中に探索空間を効果的に引き起こす明示的なトポロジ的制約を課すTheorem Precedence Graphsを提案する。
FormalGeo7kベンチマークの実験から,本手法は89.29%の精度を実現し,ICLベースラインを著しく上回り,最先端の教師付きモデルに適合することがわかった。
論文 参考訳(メタデータ) (2026-03-05T06:08:50Z) - Knowledge, Rules and Their Embeddings: Two Paths towards Neuro-Symbolic JEPA [0.0]
ルールインフォームド・ジョイントエンベッドディング予測アーキテクチャ(RiJEPA)を中心にした双方向型ニューロシンボリック・フレームワークを提案する。
まず,Energy-Based Constraints (EBC) とマルチモーダルデュアルエンコーダアーキテクチャを用いて,JEPAトレーニングに構造的帰納バイアスを注入する。
第2の方向では、厳密で離散的な記号規則を連続的な微分可能な論理に緩和することにより、従来のルール生成の探索を回避できることを実証する。
論文 参考訳(メタデータ) (2026-02-25T22:31:46Z) - Emergent Structured Representations Support Flexible In-Context Inference in Large Language Models [77.98801218316505]
大型言語モデル(LLM)は、人間のような推論を示唆する創発的な行動を示す。
テキスト内概念推論におけるLLMの内部処理について検討する。
論文 参考訳(メタデータ) (2026-02-08T03:14:39Z) - Do It for HER: First-Order Temporal Logic Reward Specification in Reinforcement Learning (Extended Version) [49.462399222747024]
本研究では,大規模状態空間を持つ決定過程(MDP)における非マルコフ報酬の論理的仕様に関する新しい枠組みを提案する。
我々のアプローチは有限トレース(LTLfMT)上での線形時間論理モデュロ理論を利用する
本稿では,報酬マシンとHER(Hindsight Experience Replay)をベースとした一階述語論理仕様の翻訳手法を提案する。
論文 参考訳(メタデータ) (2026-02-05T22:11:28Z) - The Geometry of Reasoning: Flowing Logics in Representation Space [27.047532187192278]
大規模言語モデル(LLM)が表現空間を通してどのように考えるかを研究する。
フローとしてのLCMの推論をモデル化する新しい幾何学的枠組みを提案する。
論文 参考訳(メタデータ) (2025-10-10T18:44:00Z) - Large Language Models as Computable Approximations to Solomonoff Induction [11.811838796672369]
我々は,大規模言語モデル (LLM) とアルゴリズム情報理論 (AIT) の間の最初の公式な接続を確立する。
我々はAITを活用し、文脈内学習、少数ショット学習、スケーリング法則の統一的な理論的説明を提供する。
我々の枠組みは理論的基礎と実践的LLM行動のギャップを埋め、将来のモデル開発に説明力と実用的な洞察を提供する。
論文 参考訳(メタデータ) (2025-05-21T17:35:08Z) - Learning Visual-Semantic Subspace Representations [49.17165360280794]
我々は,自己教師型学習に有効な情報理論の原理を基礎として,核ノルムに基づく損失関数を導入する。
この損失の理論的特徴として、クラス性の促進に加えて、部分空間格子内のデータのスペクトル幾何学を符号化していることを示す。
論文 参考訳(メタデータ) (2024-05-25T12:51:38Z) - On the Generalization Capability of Temporal Graph Learning Algorithms:
Theoretical Insights and a Simpler Method [59.52204415829695]
テンポラルグラフ学習(TGL)は、様々な現実世界のアプリケーションにまたがる一般的なテクニックとなっている。
本稿では,異なるTGLアルゴリズムの一般化能力について検討する。
一般化誤差が小さく、全体的な性能が向上し、モデルの複雑さが低下する単純化されたTGLネットワークを提案する。
論文 参考訳(メタデータ) (2024-02-26T08:22:22Z) - Theoretical Foundations of t-SNE for Visualizing High-Dimensional
Clustered Data [1.9199742103141069]
t分布次元近傍埋め込み(t-SNE)の理論的基礎に関する研究
勾配降下法に基づくt-SNE解析のための新しい理論的枠組みを提案する。
一般的な理論は、クラスタ化されたデータを視覚化するためのt-SNEの高速収束率と優れた実証性能を説明します。
論文 参考訳(メタデータ) (2021-05-16T22:43:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。