論文の概要: SymLight: Exploring Interpretable and Deployable Symbolic Policies for Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2511.05790v1
- Date: Sat, 08 Nov 2025 01:45:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.578153
- Title: SymLight: Exploring Interpretable and Deployable Symbolic Policies for Traffic Signal Control
- Title(参考訳): SymLight: 信号制御のための解釈可能でデプロイ可能なシンボルポリシの探索
- Authors: Xiao-Cheng Liao, Yi Mei, Mengjie Zhang,
- Abstract要約: この研究は、モンテカルロ木探索(MCTS)に基づく優先度関数検索フレームワークであるSymLightを紹介し、本質的に解釈可能でデプロイ可能なシンボル優先関数を発見する。
重要な利点は、優れたパフォーマンスを維持しながら解釈可能でデプロイ可能なTSCポリシーを生成するSymLightの能力である。
- 参考スコア(独自算出の注目度): 4.2252873779495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep Reinforcement Learning have achieved significant success in automatically devising effective traffic signal control (TSC) policies. Neural policies, however, tend to be over-parameterized and non-transparent, hindering their interpretability and deployability on resource-limited edge devices. This work presents SymLight, a priority function search framework based on Monte Carlo Tree Search (MCTS) for discovering inherently interpretable and deployable symbolic priority functions to serve as the TSC policies. The priority function, in particular, accepts traffic features as input and then outputs a priority for each traffic signal phase, which subsequently directs the phase transition. For effective search, we propose a concise yet expressive priority function representation. This helps mitigate the combinatorial explosion of the action space in MCTS. Additionally, a probabilistic structural rollout strategy is introduced to leverage structural patterns from previously discovered high-quality priority functions, guiding the rollout process. Our experiments on real-world datasets demonstrate SymLight's superior performance across a range of baselines. A key advantage is SymLight's ability to produce interpretable and deployable TSC policies while maintaining excellent performance.
- Abstract(参考訳): 深層強化学習は、効率的な交通信号制御(TSC)ポリシーを自動開発することで大きな成功を収めた。
しかし、ニューラルポリシーは過度にパラメータ化され透明でない傾向にあり、リソース制限されたエッジデバイスでの解釈可能性やデプロイ可能性を妨げる。
この研究は、MCTS(Monte Carlo Tree Search)に基づいた優先度関数検索フレームワークであるSymLightを紹介し、TSCポリシーとして機能するために本質的に解釈可能でデプロイ可能なシンボル優先関数を発見する。
優先度関数は、特に、交通特徴を入力として受け入れ、その後、各信号位相の優先度を出力し、その後、位相遷移を指示する。
効率的な探索法として,簡潔で表現力に富んだ関数表現を提案する。
これはMCTSにおける作用空間の組合せ爆発を緩和するのに役立つ。
さらに、以前に発見された高品質な優先度関数から構造パターンを活用するための確率論的構造的ロールアウト戦略を導入し、ロールアウトプロセスを導く。
実世界のデータセットに関する我々の実験は、さまざまなベースラインにわたるSymLightの優れたパフォーマンスを示しています。
重要な利点は、優れたパフォーマンスを維持しながら解釈可能でデプロイ可能なTSCポリシーを生成するSymLightの能力である。
関連論文リスト
- CIR-CoT: Towards Interpretable Composed Image Retrieval via End-to-End Chain-of-Thought Reasoning [93.05917922306196]
Composed Image Retrieval (CIR) は、参照画像と修正テキストから対象画像を見つけることを目的としている。
CIR-CoTは、明示的なChain-of-Thought (CoT)推論を統合するために設計された最初のエンドツーエンド検索指向MLLMである。
論文 参考訳(メタデータ) (2025-10-09T09:41:45Z) - Feature-Based vs. GAN-Based Learning from Demonstrations: When and Why [50.191655141020505]
この調査は、デモから学ぶ機能ベースのアプローチとGANベースのアプローチの比較分析を提供する。
特徴に基づく手法とGANに基づく手法の2分法はますます曖昧になっていると我々は主張する。
論文 参考訳(メタデータ) (2025-07-08T11:45:51Z) - Zero-Shot Whole-Body Humanoid Control via Behavioral Foundation Models [71.34520793462069]
教師なし強化学習(RL)は、複雑な環境下で幅広い下流タスクを解くことができる事前学習エージェントを目標としている。
本稿では,ラベルのない行動データセットからトラジェクトリを模倣するための,教師なしRLの正規化アルゴリズムを提案する。
我々は,この手法の有効性を,挑戦的なヒューマノイド制御問題において実証する。
論文 参考訳(メタデータ) (2025-04-15T10:41:11Z) - Learning Traffic Signal Control via Genetic Programming [2.954908748487635]
複雑な交差点における信号制御の新しい学習手法を提案する。
本手法では,各信号位相に対する位相緊急の概念を設計する。
緊急関数は、現在の道路条件に基づいて特定位相の位相緊急を算出することができる。
論文 参考訳(メタデータ) (2024-03-26T02:22:08Z) - LLMLight: Large Language Models as Traffic Signal Control Agents [25.438040499152745]
交通信号制御(TSC)は都市交通管理において重要な要素であり、道路網の効率を最適化し渋滞を軽減することを目的としている。
本稿では,大規模言語モデル (LLM) を用いた新しいフレームワーク LLMLight について述べる。
論文 参考訳(メタデータ) (2023-12-26T13:17:06Z) - A Priority Map for Vision-and-Language Navigation with Trajectory Plans
and Feature-Location Cues [34.55676068012246]
優先度マップモジュールを実装し、低サンプルデータセットを用いて補助的なタスクを事前訓練する。
軌道計画の階層的なプロセスは、クロスモーダルアライメントと特徴レベルのローカライゼーションのコア課題に対処する。
優先度マップモジュールは、スタンドアローントランスフォーマーのタスク完了率を2倍にするフィーチャロケーションフレームワークに統合される。
論文 参考訳(メタデータ) (2022-07-24T11:09:45Z) - INFOrmation Prioritization through EmPOWERment in Visual Model-Based RL [90.06845886194235]
モデルベース強化学習(RL)のための修正目的を提案する。
相互情報に基づく状態空間モデルに,変分エンパワーメントにインスパイアされた用語を統合する。
本研究は,視覚に基づくロボット制御作業における自然な映像背景を用いたアプローチの評価である。
論文 参考訳(メタデータ) (2022-04-18T23:09:23Z) - Safe RAN control: A Symbolic Reinforcement Learning Approach [62.997667081978825]
本稿では,無線アクセスネットワーク(RAN)アプリケーションの安全管理のためのシンボル強化学習(SRL)アーキテクチャを提案する。
我々は、ユーザが所定のセルネットワークトポロジに対して高レベルの論理的安全性仕様を指定できる純粋に自動化された手順を提供する。
ユーザがシステムに意図仕様を設定するのを支援するために開発されたユーザインターフェース(UI)を導入し、提案するエージェントの動作の違いを検査する。
論文 参考訳(メタデータ) (2021-06-03T16:45:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。