Fugu-MT 論文翻訳(概要): Smart Transportation Without Neurons -- Fair Metro Network Expansion with Tabular Reinforcement Learning

論文の概要: Smart Transportation Without Neurons -- Fair Metro Network Expansion with Tabular Reinforcement Learning

arxiv url: http://arxiv.org/abs/2606.04167v1
Date: Tue, 02 Jun 2026 19:29:35 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-04 20:44:18.351562
Title: Smart Transportation Without Neurons -- Fair Metro Network Expansion with Tabular Reinforcement Learning
Title（参考訳）: ニューロンのないスマートトランスポーテーション -- タブラリ強化学習による公平なメトロネットワーク拡張
Authors: Dimitris Michailidis, Sennay Ghebreab, Fernando P. Santos,
Abstract要約: 我々は,交通需要を満たすため,メトロ・ネットワーク拡張問題(MNEP)に取り組む。深層強化学習 (Deep RL) は複雑な逐次決定過程において有効である。我々は、MNEP問題はディープRL法を必要としないほど小さいことを示す。
参考スコア（独自算出の注目度）: 49.16654883862325
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We tackle the Metro Network Expansion Problem (MNEP), a subset of the Transport Network Design Problem (TNDP), which focuses on expanding metro systems to satisfy travel demand. Traditional methods rely on exact and heuristic approaches that require expert-defined constraints to reduce the search space. Recently, deep reinforcement learning (Deep RL) has emerged due to its effectiveness in complex sequential decision-making processes-it remains, however, computationally expensive, environmentally costly, and requires additional engineering to interpret. We show that MNEP problems are small enough to not require Deep RL methods. Reformulating the MNEP as a Non-Markovian Rewards Decision Process (NMRDP), we use tabular RL to achieve similar performance with significantly fewer training episodes, additionally offering greater interpretability. Additionally, we incorporate social equity criteria into the reward functions, focusing on efficiency and fairness, highlighting the versatility of our method. Evaluated in real-world settings-Xi'an and Amsterdam-our method reduces total episodes by a factor of 18 and total carbon emissions by a factor of 12 on average, while remaining competitive with Deep RL. This approach offers a replicable, modular, interpretable, and resource-efficient solution with potential applications to other combinatorial optimization problems.
Abstract（参考訳）: 我々は、交通ネットワーク設計問題(TNDP)のサブセットであるメトロネットワーク拡張問題(MNEP)に取り組む。伝統的な手法は、探索空間を減らすために専門家が定義した制約を必要とする正確でヒューリスティックなアプローチに依存している。近年、深層強化学習(Deep RL)は、複雑な逐次決定過程における有効性から登場しているが、計算コストが高く、環境コストが高く、解釈にさらなるエンジニアリングが必要である。我々は、MNEP問題はディープRL法を必要としないほど小さいことを示す。 MNEPをNMRDP (Non-Markovian Rewards Decision Process) として再構成し, 表計算RLを用いて, トレーニングエピソードを著しく減らし, 高い解釈性を実現する。さらに,社会的平等基準を報酬関数に取り入れ,効率性と公平性に着目し,手法の汎用性を強調した。実世界での評価では、Xi'an と Amsterdam-our は、Deep RL と競合しながら、平均で18 倍、総炭素排出量を12 倍削減する。このアプローチは、他の組合せ最適化問題への潜在的な応用を伴う、複製可能で、モジュラーで、解釈可能で、リソース効率のよいソリューションを提供する。

関連論文リスト

Sample-Efficient Neurosymbolic Deep Reinforcement Learning [49.60927398960061]
本稿では,背景記号知識を統合し,サンプル効率を向上させるニューロシンボリックディープRL手法を提案する。オンライン推論は2つのメカニズムを通じてトレーニングプロセスのガイドを行う。我々は、最先端の報奨機ベースラインよりも優れた性能を示す。
論文参考訳（メタデータ） (2026-01-06T09:28:53Z)
SimpleDeepSearcher: Deep Information Seeking via Web-Powered Reasoning Trajectory Synthesis [94.33978856270268]
Retrieval-augmented Generation (RAG) システムは複雑なディープ検索シナリオにおいて高度な大規模言語モデル(LLM)を持つ。既存のアプローチでは、高品質なトレーニングトラジェクトリが欠如し、分散ミスマッチに苦しむ、重要な制限に直面しています。本稿では,複雑なトレーニングパラダイムではなく,戦略的データエンジニアリングによるギャップを埋めるフレームワークであるSimpleDeepSearcherを紹介する。
論文参考訳（メタデータ） (2025-05-22T16:05:02Z)
Joint Admission Control and Resource Allocation of Virtual Network Embedding via Hierarchical Deep Reinforcement Learning [69.00997996453842]
本稿では,仮想ネットワークの埋め込みにおいて,入出力制御と資源配分を併用して学習する深層強化学習手法を提案する。 HRL-ACRAは,受入率と長期平均収益の両面で,最先端のベースラインを上回っていることを示す。
論文参考訳（メタデータ） (2024-06-25T07:42:30Z)
PeersimGym: An Environment for Solving the Task Offloading Problem with Reinforcement Learning [2.0249250133493195]
計算ネットワークにおけるタスクオフロード戦略の開発と最適化に適した,オープンソースのカスタマイズ可能なシミュレーション環境であるPeersimGymを紹介する。 PeersimGymは、幅広いネットワークトポロジと計算制約をサポートし、TextitPettingZooベースのインターフェイスを統合して、RLエージェントのデプロイを、単体とマルチエージェントの両方で行えるようにしている。本稿では,分散コンピューティング環境におけるオフロード戦略を大幅に強化するRLベースのアプローチの可能性を示す。
論文参考訳（メタデータ） (2024-03-26T12:12:44Z)
Learning RL-Policies for Joint Beamforming Without Exploration: A Batch Constrained Off-Policy Approach [1.0080317855851213]
本稿では,ネットワークにおけるパラメータキャンセル最適化の問題点について考察する。探索と学習のために実世界でアルゴリズムをデプロイすることは、探索せずにデータによって達成できることを示す。
論文参考訳（メタデータ） (2023-10-12T18:36:36Z)
MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文参考訳（メタデータ） (2023-02-02T18:27:20Z)
Towards Deployment-Efficient Reinforcement Learning: Lower Bound and Optimality [141.89413461337324]
展開効率は、強化学習(RL)の多くの実世界の応用にとって重要な基準である本稿では,「制約付き最適化」の観点から,デプロイ効率の高いRL(DE-RL)の理論的定式化を提案する。
論文参考訳（メタデータ） (2022-02-14T01:31:46Z)
Joint Resource Management for MC-NOMA: A Deep Reinforcement Learning Approach [39.54978539962088]
本稿では, 共同資源管理(JRM)への新規かつ効果的な深層強化学習(DRL)に基づくアプローチを提案する。実用的なマルチキャリア非直交多重アクセス(MC-NOMA)システムでは、ハードウェアの感度と不完全な連続干渉キャンセル(SIC)が考慮されます。 DRL-JRM方式はシステムスループットと干渉耐性の観点から既存の方式よりも優れていることを示す。
論文参考訳（メタデータ） (2021-03-29T06:52:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。