論文の概要: An Integrated Framework Integrating Monte Carlo Tree Search and
Supervised Learning for Train Timetabling Problem
- arxiv url: http://arxiv.org/abs/2311.00971v1
- Date: Thu, 2 Nov 2023 03:39:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-03 14:49:56.538125
- Title: An Integrated Framework Integrating Monte Carlo Tree Search and
Supervised Learning for Train Timetabling Problem
- Title(参考訳): モンテカルロ木探索と教師付き学習を統合した列車時変問題の統合フレームワーク
- Authors: Feiyu Yang
- Abstract要約: 単線列車の時変問題(TTP)は重要かつ複雑な問題である。
本稿では,モンテカルロ木探索(MCTS)計算フレームワークを提案する。このフレームワークは,個別の行動空間におけるTTPを解くための手法,教師なし学習法,および教師なし学習法を組み合わせたものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The single-track railway train timetabling problem (TTP) is an important and
complex problem. This article proposes an integrated Monte Carlo Tree Search
(MCTS) computing framework that combines heuristic methods, unsupervised
learning methods, and supervised learning methods for solving TTP in discrete
action spaces. This article first describes the mathematical model and
simulation system dynamics of TTP, analyzes the characteristics of the solution
from the perspective of MCTS, and proposes some heuristic methods to improve
MCTS. This article considers these methods as planners in the proposed
framework. Secondly, this article utilizes deep convolutional neural networks
to approximate the value of nodes and further applies them to the MCTS search
process, referred to as learners. The experiment shows that the proposed
heuristic MCTS method is beneficial for solving TTP; The algorithm framework
that integrates planners and learners can improve the data efficiency of
solving TTP; The proposed method provides a new paradigm for solving TTP.
- Abstract(参考訳): 単線列車の時変問題(TTP)は重要かつ複雑な問題である。
本稿では,モンテカルロ木探索(MCTS)を統合化し,ヒューリスティックな手法,教師なし学習手法,離散的な行動空間におけるTTPの解法を併用した学習手法を提案する。
本稿ではまず, TTP の数学的モデルとシミュレーションシステムの力学について述べるとともに, MCTS の観点から解の特性を解析し, MCTS を改善するためのヒューリスティックな手法を提案する。
本稿では,これらの手法を,提案フレームワークのプランナーとして検討する。
第2に、深部畳み込みニューラルネットワークを用いてノードの値を近似し、さらに学習者と呼ばれるMCTS探索プロセスに適用する。
実験により,提案手法はTTPの解法に有用であることが示され,プランナーと学習者を統合するアルゴリズムフレームワークはTTPの解法におけるデータ効率を改善することができる。
関連論文リスト
- Test-Time Training on Graphs with Large Language Models (LLMs) [68.375487369596]
グラフニューラルネットワーク(GNN)をトレーニングするための有望なアプローチとして,TTT(Test-Time Training)が提案されている。
テキスト分散グラフ(TAG)上でのLLM(Large Language Models)の優れたアノテーション能力に着想を得て,LLMをアノテータとしてグラフ上でのテスト時間トレーニングを強化することを提案する。
2段階のトレーニング戦略は、限定的でノイズの多いラベルでテストタイムモデルを調整するように設計されている。
論文 参考訳(メタデータ) (2024-04-21T08:20:02Z) - Robust Analysis of Multi-Task Learning Efficiency: New Benchmarks on Light-Weighed Backbones and Effective Measurement of Multi-Task Learning Challenges by Feature Disentanglement [69.51496713076253]
本稿では,既存のMTL手法の効率性に焦点をあてる。
バックボーンを小さくしたメソッドの大規模な実験と,MetaGraspNetデータセットを新しいテストグラウンドとして実施する。
また,MTLにおける課題の新規かつ効率的な識別子として,特徴分散尺度を提案する。
論文 参考訳(メタデータ) (2024-02-05T22:15:55Z) - Reinforcement Learning for Scalable Train Timetable Rescheduling with
Graph Representation [28.5828807787632]
列車のダイヤ改正(TTR)は、混乱や混乱の後、列車の当初の運行を迅速に復旧することを目的としている。
本研究では,TTRに対する強化学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2024-01-13T02:14:35Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Task Weighting in Meta-learning with Trajectory Optimisation [37.32107678838193]
本稿では,メタ学習のためのタスク重み付けアルゴリズムを提案する。
動作と同一のミニバッチ内のタスクの重みを考慮し,タスク重み付けメタ学習問題を軌跡最適化に投入した。
提案手法は,2つの数ショット学習ベンチマークにおいて,手動重み付け法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-01-04T01:36:09Z) - A Survey on the Integration of Machine Learning with Sampling-based
Motion Planning [9.264471872135623]
本調査は、サンプリングベースモーションプランナー(SBMP)の計算効率と適用性を改善するための機械学習の取り組みを概観する。
まず、ノードサンプリング、衝突検出、距離または最も近い隣人、ローカルプランニング、終了条件など、SBMPのキーコンポーネントの強化に学習がどのように使われているかについて論じる。
また、機械学習を用いてロボットのデータ駆動モデルを提供し、それをSBMPで使用する方法についても論じている。
論文 参考訳(メタデータ) (2022-11-15T18:13:49Z) - A Unified Perspective on Value Backup and Exploration in Monte-Carlo
Tree Search [41.11958980731047]
本稿では,新たに導入されたバックアップ演算子とエントロピー正規化に基づく収束率と探索率を改善する2つの手法を提案する。
この理論的な定式化は、我々が新たに導入したものも含めて、同じ数学的枠組みの下で異なるアプローチを統一することを示します。
実際には、我々の統合された視点は、目の前の問題に応じて単一の$alpha$パラメータをチューニングすることで、探索と搾取のバランスをとる柔軟な方法を提供する。
論文 参考訳(メタデータ) (2022-02-11T15:30:08Z) - A Two-stage Framework and Reinforcement Learning-based Optimization
Algorithms for Complex Scheduling Problems [54.61091936472494]
本稿では、強化学習(RL)と従来の運用研究(OR)アルゴリズムを組み合わせた2段階のフレームワークを開発する。
スケジューリング問題は,有限マルコフ決定過程 (MDP) と混合整数計画過程 (mixed-integer programming process) の2段階で解決される。
その結果,本アルゴリズムは,アジャイルな地球観測衛星スケジューリング問題に対して,安定かつ効率的に十分なスケジューリング計画を得ることができた。
論文 参考訳(メタデータ) (2021-03-10T03:16:12Z) - Deep Unfolding Network for Image Super-Resolution [159.50726840791697]
本稿では,学習に基づく手法とモデルに基づく手法の両方を活用する,エンドツーエンドのトレーニング可能なアンフォールディングネットワークを提案する。
提案するネットワークは, モデルベース手法の柔軟性を継承し, 一つのモデルを用いて, 異なるスケール要因に対する, 曖昧でノイズの多い画像の超解像化を行う。
論文 参考訳(メタデータ) (2020-03-23T17:55:42Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。