論文の概要: Curriculum Learning in Genetic Programming Guided Local Search for Large-scale Vehicle Routing Problems
- arxiv url: http://arxiv.org/abs/2505.15839v1
- Date: Sat, 17 May 2025 06:10:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:47.799352
- Title: Curriculum Learning in Genetic Programming Guided Local Search for Large-scale Vehicle Routing Problems
- Title(参考訳): 大規模車両経路問題の局所探索を指導した遺伝的プログラミングにおけるカリキュラム学習
- Authors: Saining Liu, Yi Mei, Mengjie Zhang,
- Abstract要約: 本稿では,カリキュラム学習(CL)をGPGLSに統合する新しい手法であるCL-GPGLSを提案する。
我々のアプローチは、事前定義されたカリキュラムを活用して、より単純なタスクから始まり、徐々に複雑さを増し、大規模なVRP(LSVRP)に適応し、最適化できるようにトレーニングインスタンスを段階的に導入する。
CL-GPGLSの有効性を検証し、3つのベースライン法に対して大幅な性能向上を示した。
- 参考スコア(独自算出の注目度): 2.954908748487635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Manually designing (meta-)heuristics for the Vehicle Routing Problem (VRP) is a challenging task that requires significant domain expertise. Recently, data-driven approaches have emerged as a promising solution, automatically learning heuristics that perform well on training instances and generalize to unseen test cases. Such an approach learns (meta-)heuristics that can perform well on the training instances, expecting it to generalize well on the unseen test instances. A recent method, named GPGLS, uses Genetic Programming (GP) to learn the utility function in Guided Local Search (GLS) and solved large scale VRP effectively. However, the selection of appropriate training instances during the learning process remains an open question, with most existing studies including GPGLS relying on random instance selection. To address this, we propose a novel method, CL-GPGLS, which integrates Curriculum Learning (CL) into GPGLS. Our approach leverages a predefined curriculum to introduce training instances progressively, starting with simpler tasks and gradually increasing complexity, enabling the model to better adapt and optimize for large-scale VRP (LSVRP). Extensive experiments verify the effectiveness of CL-GPGLS, demonstrating significant performance improvements over three baseline methods.
- Abstract(参考訳): 手動設計(meta-heuristics for the Vehicle Routing Problem (VRP))は、重要なドメイン知識を必要とする課題である。
近年、データ駆動型アプローチが有望なソリューションとして登場し、トレーニングインスタンスでうまく機能し、目に見えないテストケースに一般化するヒューリスティックを自動的に学習している。
このようなアプローチは、トレーニングインスタンスでうまく機能する(メタ-)ヒューリスティックスを学び、目に見えないテストインスタンスでうまく一般化することを期待する。
GPGLSと呼ばれる最近の手法では、GP(Genematic Programming)を用いてGLS( Guided Local Search)のユーティリティ関数を学習し、大規模VRPを効果的に解決している。
しかし、学習過程における適切なトレーニングインスタンスの選択は未解決の問題であり、GAGLSを含む既存の研究はランダムなインスタンスの選択に依存している。
そこで本研究では,カリキュラム学習(CL)をGPGLSに統合する新しい手法であるCL-GPGLSを提案する。
提案手法では,より単純なタスクから始まり,徐々に複雑化して,大規模なVRP(LSVRP)に適応し,最適化できるように,事前定義されたカリキュラムを活用して,トレーニングインスタンスを段階的に導入する。
CL-GPGLSの有効性を検証し、3つのベースライン法に対して大幅な性能向上を示した。
関連論文リスト
- Exploring RL-based LLM Training for Formal Language Tasks with Programmed Rewards [49.7719149179179]
本稿では,PPOを用いた強化学習(RL)の実現可能性について検討する。
我々は,生成した出力の質を自動的に評価するために,明示的な報酬関数をプログラムできるプログラミングなどの形式言語で表されるタスクに焦点をあてる。
以上の結果から,2つの形式言語タスクに対する純粋なRLベースのトレーニングは困難であり,単純な算術タスクにおいても成功は限られていることがわかった。
論文 参考訳(メタデータ) (2024-10-22T15:59:58Z) - A Reinforcement Learning-assisted Genetic Programming Algorithm for Team
Formation Problem Considering Person-Job Matching [70.28786574064694]
解の質を高めるために強化学習支援遺伝的プログラミングアルゴリズム(RL-GP)を提案する。
効率的な学習を通じて得られる超ヒューリスティックなルールは、プロジェクトチームを形成する際の意思決定支援として利用することができる。
論文 参考訳(メタデータ) (2023-04-08T14:32:12Z) - Active Learning of Piecewise Gaussian Process Surrogates [2.5399204134718096]
本研究では,Jump GPサロゲートを能動的に学習する手法を開発した。
ジャンプGPは、設計空間の領域において連続であるが、不連続である。
本研究では,Jump GPモデルのバイアスとばらつきを推定する手法を開発した。
論文 参考訳(メタデータ) (2023-01-20T20:25:50Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - Sample-Efficient, Exploration-Based Policy Optimisation for Routing
Problems [2.6782615615913348]
本稿では,エントロピーに基づく新しい強化学習手法を提案する。
さらに、我々は、期待したリターンを最大化する、政治以外の強化学習手法を設計する。
我々のモデルは様々な経路問題に一般化可能であることを示す。
論文 参考訳(メタデータ) (2022-05-31T09:51:48Z) - Jump-Start Reinforcement Learning [68.82380421479675]
本稿では、オフラインデータやデモ、あるいは既存のポリシーを使ってRLポリシーを初期化するメタアルゴリズムを提案する。
特に,タスク解決に2つのポリシーを利用するアルゴリズムであるJump-Start Reinforcement Learning (JSRL)を提案する。
実験により、JSRLは既存の模倣と強化学習アルゴリズムを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-04-05T17:25:22Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。