論文の概要: Learning from Drivers to Tackle the Amazon Last Mile Routing Research
Challenge
- arxiv url: http://arxiv.org/abs/2205.04001v2
- Date: Tue, 10 May 2022 03:23:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-15 03:24:49.809378
- Title: Learning from Drivers to Tackle the Amazon Last Mile Routing Research
Challenge
- Title(参考訳): ドライバーから学習して、Amazonのラストマイルルーティング研究課題に取り組む
- Authors: Chen Wu, Yin Song, Verdi March, Eden Duthie
- Abstract要約: Amazon Last Mile Routing Research Challengeの目標は、Amazonドライバの実際の体験を最適なルート計画と最適化のソリューションに統合することである。
本稿では,機械学習と従来のトラベリングセールスパーソン問題(TSP)を階層的に組み合わせた手法を提案する。
- 参考スコア(独自算出の注目度): 4.520118268558382
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The goal of the Amazon Last Mile Routing Research Challenge is to integrate
the real-life experience of Amazon drivers into the solution of optimal route
planning and optimization. This paper presents our method that tackles this
challenge by hierarchically combining machine learning and conventional
Traveling Salesperson Problem (TSP) solvers. Our method reaps the benefits from
both worlds. On the one hand, our method encodes driver know-how by learning a
sequential probability model from historical routes at the zone level, where
each zone contains a few parcel stops. It then uses a single step policy
iteration method, known as the Rollout algorithm, to generate plausible zone
sequences sampled from the learned probability model. On the other hand, our
method utilizes proven methods developed in the rich TSP literature to sequence
stops within each zone efficiently. The outcome of such a combination appeared
to be promising. Our method obtained an evaluation score of $0.0374$, which is
comparable to what the top three teams have achieved on the official Challenge
leaderboard. Moreover, our learning-based method is applicable to driving
routes that may exhibit distinct sequential patterns beyond the scope of this
Challenge. The source code of our method is publicly available at
https://github.com/aws-samples/amazon-sagemaker-amazon-routing-challenge-sol
- Abstract(参考訳): Amazon Last Mile Routing Research Challengeの目標は、Amazonドライバの実際の体験を最適なルート計画と最適化のソリューションに統合することである。
本稿では,機械学習と従来のトラベリングセールスパーソン問題(TSP)を階層的に組み合わせた手法を提案する。
この方法は両世界の利益を享受する。
一方,各ゾーンに数個の停止区間があるゾーンレベルで,過去のルートから逐次確率モデルを学習することにより,ドライバのノウハウを符号化する。
その後、ロールアウトアルゴリズムと呼ばれる1ステップのポリシー反復法を使用して、学習した確率モデルからサンプリングされた妥当なゾーンシーケンスを生成する。
一方,本手法は富裕なTSP文献で開発された証明手法を用いて,各ゾーン内でのシーケンス停止を効率的に行う。
そのような組み合わせの結果は有望なようだ。
評価スコアは0.0374$で、これはトップ3チームが公式チャレンジリーダーボードで達成した結果に匹敵するものです。
さらに,本手法は,この課題の範囲を超えて,明確な逐次パターンを示す経路の学習に適用可能である。
このメソッドのソースコードはhttps://github.com/aws-samples/amazon-sagemaker-amazon-routing-challenge-solで公開されている。
関連論文リスト
- Inverse Optimization for Routing Problems [3.282021317933024]
Inverse Optimization (IO) を用いたルーティング問題における意思決定者の行動学習手法を提案する。
提案手法の柔軟性と実世界の可能性を示し,ルーティング問題における意思決定者の判断から学ぶ。
論文 参考訳(メタデータ) (2023-07-14T14:03:47Z) - Generalized Differentiable RANSAC [95.95627475224231]
$nabla$-RANSACは、ランダム化された堅牢な推定パイプライン全体を学ぶことができる、微分可能なRANSACである。
$nabla$-RANSACは、精度という点では最先端のシステムよりも優れているが、精度は低い。
論文 参考訳(メタデータ) (2022-12-26T15:13:13Z) - NeurIPS 2022 Competition: Driving SMARTS [60.948652154552136]
ドライビングSMARTSは、動的相互作用コンテキストにおける分散シフトに起因する問題に対処するために設計された定期的な競争である。
提案するコンペティションは,強化学習(RL)やオフライン学習など,方法論的に多様なソリューションをサポートする。
論文 参考訳(メタデータ) (2022-11-14T17:10:53Z) - Engineering the Neural Automatic Passenger Counter [0.0]
我々は、信頼性、性能、そして品質のカウントを向上させるために、機械学習の様々な側面を探求し、活用する。
アンサンブル量子化のようなアグリゲーション技術がバイアスを減少させる方法を示し、その結果の全体的拡散について考察する。
論文 参考訳(メタデータ) (2022-03-02T14:56:11Z) - Learning in Sparse Rewards settings through Quality-Diversity algorithms [1.4881159885040784]
この論文は、品質多様性(QD)アルゴリズムによるスパース報酬の問題に焦点を当てている。
論文の最初の部分は、ポリシーの多様性を評価する空間の表現を学ぶことに焦点を当てている。
この論文はSERENEアルゴリズムを導入し、探索空間の興味深い部分に集中する手法である。
論文 参考訳(メタデータ) (2022-03-02T11:02:34Z) - Ranking Cost: Building An Efficient and Scalable Circuit Routing Planner
with Evolution-Based Optimization [49.207538634692916]
そこで我々は、効率よくトレーニング可能なルータを形成するための新しい回路ルーティングアルゴリズム、Randing Costを提案する。
提案手法では,A*ルータが適切な経路を見つけるのに役立つコストマップと呼ばれる新しい変数群を導入する。
我々のアルゴリズムはエンドツーエンドで訓練されており、人工データや人間の実演は一切使用しない。
論文 参考訳(メタデータ) (2021-10-08T07:22:45Z) - DeepAltTrip: Top-k Alternative Itineraries for Trip Recommendation [4.727697892741763]
本稿では,DeepAltTripというディープラーニングベースのフレームワークを提案する。
経路生成のステップでは,多様なユーザ定義制約をシームレスに処理できる新しいサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-08T10:36:59Z) - Uniform Sampling over Episode Difficulty [55.067544082168624]
本稿では,その難易度に基づいて,エピソードサンプリング分布を近似する手法を提案する。
提案手法はアルゴリズムに依存しないため,これらの知見を利用して数発の学習精度を向上させることができる。
論文 参考訳(メタデータ) (2021-08-03T17:58:54Z) - MURAL: Meta-Learning Uncertainty-Aware Rewards for Outcome-Driven
Reinforcement Learning [65.52675802289775]
本研究では,不確かさを意識した分類器が,強化学習の難しさを解消できることを示す。
正規化最大度(NML)分布の計算法を提案する。
得られたアルゴリズムは、カウントベースの探索法と、報酬関数を学習するための先行アルゴリズムの両方に多くの興味深い関係を持つことを示す。
論文 参考訳(メタデータ) (2021-07-15T08:19:57Z) - Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。
近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。
我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2021-04-16T17:58:56Z) - Sample Efficient Interactive End-to-End Deep Learning for Self-Driving
Cars with Selective Multi-Class Safe Dataset Aggregation [0.13048920509133805]
エンドツーエンドの模倣学習は、自動運転車のポリシーを計算するための一般的な方法である。
標準的なアプローチは、エキスパートポリシーから入力(カメライメージ)と出力(ステアリングアングルなど)のペアを収集し、深層ニューラルネットワークをこのデータに適合させて駆動ポリシーを学ぶことに依存している。
論文 参考訳(メタデータ) (2020-07-29T08:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。