論文の概要: Dynamic Adjustment of Matching Radii under the Broadcasting Mode: A
Novel Multitask Learning Strategy and Temporal Modeling Approach
- arxiv url: http://arxiv.org/abs/2312.05576v1
- Date: Sat, 9 Dec 2023 13:46:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 19:59:22.956450
- Title: Dynamic Adjustment of Matching Radii under the Broadcasting Mode: A
Novel Multitask Learning Strategy and Temporal Modeling Approach
- Title(参考訳): 放送モードにおけるマッチングラディの動的調整:新しいマルチタスク学習戦略と時間モデルアプローチ
- Authors: Taijie Chen, Zijian Shen, Siyuan Feng, Linchuan Yang, Jintao Ke
- Abstract要約: 本研究では, キーシステムの性能指標を推定する Transformer-Encoder-Based (TEB) モデルを開発した。
我々は,各タスクの収束速度を高め,より正確な全体予測を行う,新しいマルチタスク学習アルゴリズムを考案した。
- 参考スコア(独自算出の注目度): 4.045077476162125
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As ride-hailing services have experienced significant growth, the majority of
research has concentrated on the dispatching mode, where drivers must adhere to
the platform's assigned routes. However, the broadcasting mode, in which
drivers can freely choose their preferred orders from those broadcast by the
platform, has received less attention. One important but challenging task in
such a system is the determination of the optimal matching radius, which
usually varies across space, time, and real-time supply/demand characteristics.
This study develops a Transformer-Encoder-Based (TEB) model that predicts key
system performance metrics for a range of matching radii, which enables the
ride-hailing platform to select an optimal matching radius that maximizes
overall system performance according to real-time supply and demand
information. To simultaneously maximize multiple system performance metrics for
matching radius determination, we devise a novel multi-task learning algorithm
that enhances convergence speed of each task (corresponding to the optimization
of one metric) and delivers more accurate overall predictions. We evaluate our
methods in a simulation environment specifically designed for
broadcasting-mode-based ride-hailing service. Our findings reveal that
dynamically adjusting matching radii based on our proposed
predict-then-optimize approach significantly improves system performance, e.g.,
increasing platform revenue by 7.55% and enhancing order fulfillment rate by
13% compared to benchmark algorithms.
- Abstract(参考訳): 配車サービスが大きく伸びる中、ほとんどの研究は配車モードに集中しており、ドライバーはプラットフォームに割り当てられたルートに固執しなければならない。
しかし、プラットフォームによって放送される番組からドライバーが好みの注文を自由に選択できる放送モードは、あまり注目されていない。
このようなシステムにおいて重要だが挑戦的な課題の1つは、空間、時間、リアルタイムの供給/需要特性にまたがる最適なマッチング半径の決定である。
本研究では、配車プラットフォームがリアルタイムの需給情報に応じてシステム全体の性能を最大化する最適なマッチング半径を選択することを可能にする、マッチングradiiのキーシステム性能指標を予測するトランスフォーマエンコーダベース(teb)モデルを開発した。
半径決定に一致する複数のシステム性能指標を同時に最大化するために,各タスクの収束速度を向上する(1つのメトリックの最適化に対応する)新しいマルチタスク学習アルゴリズムを考案し,より正確な全体予測を行う。
ブロードキャストモードに基づく配車サービスに特化したシミュレーション環境において,提案手法を評価した。
この結果から,提案手法に基づくマッチングradiiの動的調整は,プラットフォーム収益の7.55%向上や,ベンチマークアルゴリズムと比較して13%のオーダーフルフィルメント率向上など,システム性能を著しく向上することが明らかとなった。
関連論文リスト
- OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Adaptive Preference Scaling for Reinforcement Learning with Human Feedback [103.36048042664768]
人間からのフィードバックからの強化学習(RLHF)は、AIシステムと人間の価値を合わせるための一般的なアプローチである。
本稿では,分散ロバスト最適化(DRO)に基づく適応的優先損失を提案する。
提案手法は多用途であり,様々な選好最適化フレームワークに容易に適用可能である。
論文 参考訳(メタデータ) (2024-06-04T20:33:22Z) - Embedded Hyperspectral Band Selection with Adaptive Optimization for
Image Semantic Segmentation [0.0]
組込みソリューションを提供するハイパースペクトル帯選択のための先駆的アプローチを導入する。
提案手法は, 先行処理を必要とせず, 最適帯域の選択に優れる埋込みハイパースペクトル帯域選択(EHBS)である。
他のタスクへの我々のアプローチの適応性は、より広範なアプリケーションへの有望な道を開く。
論文 参考訳(メタデータ) (2024-01-21T07:48:39Z) - Towards A Flexible Accuracy-Oriented Deep Learning Module Inference Latency Prediction Framework for Adaptive Optimization Algorithms [0.49157446832511503]
本稿では,ディープラーニングモジュール推論遅延予測フレームワークを提案する。
DNNモジュールごとに複数のRMをトレーニングするために、カスタマイズ可能な入力パラメータのセットをホストする。
トレーニングされたRMのセットを自動的に選択し、全体的な予測精度が最高になる。
論文 参考訳(メタデータ) (2023-12-11T15:15:48Z) - A Meta-Learning Based Precoder Optimization Framework for Rate-Splitting
Multiple Access [53.191806757701215]
本稿では,トランスミッタ(CSIT)における部分チャネル状態情報を持つRSMAプリコーダを直接最適化するために,メタラーニングに基づく事前コーダ最適化フレームワークを提案する。
コンパクトニューラルネットワークのオーバーフィッティングを利用して、ASR(Average Sum-Rate)表現を最大化することにより、実行時間を最小化しながら、他のトレーニングデータの必要性を効果的に回避する。
数値的な結果から,メタラーニングに基づく解は,中規模シナリオにおける従来のプリコーダ最適化に類似したASR性能を実現し,大規模シナリオにおける準最適低複雑性プリコーダアルゴリズムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2023-07-17T20:31:41Z) - Agent-based Collaborative Random Search for Hyper-parameter Tuning and
Global Function Optimization [0.0]
本稿では,機械学習モデルにおける任意のハイパーパラメータの任意の集合に対する近似値を求めるためのエージェントベース協調手法を提案する。
提案モデルの動作,特に設計パラメータの変化に対して,機械学習およびグローバル関数最適化アプリケーションの両方で検討する。
論文 参考訳(メタデータ) (2023-03-03T21:10:17Z) - Evolutionary Ensemble Learning for Multivariate Time Series Prediction [6.736731623634526]
MTS予測モデル(PM)を構築する典型的なパイプラインは、利用可能なすべてのチャネルのサブセットを選択することである。
本稿では,パイプライン全体を総合的に最適化する新たな進化的アンサンブル学習フレームワークを提案する。
提案手法を実装し,実世界の2つの応用,すなわち電力消費予測と大気質予測について検討した。
論文 参考訳(メタデータ) (2021-08-22T07:36:25Z) - A Deep Value-network Based Approach for Multi-Driver Order Dispatching [55.36656442934531]
そこで本研究では,注文発送のための深層強化学習に基づくソリューションを提案する。
DiDiの配車プラットフォーム上で大規模なオンラインA/Bテストを実施している。
その結果,CVNetは近年提案されているディスパッチ手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2021-06-08T16:27:04Z) - Fast Approximate Solutions using Reinforcement Learning for Dynamic
Capacitated Vehicle Routing with Time Windows [3.5232085374661284]
本稿では, CVRP-TWDR (Capacitated Vehicle Routing with Time Windows and Dynamic Routing) の一般クラスに対する, 本質的に並列化, 高速, 近似学習に基づくソリューションを開発する。
艦隊内の車両を分散エージェントとして考えると、強化学習(RL)ベースの適応は動的環境におけるリアルタイムルート形成の鍵となると仮定する。
論文 参考訳(メタデータ) (2021-02-24T06:30:16Z) - Distributed Multi-agent Meta Learning for Trajectory Design in Wireless
Drone Networks [151.27147513363502]
本稿では,動的無線ネットワーク環境で動作するエネルギー制約型ドローン群に対する軌道設計の問題点について検討する。
値ベース強化学習(VDRL)ソリューションとメタトレイン機構を提案する。
論文 参考訳(メタデータ) (2020-12-06T01:30:12Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。