論文の概要: LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry
- arxiv url: http://arxiv.org/abs/2306.10675v1
- Date: Mon, 19 Jun 2023 02:30:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 19:14:54.435257
- Title: LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry
- Title(参考訳): LaDe:業界初の総合的最終マイル配送データセット
- Authors: Lixia Wu, Haomin Wen, Haoyuan Hu, Xiaowei Mao, Yutong Xia, Ergang
Shan, Jianbin Zhen, Junhong Lou, Yuxuan Liang, Liuqing Yang, Roger
Zimmermann, Youfang Lin, Huaiyu Wan
- Abstract要約: LaDeは、業界から数百万のパッケージを備えた、最初の公開ラストマイルデリバリデータセットである。
実際の運用期間は6ヶ月で、21kクーリエの10万パッケージが対象だ。
LaDeには3つの特徴がある。
- 参考スコア(独自算出の注目度): 38.8232418716539
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Real-world last-mile delivery datasets are crucial for research in logistics,
supply chain management, and spatio-temporal data mining. Despite a plethora of
algorithms developed to date, no widely accepted, publicly available last-mile
delivery dataset exists to support research in this field. In this paper, we
introduce \texttt{LaDe}, the first publicly available last-mile delivery
dataset with millions of packages from the industry. LaDe has three unique
characteristics: (1) Large-scale. It involves 10,677k packages of 21k couriers
over 6 months of real-world operation. (2) Comprehensive information. It offers
original package information, such as its location and time requirements, as
well as task-event information, which records when and where the courier is
while events such as task-accept and task-finish events happen. (3) Diversity.
The dataset includes data from various scenarios, including package pick-up and
delivery, and from multiple cities, each with its unique spatio-temporal
patterns due to their distinct characteristics such as populations. We verify
LaDe on three tasks by running several classical baseline models per task. We
believe that the large-scale, comprehensive, diverse feature of LaDe can offer
unparalleled opportunities to researchers in the supply chain community, data
mining community, and beyond. The dataset homepage is publicly available at
https://huggingface.co/datasets/Cainiao-AI/LaDe.
- Abstract(参考訳): 実世界のラストマイル配送データセットは、ロジスティクス、サプライチェーン管理、時空間データマイニングの研究に不可欠である。
これまで多くのアルゴリズムが開発されてきたが、この分野の研究を支援するために広く受け入れられたラストマイル配送データセットは存在しない。
本稿では,業界から数百万のパッケージを投入した最初の公開ラストマイル配送データセットである‘texttt{LaDe}’を紹介する。
LaDeには3つの特徴がある。
実世界の運用には6ヶ月で10,677k個の21kクーリエのパッケージが含まれる。
2)総合的な情報。
ロケーションや時間要件といった独自のパッケージ情報に加えて,タスクの受け入れやタスクフィニッシュイベントなどのイベントがいつ,どこで発生したかを記録するタスクイベント情報も提供する。
(3)多様性。
データセットにはパッケージのピックアップや配送など,さまざまなシナリオからのデータや,複数の都市からのデータが含まれています。
タスク毎に複数の古典的なベースラインモデルを実行することで、LaDeを3つのタスクで検証する。
ladeの大規模で包括的で多様な機能は、サプライチェーンコミュニティやデータマイニングコミュニティなどの研究者に、別途の機会を提供することができると考えています。
datasetのホームページはhttps://huggingface.co/datasets/cainiao-ai/ladeで公開されている。
関連論文リスト
- Capturing research literature attitude towards Sustainable Development Goals: an LLM-based topic modeling approach [0.7806050661713976]
持続可能な開発目標は2015年に国連によって策定され、2030年までにこれらの世界的な課題に対処した。
自然言語処理技術は、研究文献の中のSDGに関する議論を明らかにするのに役立つ。
我々は,Scopusデータベースからコンテンツを取り出し,SDGの5つのグループ専用のデータセットを作成する,完全に自動化されたパイプラインを提案する。
論文 参考訳(メタデータ) (2024-11-05T09:37:23Z) - Multimodal Banking Dataset: Understanding Client Needs through Event
Sequences [41.470088044942756]
本稿では,150万人以上の企業顧客を擁する,産業規模で利用可能なマルチモーダルバンキングデータセットMBDについて紹介する。
すべてのエントリは、実際のプロプライエタリな銀行データから適切に匿名化されます。
我々は,タスクごとの単一モーダル手法よりも,マルチモーダルベースラインの方が優れていることを示す数値的な結果を提供する。
論文 参考訳(メタデータ) (2024-09-26T07:07:08Z) - MINT-1T: Scaling Open-Source Multimodal Data by 10x: A Multimodal Dataset with One Trillion Tokens [113.9621845919304]
MINT-1Tは最も広く多様なオープンソースMultimodal INTerleavedデータセットです。
MINT-1Tは1兆個のテキストトークンと340億の画像で構成され、既存のオープンソースデータセットの10倍のスケールアップである。
実験の結果,MINT-1TでトレーニングしたLMMは,以前の先行データセット OBELICS でトレーニングしたモデルの性能に匹敵することがわかった。
論文 参考訳(メタデータ) (2024-06-17T07:21:36Z) - IITP-VDLand: A Comprehensive Dataset on Decentraland Parcels [1.83621951969607]
IITP-VDLandは、パーセル特性、トレーディング履歴、過去のアクティビティ、トランザクション、ソーシャルメディアのインタラクションを含む、豊富な属性を提供する。
仮想世界における各パーセルの特異性を測定するために,データセットにキー,すなわちRarityスコアを導入する。
論文 参考訳(メタデータ) (2024-04-11T07:54:14Z) - LMSYS-Chat-1M: A Large-Scale Real-World LLM Conversation Dataset [75.9621305227523]
LMSYS-Chat-1M(LMSYS-Chat-1M)について紹介する。
このデータセットは、VicunaのデモとArenaのWebサイトで、210KのIPアドレスから収集されています。
GPT-4と同様の動作を行うコンテンツモデレーションモデルの開発、安全性ベンチマークの構築、Vicunaと同様の動作を行う命令追従モデルのトレーニング、挑戦的なベンチマーク問題の作成、という4つのユースケースを通じて、その汎用性を実証する。
論文 参考訳(メタデータ) (2023-09-21T12:13:55Z) - Amazon-M2: A Multilingual Multi-locale Shopping Session Dataset for
Recommendation and Text Generation [127.35910314813854]
Amazon Multi-locale Shopping Sessionデータセット、すなわちAmazon-M2を提示します。
6つの異なるローカライズされた数百万のユーザセッションからなる、最初の多言語データセットである。
注目すべきは、データセットがパーソナライズとユーザの好みの理解を高めるのに役立つことだ。
論文 参考訳(メタデータ) (2023-07-19T00:08:49Z) - MMSum: A Dataset for Multimodal Summarization and Thumbnail Generation
of Videos [106.06278332186106]
マルチモーダル・アウトプット(MSMO)を用いたマルチモーダル・サマリゼーションが有望な研究方向として浮上している。
既存のパブリックMSMOデータセットには多くの制限がある。
textbfMMSumデータセットを精巧にキュレートした。
論文 参考訳(メタデータ) (2023-06-07T07:43:11Z) - Argoverse 2: Next Generation Datasets for Self-Driving Perception and
Forecasting [64.7364925689825]
Argoverse 2(AV2)は、自動運転分野の研究の知覚と予測のための3つのデータセットの集合である。
Lidarデータセットには、ラベルなしのLidar点雲とマップ整列ポーズの2万のシーケンスが含まれている。
Motion Forecastingデータセットには、各ローカルシーンにおける自動運転車と他のアクター間の興味深い、挑戦的なインタラクションのために採掘された25万のシナリオが含まれている。
論文 参考訳(メタデータ) (2023-01-02T00:36:22Z) - Towards Rich, Portable, and Large-Scale Pedestrian Data Collection [6.250018240133604]
本研究では,多様な環境における大規模データ収集を容易にする,ポータブルなデータ収集システムを提案する。
TBDの歩行者データセットである、進行中のデータ収集作業から、最初のデータセットのバッチを紹介します。
既存の歩行者データと比較すると、我々のデータセットには3つの要素がある: 計量空間に基礎を置く人間認証ラベル、トップダウンとビュービューの組み合わせ、社会的に適切な「ロボット」の存在下での自然主義的人間の行動。
論文 参考訳(メタデータ) (2022-03-03T19:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。