論文の概要: SynDelay: A Synthetic Dataset for Delivery Delay Prediction
- arxiv url: http://arxiv.org/abs/2509.05325v1
- Date: Sat, 30 Aug 2025 21:54:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.426295
- Title: SynDelay: A Synthetic Dataset for Delivery Delay Prediction
- Title(参考訳): SynDelay: デリバリ遅延予測のための合成データセット
- Authors: Liming Xu, Yunbo Long, Alexandra Brintrup,
- Abstract要約: 配送遅延予測のための合成データセットであるSynDelayを提案する。
これはサプライチェーンAIにおけるデータセットの共有とベンチマークを促進するオープンイニシアチブである。
- 参考スコア(独自算出の注目度): 50.56729406793283
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence (AI) is transforming supply chain management, yet progress in predictive tasks -- such as delivery delay prediction -- remains constrained by the scarcity of high-quality, openly available datasets. Existing datasets are often proprietary, small, or inconsistently maintained, hindering reproducibility and benchmarking. We present SynDelay, a synthetic dataset designed for delivery delay prediction. Generated using an advanced generative model trained on real-world data, SynDelay preserves realistic delivery patterns while ensuring privacy. Although not entirely free of noise or inconsistencies, it provides a challenging and practical testbed for advancing predictive modelling. To support adoption, we provide baseline results and evaluation metrics as initial benchmarks, serving as reference points rather than state-of-the-art claims. SynDelay is publicly available through the Supply Chain Data Hub, an open initiative promoting dataset sharing and benchmarking in supply chain AI. We encourage the community to contribute datasets, models, and evaluation practices to advance research in this area. All code is openly accessible at https://supplychaindatahub.org.
- Abstract(参考訳): 人工知能(AI)はサプライチェーン管理を変革しているが、デリバリ遅延予測などの予測タスクの進歩は、高品質で公開可能なデータセットの不足によって制限されている。
既存のデータセットは、しばしばプロプライエタリ、小規模、あるいは一貫性のないメンテナンスであり、再現性とベンチマークを妨げる。
配送遅延予測のための合成データセットであるSynDelayを提案する。
SynDelayは、現実世界のデータに基づいてトレーニングされた高度な生成モデルを使用して生成され、プライバシを確保しながら、現実的なデリバリパターンを保存する。
完全にノイズや不整合がないわけではないが、予測モデリングを進めるための挑戦的で実践的なテストベッドを提供する。
採用を支援するため,ベースラインの結果と評価指標を初期ベンチマークとして提供し,最先端のクレームではなく基準ポイントとして機能する。
SynDelayは、サプライチェーンAIにおけるデータセットの共有とベンチマークを促進するオープンイニシアチブである、サプライチェーンデータハブを通じて公開されている。
この分野の研究を進めるために、私たちはコミュニティにデータセット、モデル、評価プラクティスの提供を奨励します。
すべてのコードはhttps://supplychaindatahub.orgで公開されている。
関連論文リスト
- Understanding the Influence of Synthetic Data for Text Embedders [52.04771455432998]
まず,Wangらによって提案された合成データの再生と公開を行った。
合成データがモデル一般化をどのように改善するかを批判的に検討する。
本研究は, 汎用インバータ構築における, 現在の合成データ手法の限界を浮き彫りにしたものである。
論文 参考訳(メタデータ) (2025-09-07T19:28:52Z) - Using Imperfect Synthetic Data in Downstream Inference Tasks [50.40949503799331]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を改善することができる。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Generating Accurate Synthetic Survival Data by Conditioning on Outcomes [16.401141867387324]
合成されたデータは、プライバシ、公正性、データアクセシビリティを改善することができる。
この設定における重要な課題の1つは検閲、すなわちイベントのタイミングが不明な場合である。
既存の手法では、合成データを生成する際に観測時間と検閲時間の両方の分布を正確に再現することが困難である。
論文 参考訳(メタデータ) (2024-05-27T16:34:18Z) - Are Synthetic Time-series Data Really not as Good as Real Data? [29.852306720544224]
時系列データは、データ品質の問題、バイアスと脆弱性、一般化の問題に起因する制限を提示する。
InfoBoostは、時系列表現学習機能を備えた、高度に汎用的なクロスドメインデータ合成フレームワークである。
本研究では,実データを用いて学習したモデルの性能を上回りながら,実データを必要としないモデルトレーニングを可能にする合成データに基づく手法を開発した。
論文 参考訳(メタデータ) (2024-02-01T13:59:04Z) - SynBench: Task-Agnostic Benchmarking of Pretrained Representations using
Synthetic Data [78.21197488065177]
近年、下流のタスクで大規模なデータで事前訓練された微調整大型モデルが成功し、ディープラーニングにおける重要なパラダイムシフトにつながった。
本稿では,合成データを用いて事前学習した表現の質を測定するためのタスク非依存フレームワークであるtextitSynBenchを提案する。
論文 参考訳(メタデータ) (2022-10-06T15:25:00Z) - Evolving GANs: When Contradictions Turn into Compliance [11.353579556329962]
本稿では,リアルな合成データを生成しながら,限られたデータ設定下での識別精度の向上を図ったGANゲームを提案する。
これにより、生成したデータが他の類似したタスクに使用できるという利点が加わった。
論文 参考訳(メタデータ) (2021-06-18T06:51:35Z) - STAN: Synthetic Network Traffic Generation with Generative Neural Models [10.54843182184416]
本稿では,現実的な合成ネットワークトラフィックデータセットを生成するためのSTAN(Synthetic Network Traffic Generation with Autoregressive Neural Model)を提案する。
私たちの新しいニューラルアーキテクチャは、常に属性間の時間的依存関係と依存の両方をキャプチャします。
我々は、シミュレーションデータセットと実ネットワークトラフィックデータセットの両方で、STANの性能を、データの品質の観点から評価する。
論文 参考訳(メタデータ) (2020-09-27T04:20:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。