論文の概要: Reconsidering utility: unveiling the limitations of synthetic mobility data generation algorithms in real-life scenarios
- arxiv url: http://arxiv.org/abs/2407.03237v1
- Date: Wed, 3 Jul 2024 16:08:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 13:27:21.151907
- Title: Reconsidering utility: unveiling the limitations of synthetic mobility data generation algorithms in real-life scenarios
- Title(参考訳): ユーティリティの再考:実生活シナリオにおける合成モビリティデータ生成アルゴリズムの限界を明らかにする
- Authors: Alexandra Kapp, Helena Mihaljević,
- Abstract要約: 実世界の応用性の観点から,5つの最先端合成手法の有用性を評価した。
我々は、GPS追跡タクシーのような細粒度都市の動きを符号化するいわゆる旅行データに焦点を当てる。
あるモデルは妥当な時間内にデータを生成することができず、別のモデルはマップマッチングの要件を満たすためにあまりに多くのジャンプを生成する。
- 参考スコア(独自算出の注目度): 49.1574468325115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, there has been a surge in the development of models for the generation of synthetic mobility data. These models aim to facilitate the sharing of data while safeguarding privacy, all while ensuring high utility and flexibility regarding potential applications. However, current utility evaluation methods fail to fully account for real-life requirements. We evaluate the utility of five state-of-the-art synthesis approaches, each with and without the incorporation of differential privacy (DP) guarantees, in terms of real-world applicability. Specifically, we focus on so-called trip data that encode fine granular urban movements such as GPS-tracked taxi rides. Such data prove particularly valuable for downstream tasks at the road network level. Thus, our initial step involves appropriately map matching the synthetic data and subsequently comparing the resulting trips with those generated by the routing algorithm implemented in OpenStreetMap, which serves as an efficient and privacy-friendly baseline. Out of the five evaluated models, one fails to produce data within reasonable computation time and another generates too many jumps to meet the requirements for map matching. The remaining three models succeed to a certain degree in maintaining spatial distribution, one even with DP guarantees. However, all models struggle to produce meaningful sequences of geo-locations with reasonable trip lengths and to model traffic flow at intersections accurately. It is important to note that trip data encompasses various relevant characteristics beyond spatial distribution, such as temporal information, all of which are discarded by these models. Consequently, our results imply that current synthesis models fall short in their promise of high utility and flexibility.
- Abstract(参考訳): 近年,合成モビリティデータ生成のためのモデルの開発が急増している。
これらのモデルは、潜在的なアプリケーションに関する高いユーティリティと柔軟性を確保しながら、プライバシを保護しながらデータの共有を容易にすることを目的としています。
しかし、現在の実用性評価手法は、実生活における要件を完全に説明できない。
実世界の応用性の観点から,差分プライバシ(DP)保証の具体化と無関係の5つの最先端合成手法の有用性を評価した。
具体的には,GPSによるタクシーの走行などの細かな都市運動を符号化するいわゆる旅行データに着目した。
このようなデータは、道路ネットワークレベルでの下流タスクには特に有用である。
したがって、私たちの最初のステップは、合成データのマッチングを適切にマッピングし、その結果のトリップとOpenStreetMapで実装されたルーティングアルゴリズムで生成されたトリップとを比較し、効率的でプライバシーに優しいベースラインとして機能する。
5つの評価モデルのうち、1つは妥当な計算時間内にデータを生成することができず、もう1つはマップマッチングの要件を満たすためにあまりに多くのジャンプを生成する。
残りの3つのモデルは空間分布を維持するのにある程度成功した。
しかしながら、すべてのモデルは、合理的な旅行距離を持つ測地位置の有意義なシーケンスを生成し、交差点での交通の流れを正確にモデル化するのに苦労する。
旅行データは,時間的情報などの空間分布を超えた様々な特徴を包含しており,これら全てはこれらのモデルによって破棄されていることに留意する必要がある。
その結果, 現在の合成モデルでは, 実用性と柔軟性が期待できないことが示唆された。
関連論文リスト
- OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Deep Temporal Deaggregation: Large-Scale Spatio-Temporal Generative Models [5.816964541847194]
本稿では,最新技術よりもパフォーマンスとスケールが大幅に向上する時系列の変圧器に基づく拡散モデルTDDPMを提案する。
これは、いくつかのシーケンス長、標準データセット、評価尺度にまたがる新しい包括的なベンチマークで評価される。
論文 参考訳(メタデータ) (2024-06-18T09:16:11Z) - ST-DPGAN: A Privacy-preserving Framework for Spatiotemporal Data Generation [19.18074489351738]
プライバシー保護データを生成するグラフモデルを提案する。
3つの実時間データセットを用いて実験を行い,本モデルの有効性を検証した。
生成されたデータに基づいてトレーニングされた予測モデルは、元のデータでトレーニングされたモデルと比較して、競争力のあるエッジを維持している。
論文 参考訳(メタデータ) (2024-06-04T04:43:54Z) - Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - JRDB-Traj: A Dataset and Benchmark for Trajectory Forecasting in Crowds [79.00975648564483]
ロボット工学、自動運転車、ナビゲーションなどの分野で使用される軌道予測モデルは、現実のシナリオにおいて課題に直面している。
このデータセットは、ロボットの観点から、すべてのエージェント、シーンイメージ、ポイントクラウドの位置を含む包括的なデータを提供する。
本研究の目的は,ロボットに対するエージェントの将来の位置を,生の感覚入力データを用いて予測することである。
論文 参考訳(メタデータ) (2023-11-05T18:59:31Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - GIPSO: Geometrically Informed Propagation for Online Adaptation in 3D
LiDAR Segmentation [60.07812405063708]
3Dポイントクラウドセマンティックセグメンテーションは、自動運転に基本である。
文学におけるほとんどのアプローチは、動的シーンを扱う際に、ドメインシフトをどのように扱うかという重要な側面を無視している。
本稿では,本研究分野における最先端技術について述べる。
論文 参考訳(メタデータ) (2022-07-20T09:06:07Z) - Virtual passengers for real car solutions: synthetic datasets [2.1028463367241033]
私たちは3Dシナリオを構築し、可能な限り現実に近いようにセットアップします。
シーンにランダム性を加えるためにパラメータの設定と変更が可能である。
本稿では,自動車環境における合成データ生成のプロセスと概念について述べる。
論文 参考訳(メタデータ) (2022-05-13T10:54:39Z) - Mobility Inference on Long-Tailed Sparse Trajectory [2.4444287331956898]
大規模トラジェクトリデータにおいて,汎用的な長い尾の空間パターンを利用する単一トラジェクトリ推論アルゴリズムを提案する。
このアルゴリズムは、リコールにおける証明可能な低いバウンドで、滞在/旅行推論における100%の精度を保証する。
都市ユーザ4000万人を対象とした3つの軌跡データセットによる評価は,提案アルゴリズムの性能保証を検証した。
論文 参考訳(メタデータ) (2020-01-21T16:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。