論文の概要: Generating synthetic mobility data for a realistic population with RNNs
to improve utility and privacy
- arxiv url: http://arxiv.org/abs/2201.01139v1
- Date: Tue, 4 Jan 2022 13:58:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 16:11:23.556857
- Title: Generating synthetic mobility data for a realistic population with RNNs
to improve utility and privacy
- Title(参考訳): 実用性とプライバシを向上させるためにRNNを用いたリアル人口のための合成モビリティデータの生成
- Authors: Alex Berke, Ronan Doorley, Kent Larson, Esteban Moro
- Abstract要約: 本稿では, ディープリカレントニューラルネットワーク(RNN)を用いた合成モビリティデータ生成システムを提案する。
本システムは, 個体群分布を入力として, 対応する合成個体群の移動トレースを生成する。
生成したモビリティデータは,個々のレベルでの実際のデータから変化しながら,実際のデータの特徴を保っていることを示す。
- 参考スコア(独自算出の注目度): 3.3918638314432936
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Location data collected from mobile devices represent mobility behaviors at
individual and societal levels. These data have important applications ranging
from transportation planning to epidemic modeling. However, issues must be
overcome to best serve these use cases: The data often represent a limited
sample of the population and use of the data jeopardizes privacy.
To address these issues, we present and evaluate a system for generating
synthetic mobility data using a deep recurrent neural network (RNN) which is
trained on real location data. The system takes a population distribution as
input and generates mobility traces for a corresponding synthetic population.
Related generative approaches have not solved the challenges of capturing
both the patterns and variability in individuals' mobility behaviors over
longer time periods, while also balancing the generation of realistic data with
privacy. Our system leverages RNNs' ability to generate complex and novel
sequences while retaining patterns from training data. Also, the model
introduces randomness used to calibrate the variation between the synthetic and
real data at the individual level. This is to both capture variability in human
mobility, and protect user privacy.
Location based services (LBS) data from more than 22,700 mobile devices were
used in an experimental evaluation across utility and privacy metrics. We show
the generated mobility data retain the characteristics of the real data, while
varying from the real data at the individual level, and where this amount of
variation matches the variation within the real data.
- Abstract(参考訳): モバイルデバイスから収集された位置情報は、個人および社会レベルでの移動行動を表す。
これらのデータには、交通計画から疫病モデルまで、重要な応用がある。
しかし、これらのユースケースに最善を尽くすには、問題が克服されなければならない。データは、しばしば、人口の限られたサンプルを表し、データの使用がプライバシーを脅かす。
そこで本研究では,実位置データに基づいて学習したディープリカレントニューラルネットワーク(rnn)を用いて,合成モビリティデータを生成するシステムを提案する。
本システムは,人口分布を入力として,対応する合成人口の移動トレースを生成する。
関連する生成的アプローチは、個人の移動行動のパターンと変動性を長期にわたって捉えながら、現実的なデータ生成とプライバシのバランスをとるという課題を解決していない。
本システムでは,トレーニングデータからパターンを保ちつつ,複雑な新しいシーケンスを生成するrnnの能力を活用する。
また、このモデルでは、個々のレベルでの合成データと実データの変動を校正するランダム性を導入する。
これは、人間の移動の多様性を捉え、ユーザーのプライバシーを保護するためである。
22,700以上のモバイルデバイスからの位置情報ベースのサービス(LBS)データは、ユーティリティとプライバシのメトリクスの実験的評価に使用された。
生成したモビリティデータは実際のデータの特徴を保ちながら、個々のレベルでの実際のデータから変化し、その変化量が実際のデータ内の変動と一致しているかを示す。
関連論文リスト
- Reconsidering utility: unveiling the limitations of synthetic mobility data generation algorithms in real-life scenarios [49.1574468325115]
実世界の応用性の観点から,5つの最先端合成手法の有用性を評価した。
我々は、GPS追跡タクシーのような細粒度都市の動きを符号化するいわゆる旅行データに焦点を当てる。
あるモデルは妥当な時間内にデータを生成することができず、別のモデルはマップマッチングの要件を満たすためにあまりに多くのジャンプを生成する。
論文 参考訳(メタデータ) (2024-07-03T16:08:05Z) - Deep Temporal Deaggregation: Large-Scale Spatio-Temporal Generative Models [5.816964541847194]
本稿では,最新技術よりもパフォーマンスとスケールが大幅に向上する時系列の変圧器に基づく拡散モデルTDDPMを提案する。
これは、いくつかのシーケンス長、標準データセット、評価尺度にまたがる新しい包括的なベンチマークで評価される。
論文 参考訳(メタデータ) (2024-06-18T09:16:11Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Representation Learning for Wearable-Based Applications in the Case of
Missing Data [20.37256375888501]
実環境におけるマルチモーダルセンサデータは、データ品質が低く、データアノテーションが限られているため、依然として困難である。
本稿では,不足するウェアラブルデータに対する表現学習について検討し,最新統計手法と比較する。
本研究は,マスキングに基づく自己指導型学習タスクの設計と開発に関する知見を提供する。
論文 参考訳(メタデータ) (2024-01-08T08:21:37Z) - On Inferring User Socioeconomic Status with Mobility Records [61.0966646857356]
本稿では,DeepSEIと呼ばれる,社会経済に配慮したディープモデルを提案する。
DeepSEIモデルはディープネットワークとリカレントネットワークと呼ばれる2つのネットワークを組み込んでいる。
実際の移動記録データ、POIデータ、住宅価格データについて広範な実験を行う。
論文 参考訳(メタデータ) (2022-11-15T15:07:45Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Improving Correlation Capture in Generating Imbalanced Data using
Differentially Private Conditional GANs [2.2265840715792735]
DP-CGANSは,データ変換,サンプリング,コンディショニング,ネットワークトレーニングにより,現実的かつプライバシ保護データを生成する,微分プライベートな条件付きGANフレームワークである。
統計的類似性,機械学習性能,プライバシ測定の点から,3つの公開データセットと2つの実世界の個人健康データセットの最先端生成モデルを用いて,我々のモデルを広範囲に評価した。
論文 参考訳(メタデータ) (2022-06-28T06:47:27Z) - Transformer Networks for Data Augmentation of Human Physical Activity
Recognition [61.303828551910634]
Recurrent Generative Adrial Networks (RGAN)のような最先端技術モデルは、リアルな合成データを生成するために使用される。
本稿では,データにグローバルな注意を払っているトランスフォーマーベースの生成敵ネットワークを,PAMAP2とリアルワールドヒューマンアクティビティ認識データセットでRGANと比較する。
論文 参考訳(メタデータ) (2021-09-02T16:47:29Z) - Representative & Fair Synthetic Data [68.8204255655161]
公平性制約を自己監督学習プロセスに組み込むためのフレームワークを提示する。
私たちはuci成人国勢調査データセットの代表者および公正版を作成します。
我々は、代表的かつ公正な合成データを将来有望なビルディングブロックとみなし、歴史的世界ではなく、私たちが生きようとしている世界についてアルゴリズムを教える。
論文 参考訳(メタデータ) (2021-04-07T09:19:46Z) - AttnMove: History Enhanced Trajectory Recovery via Attentional Network [15.685998183691655]
AttnMoveと呼ばれる新しい注目ニューラルネットワークベースのモデルを提案し、観測されていない位置を回復することによって個々の軌道を高密度化する。
本研究では,実世界の2つのデータセット上でのモデル評価を行い,最新手法と比較した性能向上を示す。
論文 参考訳(メタデータ) (2021-01-03T15:45:35Z) - Differentially Private Synthetic Medical Data Generation using
Convolutional GANs [7.2372051099165065]
R'enyiの差分プライバシーを用いた合成データ生成のための差分プライベートフレームワークを開発する。
提案手法は, 畳み込み自己エンコーダと畳み込み生成対向ネットワークを利用して, 生成した合成データの重要な特性をある程度保存する。
私たちのモデルは、同じプライバシー予算の下で既存の最新モデルを上回ることを実証します。
論文 参考訳(メタデータ) (2020-12-22T01:03:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。