論文の概要: A Big Data Driven Framework for Duplicate Device Detection from
Multi-sourced Mobile Device Location Data
- arxiv url: http://arxiv.org/abs/2302.14742v1
- Date: Tue, 28 Feb 2023 16:43:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 15:20:15.889764
- Title: A Big Data Driven Framework for Duplicate Device Detection from
Multi-sourced Mobile Device Location Data
- Title(参考訳): マルチソースモバイルデバイス位置データからのデバイス重複検出のためのビッグデータ駆動フレームワーク
- Authors: Aliakbar Kabiri, Aref Darzi, Saeed Saleh Namadi, Yixuan Pan, Guangchen
Zhao, Qianqian Sun, Mofeng Yang, Mohammad Ashoori
- Abstract要約: 本稿では,マルチソースデータのためのデータ統合手法を提案する。
各装置の走行パターンの独自性を活用することにより、重複装置を同定する。
提案手法は,所望の精度を達成しながら費用対効果を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile Device Location Data (MDLD) has been popularly utilized in various
fields. Yet its large-scale applications are limited because of either biased
or insufficient spatial coverage of the data from individual data vendors. One
approach to improve the data coverage is to leverage the data from multiple
data vendors and integrate them to build a more representative dataset. For
data integration, further treatments on the multi-sourced dataset are required
due to several reasons. First, the possibility of carrying more than one device
could result in duplicated observations from the same data subject.
Additionally, when utilizing multiple data sources, the same device might be
captured by more than one data provider. Our paper proposes a data integration
methodology for multi-sourced data to investigate the feasibility of
integrating data from several sources without introducing additional biases to
the data. By leveraging the uniqueness of travel pattern of each device,
duplicate devices are identified. The proposed methodology is shown to be
cost-effective while it achieves the desired accuracy level. Our findings
suggest that devices sharing the same imputed home location and the top five
most-visited locations during a month can represent the same user in the MDLD.
It is shown that more than 99.6% of the sample devices having the
aforementioned attribute in common are observed at the same location
simultaneously. Finally, the proposed algorithm has been successfully applied
to the national-level MDLD of 2020 to produce the national passenger
origin-destination data for the NextGeneration National Household Travel Survey
(NextGen NHTS) program.
- Abstract(参考訳): モバイル端末位置情報(MDLD)は様々な分野で広く利用されている。
しかし、その大規模アプリケーションは、個々のデータベンダからのデータのバイアスや空間的カバレッジが不十分なため、制限されている。
データカバレッジを改善する1つのアプローチは、複数のデータベンダのデータを活用して、より代表的なデータセットを構築することだ。
データ統合には、いくつかの理由から、マルチソースデータセットのさらなる処理が必要である。
第一に、複数のデバイスを運ぶ可能性は、同じデータ対象から重複した観察結果をもたらす可能性がある。
さらに、複数のデータソースを利用する場合、同じデバイスが複数のデータプロバイダによってキャプチャされる可能性がある。
本稿では,複数のソースからのデータを統合する可能性を検討するために,データに新たなバイアスを加えることなくデータ統合手法を提案する。
各装置の走行パターンの独自性を活用することにより、重複装置を特定する。
提案手法は,所望の精度を達成しながら費用対効果を示す。
以上の結果から,同時期に最も訪問の多い場所と同一の場所を共有するデバイスは,MDLDで同じユーザを表現できることが示唆された。
上記の属性が共通する試料装置の99.6%以上が同じ場所で同時に観測されていることが示されている。
最後に,提案アルゴリズムは2020年の国家レベルのMDLDに適用され,NextGeneration National Household Travel Survey (NextGen NHTS)プログラムの国民的乗客原産地調査データの生成に成功した。
関連論文リスト
- Embedding Alignment for Unsupervised Federated Learning via Smart Data
Exchange [21.789359767103154]
フェデレートラーニング(FL)は、分散機械学習(ML)の最も有望なソリューションの1つとして認識されている。
我々は、ラベルのないデータセットを持つエッジデバイス間のFLのための新しい手法CF-CL(Cooperative Federated Unsupervised Contrastive Learning)を開発した。
論文 参考訳(メタデータ) (2022-08-04T19:26:59Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Deep Transfer Learning for Multi-source Entity Linkage via Domain
Adaptation [63.24594955429465]
マルチソースエンティティリンクは、データのクリーニングやユーザ縫合といった、高インパクトなアプリケーションにおいて重要である。
AdaMELは、多ソースエンティティリンクを実行するための一般的なハイレベルな知識を学ぶディープトランスファー学習フレームワークである。
本フレームワークは,教師付き学習に基づく平均的手法よりも8.21%向上した最先端の学習結果を実現する。
論文 参考訳(メタデータ) (2021-10-27T15:20:41Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Multi-modal AsynDGAN: Learn From Distributed Medical Image Data without
Sharing Private Information [55.866673486753115]
プライバシーとセキュリティを守るために拡張可能で弾力性のある学習フレームワークを提案します。
提案するフレームワークは分散Asynchronized Discriminator Generative Adrial Networks (AsynDGAN) である。
論文 参考訳(メタデータ) (2020-12-15T20:41:24Z) - Federated Visual Classification with Real-World Data Distribution [9.564468846277366]
我々は,FedAvg(Federated Averaging)アルゴリズムのベンチマークを用いて,実世界のデータ分布が分散学習に与える影響を特徴付ける。
種別とランドマーク分類のための2つの新しい大規模データセットを導入し,ユーザ毎のデータ分割を現実的に行う。
また、2つの新しいアルゴリズム(FedVC、FedIR)も開発しています。
論文 参考訳(メタデータ) (2020-03-18T07:55:49Z) - Evaluation Framework For Large-scale Federated Learning [10.127616622630514]
フェデレーテッド・ラーニングは、携帯電話などの分散型エッジデバイスが協調して共有予測モデルを学習できるようにするための機械学習環境として提案されている。
本稿では,データセットとモジュール型評価フレームワークを生成するためのアプローチからなる,大規模フェデレーション学習のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-03T15:12:13Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z) - Brainstorming Generative Adversarial Networks (BGANs): Towards
Multi-Agent Generative Models with Distributed Private Datasets [70.62568022925971]
生成的敵ネットワーク(GAN)は、データ空間を適切に表現する大規模なデータセットによって供給されなければならない。
多くのシナリオでは、利用可能なデータセットは制限され、複数のエージェントに分散する可能性がある。
本稿では,BGAN(Breepstorming GAN)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-02T02:58:32Z) - Communication-Efficient On-Device Machine Learning: Federated
Distillation and Augmentation under Non-IID Private Data [31.85853956347045]
オンデバイス機械学習(ML)により、トレーニングプロセスは大量のユーザ生成プライベートデータサンプルを利用することができる。
分散モデル学習アルゴリズムであるフェデレート蒸留(FD)を提案する。
FAug を用いた FD は FL と比較して 95-98% の精度で通信オーバヘッドの約26倍の低下を示した。
論文 参考訳(メタデータ) (2018-11-28T10:16:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。