Fugu-MT 論文翻訳(概要): A Big Data Driven Framework for Duplicate Device Detection from Multi-sourced Mobile Device Location Data

論文の概要: A Big Data Driven Framework for Duplicate Device Detection from Multi-sourced Mobile Device Location Data

arxiv url: http://arxiv.org/abs/2302.14742v1
Date: Tue, 28 Feb 2023 16:43:26 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-01 15:20:15.889764
Title: A Big Data Driven Framework for Duplicate Device Detection from Multi-sourced Mobile Device Location Data
Title（参考訳）: マルチソースモバイルデバイス位置データからのデバイス重複検出のためのビッグデータ駆動フレームワーク
Authors: Aliakbar Kabiri, Aref Darzi, Saeed Saleh Namadi, Yixuan Pan, Guangchen Zhao, Qianqian Sun, Mofeng Yang, Mohammad Ashoori
Abstract要約: 本稿では,マルチソースデータのためのデータ統合手法を提案する。各装置の走行パターンの独自性を活用することにより、重複装置を同定する。提案手法は,所望の精度を達成しながら費用対効果を示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Mobile Device Location Data (MDLD) has been popularly utilized in various fields. Yet its large-scale applications are limited because of either biased or insufficient spatial coverage of the data from individual data vendors. One approach to improve the data coverage is to leverage the data from multiple data vendors and integrate them to build a more representative dataset. For data integration, further treatments on the multi-sourced dataset are required due to several reasons. First, the possibility of carrying more than one device could result in duplicated observations from the same data subject. Additionally, when utilizing multiple data sources, the same device might be captured by more than one data provider. Our paper proposes a data integration methodology for multi-sourced data to investigate the feasibility of integrating data from several sources without introducing additional biases to the data. By leveraging the uniqueness of travel pattern of each device, duplicate devices are identified. The proposed methodology is shown to be cost-effective while it achieves the desired accuracy level. Our findings suggest that devices sharing the same imputed home location and the top five most-visited locations during a month can represent the same user in the MDLD. It is shown that more than 99.6% of the sample devices having the aforementioned attribute in common are observed at the same location simultaneously. Finally, the proposed algorithm has been successfully applied to the national-level MDLD of 2020 to produce the national passenger origin-destination data for the NextGeneration National Household Travel Survey (NextGen NHTS) program.
Abstract（参考訳）: モバイル端末位置情報(MDLD)は様々な分野で広く利用されている。しかし、その大規模アプリケーションは、個々のデータベンダからのデータのバイアスや空間的カバレッジが不十分なため、制限されている。データカバレッジを改善する1つのアプローチは、複数のデータベンダのデータを活用して、より代表的なデータセットを構築することだ。データ統合には、いくつかの理由から、マルチソースデータセットのさらなる処理が必要である。第一に、複数のデバイスを運ぶ可能性は、同じデータ対象から重複した観察結果をもたらす可能性がある。さらに、複数のデータソースを利用する場合、同じデバイスが複数のデータプロバイダによってキャプチャされる可能性がある。本稿では,複数のソースからのデータを統合する可能性を検討するために,データに新たなバイアスを加えることなくデータ統合手法を提案する。各装置の走行パターンの独自性を活用することにより、重複装置を特定する。提案手法は,所望の精度を達成しながら費用対効果を示す。以上の結果から,同時期に最も訪問の多い場所と同一の場所を共有するデバイスは,MDLDで同じユーザを表現できることが示唆された。上記の属性が共通する試料装置の99.6%以上が同じ場所で同時に観測されていることが示されている。最後に,提案アルゴリズムは2020年の国家レベルのMDLDに適用され,NextGeneration National Household Travel Survey (NextGen NHTS)プログラムの国民的乗客原産地調査データの生成に成功した。

関連論文リスト

EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.84868704100595]
本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文参考訳（メタデータ） (2025-01-14T13:42:22Z)
Uni$^2$Det: Unified and Universal Framework for Prompt-Guided Multi-dataset 3D Detection [64.08296187555095]
Uni$2$Detは3D検出のための統一的で普遍的なマルチデータセットトレーニングのためのフレームワークである。マルチデータセット3D検出のためのマルチステージプロンプトモジュールを提案する。ゼロショットクロスデータセット転送の結果は,提案手法の一般化能力を検証する。
論文参考訳（メタデータ） (2024-09-30T17:57:50Z)
Sparse outlier-robust PCA for multi-source data [2.3226893628361687]
そこで本研究では,重要な特徴と局所的なソース固有パターンを同時に選択する新しいPCA手法を提案する。我々は,グローバルな局所構造的空間パターンに対応するペナルティを持つ正規化問題を開発する。本稿では,乗算器の交互方向法による提案手法の効率的な実装について述べる。
論文参考訳（メタデータ） (2024-07-23T08:55:03Z)
ADs: Active Data-sharing for Data Quality Assurance in Advanced Manufacturing Systems [8.739325218880815]
複数のマシン間で共有データの品質を確保するために、アクティブデータ共有(AD)フレームワークが提案されている。ダウンストリームタスクの恩恵を受ける最も情報性の高いデータポイントを同時に選択するように設計されている。本手法は, 3つの添加製造工程のその場モニタリングデータから異常検出を行う。
論文参考訳（メタデータ） (2024-03-31T06:08:01Z)
Embedding Alignment for Unsupervised Federated Learning via Smart Data Exchange [21.789359767103154]
フェデレートラーニング(FL)は、分散機械学習(ML)の最も有望なソリューションの1つとして認識されている。我々は、ラベルのないデータセットを持つエッジデバイス間のFLのための新しい手法CF-CL(Cooperative Federated Unsupervised Contrastive Learning)を開発した。
論文参考訳（メタデータ） (2022-08-04T19:26:59Z)
Detection Hub: Unifying Object Detection Datasets via Query Adaptation on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文参考訳（メタデータ） (2022-06-07T17:59:44Z)
Deep Transfer Learning for Multi-source Entity Linkage via Domain Adaptation [63.24594955429465]
マルチソースエンティティリンクは、データのクリーニングやユーザ縫合といった、高インパクトなアプリケーションにおいて重要である。 AdaMELは、多ソースエンティティリンクを実行するための一般的なハイレベルな知識を学ぶディープトランスファー学習フレームワークである。本フレームワークは,教師付き学習に基づく平均的手法よりも8.21%向上した最先端の学習結果を実現する。
論文参考訳（メタデータ） (2021-10-27T15:20:41Z)
Unsupervised Domain Adaptive Learning via Synthetic Data for Person Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文参考訳（メタデータ） (2021-09-12T15:51:41Z)
Multi-modal AsynDGAN: Learn From Distributed Medical Image Data without Sharing Private Information [55.866673486753115]
プライバシーとセキュリティを守るために拡張可能で弾力性のある学習フレームワークを提案します。提案するフレームワークは分散Asynchronized Discriminator Generative Adrial Networks (AsynDGAN) である。
論文参考訳（メタデータ） (2020-12-15T20:41:24Z)
Federated Visual Classification with Real-World Data Distribution [9.564468846277366]
我々は,FedAvg(Federated Averaging)アルゴリズムのベンチマークを用いて,実世界のデータ分布が分散学習に与える影響を特徴付ける。種別とランドマーク分類のための2つの新しい大規模データセットを導入し,ユーザ毎のデータ分割を現実的に行う。また、2つの新しいアルゴリズム(FedVC、FedIR)も開発しています。
論文参考訳（メタデータ） (2020-03-18T07:55:49Z)
Brainstorming Generative Adversarial Networks (BGANs): Towards Multi-Agent Generative Models with Distributed Private Datasets [70.62568022925971]
生成的敵ネットワーク(GAN)は、データ空間を適切に表現する大規模なデータセットによって供給されなければならない。多くのシナリオでは、利用可能なデータセットは制限され、複数のエージェントに分散する可能性がある。本稿では,BGAN(Breepstorming GAN)アーキテクチャを提案する。
論文参考訳（メタデータ） (2020-02-02T02:58:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。