論文の概要: GeoPointGAN: Synthetic Spatial Data with Local Label Differential
Privacy
- arxiv url: http://arxiv.org/abs/2205.08886v1
- Date: Wed, 18 May 2022 12:18:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-19 16:49:59.454662
- Title: GeoPointGAN: Synthetic Spatial Data with Local Label Differential
Privacy
- Title(参考訳): GeoPointGAN:ローカルラベル差分プライバシーを用いた合成空間データ
- Authors: Teddy Cunningham, Konstantin Klemmer, Hongkai Wen, Hakan
Ferhatosmanoglu
- Abstract要約: 合成空間点データセットを生成するための新しいGANベースのソリューションであるGeoPointGANを紹介する。
GeoPointGANのアーキテクチャには、ランダムに生成された点を有意義な合成座標に射影する新しい点変換生成器が含まれている。
従来のローカルディファレンシャルプライバシよりも実用的な,ラベル付きローカルディファレンシャルプライバシを通じて,当社のプライバシ保証を提供します。
- 参考スコア(独自算出の注目度): 6.61140350204595
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic data generation is a fundamental task for many data management and
data science applications. Spatial data is of particular interest, and its
sensitive nature often leads to privacy concerns. We introduce GeoPointGAN, a
novel GAN-based solution for generating synthetic spatial point datasets with
high utility and strong individual level privacy guarantees. GeoPointGAN's
architecture includes a novel point transformation generator that learns to
project randomly generated point co-ordinates into meaningful synthetic
co-ordinates that capture both microscopic (e.g., junctions, squares) and
macroscopic (e.g., parks, lakes) geographic features. We provide our privacy
guarantees through label local differential privacy, which is more practical
than traditional local differential privacy. We seamlessly integrate this level
of privacy into GeoPointGAN by augmenting the discriminator to the point level
and implementing a randomized response-based mechanism that flips the labels
associated with the 'real' and 'fake' points used in training. Extensive
experiments show that GeoPointGAN significantly outperforms recent solutions,
improving by up to 10 times compared to the most competitive baseline. We also
evaluate GeoPointGAN using range, hotspot, and facility location queries, which
confirm the practical effectiveness of GeoPointGAN for privacy-preserving
querying. The results illustrate that a strong level of privacy is achieved
with little-to-no adverse utility cost, which we explain through the
generalization and regularization effects that are realized by flipping the
labels of the data during training.
- Abstract(参考訳): 合成データ生成は多くのデータ管理およびデータサイエンスアプリケーションにとって基本的なタスクである。
空間データは特に関心があり、その繊細な性質はしばしばプライバシーの懸念に繋がる。
geopointganは,高いユーティリティと強力な個人レベルのプライバシ保証を備えた合成空間的ポイントデータセットを生成する,新しいganベースのソリューションである。
GeoPointGANのアーキテクチャは、ランダムに生成された点を有意義な合成座標に投影し、顕微鏡的(ジャンクション、正方形など)とマクロ的(公園、湖など)の地形的特徴を捉える新しい点変換生成器を含んでいる。
従来のローカルディファレンシャルプライバシよりも実用的な,ラベル付きローカルディファレンシャルプライバシを通じて,当社のプライバシ保証を提供します。
我々は、このレベルのプライバシーをGeoPointGANにシームレスに統合し、識別器をポイントレベルに拡大し、トレーニングで使用される「リアル」および「フェイク」ポイントに関連するラベルを反転させるランダム化応答ベースのメカニズムを実装します。
大規模な実験により、GeoPointGANは、最も競争力のあるベースラインに比べて最大10倍向上した。
また、GeoPointGANを範囲、ホットスポット、施設位置クエリを用いて評価し、プライバシー保護クエリにおけるGeoPointGANの有効性を確認した。
以上の結果から,データのラベルを反転させることによって実現される一般化と正規化効果により,悪質なユーティリティコストがほとんどなく,高いプライバシレベルが達成されることが示されている。
関連論文リスト
- Federated Learning Empowered by Generative Content [55.576885852501775]
フェデレートラーニング(FL)は、プライバシ保護方法でモデルのトレーニングに分散プライベートデータを活用可能にする。
本稿では,FedGCと呼ばれる新しいFLフレームワークを提案する。
我々は、さまざまなベースライン、データセット、シナリオ、モダリティをカバーする、FedGCに関する体系的な実証的研究を行う。
論文 参考訳(メタデータ) (2023-12-10T07:38:56Z) - GeoLocator: a location-integrated large multimodal model for inferring
geo-privacy [6.7452045691798945]
本研究はGeoLocatorというGPT-4に基づく位置積分モデルを開発した。
実験により、GeoLocatorは特定の地理的詳細を高精度に生成することが明らかとなった。
我々はGeoLocatorの幅広い意味と、個人やコミュニティ全体に対する我々の発見を結論づける。
論文 参考訳(メタデータ) (2023-11-21T21:48:51Z) - CurriculumLoc: Enhancing Cross-Domain Geolocalization through
Multi-Stage Refinement [11.108860387261508]
ビジュアルジオローカライゼーションはコスト効率が高くスケーラブルなタスクであり、未知の場所で撮影された1つ以上のクエリイメージとジオタグ付き参照イメージのセットをマッチングする。
我々は,グローバルな意味認識と局所的幾何学的検証を備えたキーポイント検出と記述法であるCurriculumLocを開発した。
我々は、ALTOで62.6%と94.5%の新しいハイリコール@1スコアをそれぞれ2つの異なる距離で達成した。
論文 参考訳(メタデータ) (2023-11-20T08:40:01Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - Local Differential Privacy in Graph Neural Networks: a Reconstruction
Approach [18.57176144101623]
ユーザレベルでノードのプライバシを提供するための学習フレームワークを提案する。
我々は、分散化された微分プライバシーの概念、すなわちローカル微分プライバシに焦点を当てる。
摂動データから特徴やラベルを近似する再構成手法を開発した。
論文 参考訳(メタデータ) (2023-09-15T17:35:51Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - A General Purpose Neural Architecture for Geospatial Systems [142.43454584836812]
本稿では,空間的帰納バイアスを持つ汎用ニューラルアーキテクチャ(GPNA)の構築に向けたロードマップを示す。
このようなモデルがコミュニティのメンバー間の協力をいかに促進するかを考察する。
論文 参考訳(メタデータ) (2022-11-04T09:58:57Z) - Gromov-Wasserstein Discrepancy with Local Differential Privacy for
Distributed Structural Graphs [7.4398547397969494]
本稿では,グラフニューラルネットワークから学習したノード埋め込みのGW差分を分析するためのプライバシー保護フレームワークを提案する。
我々の実験は,$varilon$-LDPアルゴリズムによって保証される強力なプライバシー保護により,提案フレームワークがグラフ学習におけるプライバシを保存するだけでなく,GW距離下でのノイズ構造指標も提示することを示した。
論文 参考訳(メタデータ) (2022-02-01T23:32:33Z) - Synthesizing Property & Casualty Ratemaking Datasets using Generative
Adversarial Networks [2.2649197740853677]
秘密のオリジナルデータセットから合成保険データセットを構築することができるGAN(Generative Adversarial Network)の3種類の設計方法を示す。
透明性のために、これらのアプローチは、公開データセット、フランスのモーターサードパーティの負債データを使って説明されている。
MC-WGAN-GPは最良のデータを合成し、CTGANは最も使いやすく、MNCDP-GANは差分プライバシーを保証する。
論文 参考訳(メタデータ) (2020-08-13T21:02:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。