論文の概要: GeoPointGAN: Synthetic Spatial Data with Local Label Differential
Privacy
- arxiv url: http://arxiv.org/abs/2205.08886v1
- Date: Wed, 18 May 2022 12:18:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-19 16:49:59.454662
- Title: GeoPointGAN: Synthetic Spatial Data with Local Label Differential
Privacy
- Title(参考訳): GeoPointGAN:ローカルラベル差分プライバシーを用いた合成空間データ
- Authors: Teddy Cunningham, Konstantin Klemmer, Hongkai Wen, Hakan
Ferhatosmanoglu
- Abstract要約: 合成空間点データセットを生成するための新しいGANベースのソリューションであるGeoPointGANを紹介する。
GeoPointGANのアーキテクチャには、ランダムに生成された点を有意義な合成座標に射影する新しい点変換生成器が含まれている。
従来のローカルディファレンシャルプライバシよりも実用的な,ラベル付きローカルディファレンシャルプライバシを通じて,当社のプライバシ保証を提供します。
- 参考スコア(独自算出の注目度): 6.61140350204595
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic data generation is a fundamental task for many data management and
data science applications. Spatial data is of particular interest, and its
sensitive nature often leads to privacy concerns. We introduce GeoPointGAN, a
novel GAN-based solution for generating synthetic spatial point datasets with
high utility and strong individual level privacy guarantees. GeoPointGAN's
architecture includes a novel point transformation generator that learns to
project randomly generated point co-ordinates into meaningful synthetic
co-ordinates that capture both microscopic (e.g., junctions, squares) and
macroscopic (e.g., parks, lakes) geographic features. We provide our privacy
guarantees through label local differential privacy, which is more practical
than traditional local differential privacy. We seamlessly integrate this level
of privacy into GeoPointGAN by augmenting the discriminator to the point level
and implementing a randomized response-based mechanism that flips the labels
associated with the 'real' and 'fake' points used in training. Extensive
experiments show that GeoPointGAN significantly outperforms recent solutions,
improving by up to 10 times compared to the most competitive baseline. We also
evaluate GeoPointGAN using range, hotspot, and facility location queries, which
confirm the practical effectiveness of GeoPointGAN for privacy-preserving
querying. The results illustrate that a strong level of privacy is achieved
with little-to-no adverse utility cost, which we explain through the
generalization and regularization effects that are realized by flipping the
labels of the data during training.
- Abstract(参考訳): 合成データ生成は多くのデータ管理およびデータサイエンスアプリケーションにとって基本的なタスクである。
空間データは特に関心があり、その繊細な性質はしばしばプライバシーの懸念に繋がる。
geopointganは,高いユーティリティと強力な個人レベルのプライバシ保証を備えた合成空間的ポイントデータセットを生成する,新しいganベースのソリューションである。
GeoPointGANのアーキテクチャは、ランダムに生成された点を有意義な合成座標に投影し、顕微鏡的(ジャンクション、正方形など)とマクロ的(公園、湖など)の地形的特徴を捉える新しい点変換生成器を含んでいる。
従来のローカルディファレンシャルプライバシよりも実用的な,ラベル付きローカルディファレンシャルプライバシを通じて,当社のプライバシ保証を提供します。
我々は、このレベルのプライバシーをGeoPointGANにシームレスに統合し、識別器をポイントレベルに拡大し、トレーニングで使用される「リアル」および「フェイク」ポイントに関連するラベルを反転させるランダム化応答ベースのメカニズムを実装します。
大規模な実験により、GeoPointGANは、最も競争力のあるベースラインに比べて最大10倍向上した。
また、GeoPointGANを範囲、ホットスポット、施設位置クエリを用いて評価し、プライバシー保護クエリにおけるGeoPointGANの有効性を確認した。
以上の結果から,データのラベルを反転させることによって実現される一般化と正規化効果により,悪質なユーティリティコストがほとんどなく,高いプライバシレベルが達成されることが示されている。
関連論文リスト
- Personalized Federated Learning for Cross-view Geo-localization [49.40531019551957]
本稿では,フェデレート・ラーニング (FL) とクロスビュー・イメージ・ジオローカライゼーション (CVGL) 技術を組み合わせた方法論を提案する。
提案手法では, クライアントが粗い特徴抽出器のみを共有しながら, 局所環境に特有のきめ細かな特徴を保持する, 粗い特徴抽出器を実装している。
その結果,フェデレートCVGL法は,データプライバシを維持しつつ,集中的なトレーニングに近い性能を実現することができた。
論文 参考訳(メタデータ) (2024-11-07T13:25:52Z) - Image-Based Geolocation Using Large Vision-Language Models [19.071551941682063]
画像に基づく位置情報の精度を大幅に向上する革新的なフレームワークであるToolを紹介した。
ツールは体系的なチェーン・オブ・シント(CoT)アプローチを採用し、人間のジオゲスティング戦略を模倣する。
GeoGuessrゲームの平均スコアは4550.5で85.37%で、高精度な位置情報予測を行う。
論文 参考訳(メタデータ) (2024-08-18T13:39:43Z) - Learning Where to Look: Self-supervised Viewpoint Selection for Active Localization using Geometrical Information [68.10033984296247]
本稿では, 位置決めの精度を高めるために, 視点選択の重要性を強調し, アクティブな位置決め領域について検討する。
私たちのコントリビューションは、リアルタイム操作用に設計されたシンプルなアーキテクチャ、自己教師付きデータトレーニング方法、および実世界のロボティクスアプリケーションに適した計画フレームワークにマップを一貫して統合する能力による、データ駆動型アプローチの使用に関するものです。
論文 参考訳(メタデータ) (2024-07-22T12:32:09Z) - GeoMix: Towards Geometry-Aware Data Augmentation [76.09914619612812]
Mixupは画像分類におけるラベル付き限られたデータによる課題の緩和にかなりの成功を収めている。
In-place graph editing を利用した簡易かつ解釈可能な混合手法 Geometric Mixup (GeoMix) を提案する。
論文 参考訳(メタデータ) (2024-07-15T12:58:04Z) - Self-consistent Deep Geometric Learning for Heterogeneous Multi-source Spatial Point Data Prediction [10.646376827353551]
環境モニタリングや天然資源管理といった分野において,マルチソース空間データ予測が重要である。
この領域の既存のモデルはドメイン固有の性質のためにしばしば不足し、様々な情報源からの情報を統合する戦略が欠如している。
我々は,地中真理ラベルを頼らずに,様々な情報源からの情報を順に整列する,革新的なマルチソース空間点データ予測フレームワークを導入する。
論文 参考訳(メタデータ) (2024-06-30T16:13:13Z) - Privacy risk in GeoData: A survey [3.7228963206288967]
我々は、地理データにおける個人のプライバシーを保護するために提案された異なるジオマスキング手法を分析した。
本稿では,これらの手法を様々な次元にわたって特徴付ける分類法を提案する。
提案した分類学は,データカストディアンの実践的資源として機能し,既存のプライバシーメカニズムの広範囲をナビゲートする手段を提供する。
論文 参考訳(メタデータ) (2024-02-06T00:55:06Z) - GeoLocator: a location-integrated large multimodal model for inferring
geo-privacy [6.7452045691798945]
本研究はGeoLocatorというGPT-4に基づく位置積分モデルを開発した。
実験により、GeoLocatorは特定の地理的詳細を高精度に生成することが明らかとなった。
我々はGeoLocatorの幅広い意味と、個人やコミュニティ全体に対する我々の発見を結論づける。
論文 参考訳(メタデータ) (2023-11-21T21:48:51Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - Synthesizing Property & Casualty Ratemaking Datasets using Generative
Adversarial Networks [2.2649197740853677]
秘密のオリジナルデータセットから合成保険データセットを構築することができるGAN(Generative Adversarial Network)の3種類の設計方法を示す。
透明性のために、これらのアプローチは、公開データセット、フランスのモーターサードパーティの負債データを使って説明されている。
MC-WGAN-GPは最良のデータを合成し、CTGANは最も使いやすく、MNCDP-GANは差分プライバシーを保証する。
論文 参考訳(メタデータ) (2020-08-13T21:02:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。