論文の概要: Mining Points of Interest via Address Embeddings: An Unsupervised
Approach
- arxiv url: http://arxiv.org/abs/2109.04467v1
- Date: Thu, 9 Sep 2021 17:59:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-10 15:32:29.958835
- Title: Mining Points of Interest via Address Embeddings: An Unsupervised
Approach
- Title(参考訳): アドレス埋め込みによる関心のマイニングポイント:教師なしアプローチ
- Authors: Abhinav Ganesan, Anubhav Gupta, and Jose Mathew
- Abstract要約: アドレス位置とアドレステキストから関心点(PoI)のポリゴン表現を得るためのエンドツーエンドの教師なしシステム設計を提案する。
提案アルゴリズムは, 中央値の精度98 %, 中央値のリコール8 %, 中央値のFスコア0.15を達成する。
- 参考スコア(独自算出の注目度): 0.7646713951724009
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Digital maps are commonly used across the globe for exploring places that
users are interested in, commonly referred to as points of interest (PoI). In
online food delivery platforms, PoIs could represent any major private
compounds where customers could order from such as hospitals, residential
complexes, office complexes, educational institutes and hostels. In this work,
we propose an end-to-end unsupervised system design for obtaining polygon
representations of PoIs (PoI polygons) from address locations and address
texts. We preprocess the address texts using locality names and generate
embeddings for the address texts using a deep learning-based architecture, viz.
RoBERTa, trained on our internal address dataset. The PoI candidates are
identified by jointly clustering the anonymised customer phone GPS locations
(obtained during address onboarding) and the embeddings of the address texts.
The final list of PoI polygons is obtained from these PoI candidates using
novel post-processing steps. This algorithm identified 74.8 % more PoIs than
those obtained using the Mummidi-Krumm baseline algorithm run on our internal
dataset. The proposed algorithm achieves a median area precision of 98 %, a
median area recall of 8 %, and a median F-score of 0.15. In order to improve
the recall of the algorithmic polygons, we post-process them using building
footprint polygons from the OpenStreetMap (OSM) database. The post-processing
algorithm involves reshaping the algorithmic polygon using intersecting
polygons and closed private roads from the OSM database, and accounting for
intersection with public roads on the OSM database. We achieve a median area
recall of 70 %, a median area precision of 69 %, and a median F-score of 0.69
on these post-processed polygons.
- Abstract(参考訳): デジタル地図は、ユーザーが興味を持つ場所を探索するために世界中で一般的に使われ、一般的にはpoint of interest (poi)と呼ばれる。
オンライン食品配達プラットフォームでは、poisは、病院、住宅、オフィスコンプレックス、教育機関、ホステルなど、顧客が注文できるあらゆる主要な民間化合物を表現できる。
本研究では,PoI(PoI polygons)のポリゴン表現をアドレス位置とアドレステキストから取得する,エンドツーエンドの教師なしシステム設計を提案する。
アドレステキストを局所性名を用いて前処理し、深層学習アーキテクチャであるviz を用いてアドレステキストの埋め込みを生成する。
ロベルタ 社内のアドレスデータセットで 訓練されてる
PoI候補は、匿名化された顧客電話GPSロケーション(アドレスオンボーディング中に保持される)とアドレステキストの埋め込みを共同でクラスタリングすることによって特定される。
The final list of PoI polygons are obtained from these PoI candidate using novel post-processing steps。
このアルゴリズムは、我々の内部データセット上で動作するmummidi-krummベースラインアルゴリズムで得られたものよりも74.8パーセントのpoisを同定した。
提案手法は,中央値領域の精度98 %,中央値領域のリコール8 %,中央値のf-score 0.15を達成する。
アルゴリズムポリゴンのリコールを改善するために,OpenStreetMap (OSM)データベースから構築したフットプリントポリゴンを用いて後処理を行う。
ポストプロセッシングアルゴリズムは、osmデータベースから交差するポリゴンと閉鎖された私道を用いてアルゴリズム的ポリゴンを再構成し、osmデータベース上の公道との交差点を会計する。
中央値領域のリコール率は70%、中央値領域の精度は69%、中央値のfスコアは0.69である。
関連論文リスト
- Boundary Detection Algorithm Inspired by Locally Linear Embedding [8.259071011958254]
本稿では,広く使用されている局所的線形埋め込みアルゴリズムにインスパイアされた境界点検出手法を提案する。
本手法は,2つの近傍探索スキーム($epsilon$-radius ball scheme)と$K$-nearest neighbor scheme($K$-nearest neighbor scheme)を用いて実装する。
論文 参考訳(メタデータ) (2024-06-26T16:05:57Z) - Progressive Evolution from Single-Point to Polygon for Scene Text [79.29097971932529]
単点をコンパクトな多角形に効率よく変換できるPoint2Polygonを導入する。
まず認識信頼度に基づいてアンカーポイントを作成し,ポリゴンを垂直に水平に精製する。
また,本手法により生成したポリゴンを用いた学習において,GTと比較して精度の86%を達成し,さらに,提案したPoint2Polygonをシームレスに統合することにより,単一点スポッターにポリゴンの生成を促進させることができた。
論文 参考訳(メタデータ) (2023-12-21T12:08:27Z) - Deepparse : An Extendable, and Fine-Tunable State-Of-The-Art Library for
Parsing Multinational Street Addresses [0.0]
本稿では、LGPL-3.0ライセンス下でPythonのオープンソースで拡張可能で、微調整可能なアドレス解析ソリューションであるDeepparseについて述べる。
任意の言語で書かれたアドレスを解析し、任意のアドレス標準を使用することができる。
ライブラリは、カスタムアドレスを生成するために、新しいデータによる微調整をサポートする。
論文 参考訳(メタデータ) (2023-11-20T15:37:33Z) - Dominating Set Database Selection for Visual Place Recognition [2.6641546039481527]
本稿では,RGBDスキャニングシーケンスから室内環境のローカライズのための視覚的位置認識データベースを作成するためのアプローチを提案する。
提案手法は,空間情報から構築したグラフのドミナント・セット・アルゴリズムの問題として定式化され,ドミナント・セットと呼ばれる。
また、RGBDスキャンシーケンスからVPRデータベースを作成するための完全自動化パイプラインと、VPRデータベース評価のためのメトリクスセットも提示する。
論文 参考訳(メタデータ) (2023-03-09T09:12:21Z) - HPointLoc: Point-based Indoor Place Recognition using Synthetic RGB-D
Images [58.720142291102135]
本稿では,屋内環境における視覚的位置認識能力の探索を目的とした,HPointLocという新しいデータセットを提案する。
データセットは人気のあるHabitatシミュレータに基づいており、独自のセンサーデータとオープンデータセットの両方を使用して屋内シーンを生成することができる。
論文 参考訳(メタデータ) (2022-12-30T12:20:56Z) - A Metaheuristic Algorithm for Large Maximum Weight Independent Set
Problems [58.348679046591265]
ノード重み付きグラフが与えられたとき、ノード重みが最大となる独立した(相互に非隣接な)ノードの集合を見つける。
このアプリケーションで放送されるグラフの中には、数十万のノードと数億のエッジを持つ大きなものもあります。
我々は,不規則なランダム化適応検索フレームワークにおいてメタヒューリスティックな新しい局所探索アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-03-28T21:34:16Z) - End-to-End Segmentation via Patch-wise Polygons Prediction [93.91375268580806]
先頭のセグメンテーション法は、出力マップをピクセルグリッドとして表現する。
画像パッチ毎に対象のエッジがモデル化される別の表現を、パッチごとのラベル確率と結合した$k$の頂点を持つポリゴンとして検討する。
論文 参考訳(メタデータ) (2021-12-05T10:42:40Z) - PCAM: Product of Cross-Attention Matrices for Rigid Registration of
Point Clouds [79.99653758293277]
PCAMは、キー要素がクロスアテンション行列のポイントワイズ積であるニューラルネットワークである。
そこで本研究では,PCAMがステップ(a)とステップ(b)をディープネットを介して共同で解決する手法によって,最先端の成果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-04T09:23:27Z) - An End-to-end Point of Interest (POI) Conflation Framework [0.966840768820136]
ポイント・オブ・関心(POI)データは、興味のある場所に関する意味情報の貴重な情報源として機能する。
本研究では,6段階からなる新しいエンドツーエンドのPOI Conflationフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-13T15:50:48Z) - An Improved Approach for Estimating Social POI Boundaries With Textual
Attributes on Social Media [3.590202054885437]
ソーシャルメディア上のテキスト属性を利用して、密度ベースのクラスタリングを実行する方法が不十分に検討されている。
我々は、社会POI境界推定(SoBEst)に関する初期の研究に基づいて、新しいアプローチとアルゴリズムを提案する。
SoBEstが基本的に想定している各POIの固定された代表座標は、特定のPOIに対して推定された社会的POI境界の遠心点から遠く離れている可能性がある。
論文 参考訳(メタデータ) (2020-12-18T00:41:44Z) - Sketch and Scale: Geo-distributed tSNE and UMAP [75.44887265789056]
地理的に分散したデータセット上で機械学習分析を実行することは、急速に発生する問題である。
私たちはSketch and Scale(SnS)という新しいフレームワークを紹介します。
これはCount Sketchデータ構造を利用して、エッジノード上のデータを圧縮し、マスターノード上の縮小サイズスケッチを集約し、サマリ上でバニラtSNEまたはUMAPを実行する。
我々は、この技術が完全に並列で、線形に時間にスケールし、メモリに対数的に分散し、通信し、世界中の複数のデータセンターにまたがる数百万、数十億のデータポイントでデータセットを解析できることを示す。
論文 参考訳(メタデータ) (2020-11-11T22:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。