論文の概要: GeoVectors: A Linked Open Corpus of OpenStreetMap Embeddings on World
Scale
- arxiv url: http://arxiv.org/abs/2108.13092v1
- Date: Mon, 30 Aug 2021 10:00:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-31 14:29:49.239084
- Title: GeoVectors: A Linked Open Corpus of OpenStreetMap Embeddings on World
Scale
- Title(参考訳): GeoVectors:世界規模のOpenStreetMap埋め込みのリンク付きオープンコーパス
- Authors: Nicolas Tempelmeier, Simon Gottschalk, Elena Demidova
- Abstract要約: 本稿は,OSM エンティティを包括的に包括的に包括的に包括的に包括する Geos について述べる。
Geos corpusはOSMエンティティのセマンティック次元と地理的次元をキャプチャし、機械学習アルゴリズムにアクセスできるようにする。
我々は、OSM内の地理的エンティティのセマンティックおよび潜在表現に直接アクセスするセマンティックインターフェースであるSPARQLエンドポイントを提供する。
- 参考スコア(独自算出の注目度): 1.933681537640272
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: OpenStreetMap (OSM) is currently the richest publicly available information
source on geographic entities (e.g., buildings and roads) worldwide. However,
using OSM entities in machine learning models and other applications is
challenging due to the large scale of OSM, the extreme heterogeneity of entity
annotations, and a lack of a well-defined ontology to describe entity semantics
and properties. This paper presents GeoVectors - a unique, comprehensive
world-scale linked open corpus of OSM entity embeddings covering the entire OSM
dataset and providing latent representations of over 980 million geographic
entities in 180 countries. The GeoVectors corpus captures semantic and
geographic dimensions of OSM entities and makes these entities directly
accessible to machine learning algorithms and semantic applications. We create
a semantic description of the GeoVectors corpus, including identity links to
the Wikidata and DBpedia knowledge graphs to supply context information.
Furthermore, we provide a SPARQL endpoint - a semantic interface that offers
direct access to the semantic and latent representations of geographic entities
in OSM.
- Abstract(参考訳): OpenStreetMap (OSM) は現在、地理的エンティティ(例えば、建物や道路)に関する最も豊富な公開情報ソースである。
しかし、機械学習モデルやその他のアプリケーションにおけるOSMエンティティの使用は、OSMの大規模化、エンティティアノテーションの極端な異質性、エンティティのセマンティクスとプロパティを記述するための明確なオントロジーの欠如など、困難である。
本稿は,OSMデータセット全体を包含し,180か国9億8000万以上の地理的エンティティの潜在表現を提供する,OSMエンティティの独自で包括的なオープンコーパスであるGeoVectorsについて述べる。
GeoVectors corpusはOSMエンティティのセマンティック次元と地理的次元をキャプチャし、これらのエンティティを機械学習アルゴリズムやセマンティックアプリケーションに直接アクセスできるようにする。
我々は、コンテキスト情報を提供するためにWikidataとDBpediaの知識グラフへのアイデンティティリンクを含むGeoVectors corpusのセマンティック記述を作成する。
さらに、OSM内の地理的エンティティのセマンティックおよび潜在表現に直接アクセスするセマンティックインターフェースであるSPARQLエンドポイントを提供する。
関連論文リスト
- Where on Earth Do Users Say They Are?: Geo-Entity Linking for Noisy Multilingual User Input [2.516307239032451]
本稿では,実世界の位置情報をラベル付きユーザ・インプット・ロケーション名から平均的な埋め込みとして表現する手法を提案する。
本稿では,グローバルおよび多言語ソーシャルメディアデータセット上でのジオエンタリティリンクの改善について述べる。
論文 参考訳(メタデータ) (2024-04-29T15:18:33Z) - GeoLM: Empowering Language Models for Geospatially Grounded Language
Understanding [45.36562604939258]
本稿では,自然言語におけるジオテリティーの理解を深める言語モデルGeoLMを紹介する。
また、GeoLMは、トポノニム認識、トポノニムリンク、関係抽出、ジオエンタリティタイピングをサポートする有望な能力を示すことを示した。
論文 参考訳(メタデータ) (2023-10-23T01:20:01Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - SpaBERT: A Pretrained Language Model from Geographic Data for Geo-Entity
Representation [25.52363878314735]
SpaBERTは、地理空間データ内の隣接するエンティティに基づいた汎用的なジオエンタリティ表現を提供する。
SpaBERTは、マスク付き言語モデリングとマスク付きエンティティ予測タスクで事前訓練されている。
SpaBERTを2つの下流タスク、ジオエンティタイピングとジオエンティリンクに適用する。
論文 参考訳(メタデータ) (2022-10-21T19:42:32Z) - MobIE: A German Dataset for Named Entity Recognition, Entity Linking and
Relation Extraction in the Mobility Domain [76.21775236904185]
データセットは3,232のソーシャルメディアテキストと91Kトークンによるトラフィックレポートで構成され、20.5Kアノテーション付きエンティティを含んでいる。
データセットのサブセットには,7つのモビリティ関連,n-ary関係型がアノテートされている。
私たちの知る限りでは、NER、EL、REのアノテーションを組み合わせた最初のドイツ語データセットです。
論文 参考訳(メタデータ) (2021-08-16T08:21:50Z) - Towards Neural Schema Alignment for OpenStreetMap and Knowledge Graphs [0.966840768820136]
OpenStreetMap (OSM) は、ボランティアによる地理的情報の最も豊富に公開されている情報源の1つである。
知識グラフはOSMエンティティの強化に有用なセマンティック情報を提供する可能性がある。
本稿では,OSMタグと対応する知識グラフクラスとの整合性について,スキーマ層とインスタンス層を協調的に検討して考察する。
そこで我々は,OSMと知識グラフの連結エンティティを用いて生成したタグ・ツー・クラスアライメントに対して,共有潜在空間を生かした新しいニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-07-28T10:40:35Z) - Linking OpenStreetMap with Knowledge Graphs -- Link Discovery for
Schema-Agnostic Volunteered Geographic Information [3.04585143845864]
知識グラフにおいて,OSMノードと地理的エンティティ間のIDリンクを予測する新しいリンク発見手法OSM2KGを提案する。
OSM2KGアプローチのコアは、埋め込みにおけるセマンティックノードの類似性をキャプチャする、新しい潜在的でコンパクトなOSMノード表現である。
いくつかのOSMデータセットとWikidataおよびDBpediaナレッジグラフを用いて実験を行い、OSM2KGがアイデンティティリンクを確実に発見できることを実証した。
論文 参考訳(メタデータ) (2020-11-06T19:03:41Z) - OpenStreetMap: Challenges and Opportunities in Machine Learning and
Remote Sensing [66.23463054467653]
本稿では,OpenStreetMapデータの改良と利用のための機械学習に基づく最近の手法について述べる。
私たちは、OSMがリモートセンシングデータの解釈方法を変え、機械学習とのシナジーが参加型マップ作成をスケールできると考えている。
論文 参考訳(メタデータ) (2020-07-13T09:58:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。