論文の概要: Are We There Yet? Evaluating State-of-the-Art Neural Network based
Geoparsers Using EUPEG as a Benchmarking Platform
- arxiv url: http://arxiv.org/abs/2007.07455v1
- Date: Wed, 15 Jul 2020 03:13:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 04:35:25.067661
- Title: Are We There Yet? Evaluating State-of-the-Art Neural Network based
Geoparsers Using EUPEG as a Benchmarking Platform
- Title(参考訳): まだいるのか?
EUPEGをベンチマークプラットフォームとした最先端ニューラルネットワークを用いたジオパーサの評価
- Authors: Jimin Wang, Yingjie Hu
- Abstract要約: 2019年6月、ジオパーシングコンペティション「Toponym Resolution in Scientific Papers」が開催された。
優勝チームは、優れたパフォーマンスを達成するニューラルネットワークベースのジオパーサーを開発した。
本研究は、最近開発されたベンチマークプラットフォームEUPEGを用いて、これらの最先端ジオパーサの体系的評価を行う。
- 参考スコア(独自算出の注目度): 2.8935588665357077
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geoparsing is an important task in geographic information retrieval. A
geoparsing system, known as a geoparser, takes some texts as the input and
outputs the recognized place mentions and their location coordinates. In June
2019, a geoparsing competition, Toponym Resolution in Scientific Papers, was
held as one of the SemEval 2019 tasks. The winning teams developed neural
network based geoparsers that achieved outstanding performances (over 90%
precision, recall, and F1 score for toponym recognition). This exciting result
brings the question "are we there yet?", namely have we achieved high enough
performances to possibly consider the problem of geoparsing as solved? One
limitation of this competition is that the developed geoparsers were tested on
only one dataset which has 45 research articles collected from the particular
domain of Bio-medicine. It is known that the same geoparser can have very
different performances on different datasets. Thus, this work performs a
systematic evaluation of these state-of-the-art geoparsers using our recently
developed benchmarking platform EUPEG that has eight annotated datasets, nine
baseline geoparsers, and eight performance metrics. The evaluation result
suggests that these new geoparsers indeed improve the performances of
geoparsing on multiple datasets although some challenges remain.
- Abstract(参考訳): ジオパーシングは地理情報検索において重要な課題である。
ジオパーサーとして知られるジオパーシングシステムは、入力としてテキストを取り、認識された場所の参照とその位置座標を出力する。
2019年6月、SemEval 2019タスクの1つとしてジオパーシングコンペティション「Toponym Resolution in Scientific Papers」が開催された。
優勝チームはニューラルネットワークベースのジオパーサを開発し、優れたパフォーマンス(90%以上の精度、リコール、f1スコア)を達成した。
このエキサイティングな結果から、“まだあるのか?”という疑問が生まれます。つまり、ジオペアリングの問題が解決できるくらい高いパフォーマンスを達成できたのでしょうか?
この競争の1つの制限は、開発されたジオパーサーが特定の生物医学領域から収集された45の研究論文からなる1つのデータセットでのみテストされたことである。
同じジオパーサーは異なるデータセット上で非常に異なるパフォーマンスを持つことが知られている。
そこで本研究では,8つの注釈付きデータセット,9つのベースラインジオパーサ,8つのパフォーマンス指標を備えた,最近開発されたベンチマークプラットフォームであるEUPEGを用いて,最先端のジオパーサを体系的に評価する。
評価結果は、これらの新しいジオパーザは、いくつかの課題はあるものの、複数のデータセット上でのジオパーシングのパフォーマンスを確実に改善していることを示唆している。
関連論文リスト
- TorchSpatial: A Location Encoding Framework and Benchmark for Spatial Representation Learning [36.725822223732635]
位置(ポイント)エンコーディングのための学習フレームワークとベンチマークであるTorchSpatialを提案する。
TorchSpatialには3つの重要なコンポーネントが含まれている: 1) 一般的に認識されている15のロケーションエンコーダを統合する統合されたロケーションエンコーダフレームワーク、2) LocBenchベンチマークタスクは、7つのジオアウェアイメージ分類と4つのジオアウェアイメージ回帰データセットを含む。
論文 参考訳(メタデータ) (2024-06-21T21:33:16Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - PIGEON: Predicting Image Geolocations [44.99833362998488]
本稿では, セマンティックジオセル生成, マルチタスクコントラスト事前学習, 新たな損失関数を組み合わせた新しいジオローカライズシステムを提案する。
PIGEOTTOは、目に見えない場所に効果的に一般化する最初の画像ジオローカライズモデルである。
論文 参考訳(メタデータ) (2023-07-11T23:36:49Z) - K2: A Foundation Language Model for Geoscience Knowledge Understanding
and Utilization [105.89544876731942]
大規模言語モデル(LLM)は自然言語処理の一般分野において大きな成功を収めている。
我々は、地球科学におけるLLM研究をさらに促進するために開発された一連の資源とともに、地球科学における最初のLLMであるK2を提示する。
論文 参考訳(メタデータ) (2023-06-08T09:29:05Z) - Arukikata Travelogue Dataset with Geographic Entity Mention,
Coreference, and Link Annotation [25.3010708569682]
本研究では,地理的な関係性を考慮した文書レベルのジオパーシングに着目した。
本稿では,文書レベルのジオパーシングシステムを評価するために設計された日本語旅行用データセットについて述べる。
論文 参考訳(メタデータ) (2023-05-23T09:07:42Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - MGeo: Multi-Modal Geographic Pre-Training Method [49.78466122982627]
マルチモーダルジオグラフィック言語モデル(MGeo)を提案する。
MGeoはGCを新しいモダリティとして表現し、正確なクエリ-POIマッチングのためのマルチモーダル相関を完全に抽出することができる。
提案するマルチモーダル事前学習法は,汎用PTMのクエリ-POIマッチング能力を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-11T03:05:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。