論文の概要: Where on Earth Do Users Say They Are?: Geo-Entity Linking for Noisy Multilingual User Input
- arxiv url: http://arxiv.org/abs/2404.18784v1
- Date: Mon, 29 Apr 2024 15:18:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-30 13:08:44.507287
- Title: Where on Earth Do Users Say They Are?: Geo-Entity Linking for Noisy Multilingual User Input
- Title(参考訳): ユーザはどこにいるか?: ノイズの多い多言語ユーザ入力のためのジオエンティティリンク
- Authors: Tessa Masis, Brendan O'Connor,
- Abstract要約: 本稿では,実世界の位置情報をラベル付きユーザ・インプット・ロケーション名から平均的な埋め込みとして表現する手法を提案する。
本稿では,グローバルおよび多言語ソーシャルメディアデータセット上でのジオエンタリティリンクの改善について述べる。
- 参考スコア(独自算出の注目度): 2.516307239032451
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Geo-entity linking is the task of linking a location mention to the real-world geographic location. In this paper we explore the challenging task of geo-entity linking for noisy, multilingual social media data. There are few open-source multilingual geo-entity linking tools available and existing ones are often rule-based, which break easily in social media settings, or LLM-based, which are too expensive for large-scale datasets. We present a method which represents real-world locations as averaged embeddings from labeled user-input location names and allows for selective prediction via an interpretable confidence score. We show that our approach improves geo-entity linking on a global and multilingual social media dataset, and discuss progress and problems with evaluating at different geographic granularities.
- Abstract(参考訳): ジオエンタリティリンク(Geo-entity Linking)は、現実世界の位置情報に言及した位置情報をリンクするタスクである。
本稿では,ノイズの多い多言語ソーシャルメディアデータに対するジオエンタリティリンクの課題について検討する。
利用可能なオープンソースの多言語ジオエンタリティリンクツールはほとんどなく、既存のものはしばしばルールベースで、ソーシャルメディアの設定やLLMベースで簡単に壊れるが、大規模なデータセットには高すぎる。
本稿では,実世界の位置情報をラベル付きユーザ・インプット・ロケーション名から平均的な埋め込みとして表現し,解釈可能な信頼度スコアによる選択的予測を可能にする手法を提案する。
提案手法は,グローバルかつ多言語なソーシャルメディアデータセット上でのジオエンタリティリンクを改善し,異なる地理的粒度で評価する際の進歩と課題を議論する。
関連論文リスト
- Leveraging Large Language Models to Geolocate Linguistic Variations in Social Media Posts [0.0]
大きな言語モデル(LLM)を活用することで、イタリア語で書かれたツイートをジオローカライズするという課題に対処する。
我々のアプローチは、これらの地理的局在化の側面を同時に予測するために、訓練済みのLLMを微調整することである。
この研究は、バーティノロ国際スプリングスクール2024のLarge Language Modelsコースの一部として実施されている。
論文 参考訳(メタデータ) (2024-07-22T20:54:35Z) - GeoLM: Empowering Language Models for Geospatially Grounded Language
Understanding [45.36562604939258]
本稿では,自然言語におけるジオテリティーの理解を深める言語モデルGeoLMを紹介する。
また、GeoLMは、トポノニム認識、トポノニムリンク、関係抽出、ジオエンタリティタイピングをサポートする有望な能力を示すことを示した。
論文 参考訳(メタデータ) (2023-10-23T01:20:01Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - MGeo: Multi-Modal Geographic Pre-Training Method [49.78466122982627]
マルチモーダルジオグラフィック言語モデル(MGeo)を提案する。
MGeoはGCを新しいモダリティとして表現し、正確なクエリ-POIマッチングのためのマルチモーダル相関を完全に抽出することができる。
提案するマルチモーダル事前学習法は,汎用PTMのクエリ-POIマッチング能力を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-11T03:05:12Z) - Geosocial Location Classification: Associating Type to Places Based on
Geotagged Social-Media Posts [22.313111311130662]
位置への関連付けは、地図を豊かにするために使用することができ、地理空間的応用の多さに役立てることができる。
本研究では, 建物などの立地形態をソーシャルメディアの投稿に基づいて把握し, 位置分類の課題について検討する。
論文 参考訳(メタデータ) (2020-02-05T16:09:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。