論文の概要: Subnational Geocoding of Global Disasters Using Large Language Models
- arxiv url: http://arxiv.org/abs/2511.14788v1
- Date: Thu, 13 Nov 2025 17:04:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.446927
- Title: Subnational Geocoding of Global Disasters Using Large Language Models
- Title(参考訳): 大規模言語モデルを用いた地球規模の災害のジオコーディング
- Authors: Michele Ronco, Damien Delforge, Wiebke S. Jäger, Christina Corbane,
- Abstract要約: 災害リスク評価や災害リスク低減には, 災害時の位置情報が不可欠である。
災害データベースは、不整合な粒度や綴りを含む非構造化のテキスト形式で位置を報告し、空間データセットとの統合が困難になる。
GPT-4o を用いてテキストの位置情報を処理し,クリーン化する,完全に自動化された LLM 支援ワークフローを提案する。
- 参考スコア(独自算出の注目度): 0.04374837991804084
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Subnational location data of disaster events are critical for risk assessment and disaster risk reduction. Disaster databases such as EM-DAT often report locations in unstructured textual form, with inconsistent granularity or spelling, that make it difficult to integrate with spatial datasets. We present a fully automated LLM-assisted workflow that processes and cleans textual location information using GPT-4o, and assigns geometries by cross-checking three independent geoinformation repositories: GADM, OpenStreetMap and Wikidata. Based on the agreement and availability of these sources, we assign a reliability score to each location while generating subnational geometries. Applied to the EM-DAT dataset from 2000 to 2024, the workflow geocodes 14,215 events across 17,948 unique locations. Unlike previous methods, our approach requires no manual intervention, covers all disaster types, enables cross-verification across multiple sources, and allows flexible remapping to preferred frameworks. Beyond the dataset, we demonstrate the potential of LLMs to extract and structure geographic information from unstructured text, offering a scalable and reliable method for related analyses.
- Abstract(参考訳): 災害リスク評価や災害リスク低減には, 災害時の位置情報が不可欠である。
EM-DATのような災害データベースは、不整合な粒度や綴りのある、構造化されていないテキスト形式の場所を報告し、空間的なデータセットとの統合を困難にしている。
GPT-4oを用いてテキストの位置情報を処理し、クリーン化する完全に自動化されたLCM支援ワークフローを提案し、GADM、OpenStreetMap、Wikidataの3つの独立した地理情報リポジトリを相互にチェックすることでジオメトリを割り当てる。
これらのソースの合意と可用性に基づいて、各ロケーションに信頼性スコアを割り当て、サブナショナルジオメトリを生成します。
2000年から2024年までのEM-DATデータセットに適用されたワークフローは、17,948のユニークな場所にわたる14,215のイベントをジオコードする。
従来の手法とは異なり、我々のアプローチでは手作業による介入は不要で、すべての災害タイプをカバーし、複数のソースをまたいだ相互検証を可能にし、望ましいフレームワークに柔軟な再マッピングを可能にする。
データセット以外にも、構造化されていないテキストから地理情報を抽出し、構造化するLLMの可能性を実証し、関連解析のためのスケーラブルで信頼性の高い方法を提供する。
関連論文リスト
- ALIGN: A Vision-Language Framework for High-Accuracy Accident Location Inference through Geo-Spatial Neural Reasoning [0.0]
低所得国や中所得国の多くは、正確な場所固有のクラッシュデータ不足に直面している。
既存のテキストベースのジオコーディングツールは、多言語および非構造化のニュース環境では性能が良くない。
本研究では,事故座標を推定するための空間推論をエミュレートする視覚言語フレームワークであるALIGNを紹介する。
論文 参考訳(メタデータ) (2025-11-09T10:44:26Z) - Empowering LLM Agents with Geospatial Awareness: Toward Grounded Reasoning for Wildfire Response [9.801192259936888]
既存の統計的アプローチは意味的な文脈を欠くことが多く、イベント全体にわたって一般化し、限定的な解釈性を提供する。
地空間認識層(Geospatial Awareness Layer, GAL)を導入し, LLMエージェントを地球構造データに固定する。
GALは、外部ジオデータベースからインフラストラクチャ、人口統計、地形、気象情報を自動的に取得し、統合する。
このリッチなコンテキストにより、エージェントはエビデンスベースのリソース割り当てレコメンデーションを作成することができる。
論文 参考訳(メタデータ) (2025-10-14T01:59:02Z) - PlaceFM: A Training-free Geospatial Foundation Model of Places using Large-Scale Point of Interest Data [0.5735035463793009]
PlaceFMは、トレーニング不要のクラスタリングベースのアプローチを通じて、プレース表現をキャプチャする。
placeFMは、米国Foursquareのデータから構築された関心グラフの全点をまとめたものだ。
placeFMは、興味のある場所を自動的に識別しながら、汎用的な領域埋め込みを生成する。
placeFMは、大規模POIグラフ上の領域レベルの表現を生成する際に、最大100倍のスピードアップを達成する。
論文 参考訳(メタデータ) (2025-06-25T15:10:31Z) - Geographical Context Matters: Bridging Fine and Coarse Spatial Information to Enhance Continental Land Cover Mapping [2.9212099078191756]
BRIDGE-LCは,土地被覆分類プロセスに大規模地理空間情報を統合する,新しい深層学習フレームワークである。
その結果,地理空間情報の統合により土地被覆マッピング性能が向上することが示唆された。
論文 参考訳(メタデータ) (2025-04-16T17:42:46Z) - Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - MGeo: Multi-Modal Geographic Pre-Training Method [49.78466122982627]
マルチモーダルジオグラフィック言語モデル(MGeo)を提案する。
MGeoはGCを新しいモダリティとして表現し、正確なクエリ-POIマッチングのためのマルチモーダル相関を完全に抽出することができる。
提案するマルチモーダル事前学習法は,汎用PTMのクエリ-POIマッチング能力を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-11T03:05:12Z) - Robust Self-Tuning Data Association for Geo-Referencing Using Lane Markings [44.4879068879732]
本稿では,データアソシエーションにおけるあいまいさを解消するための完全なパイプラインを提案する。
その中核は、測定のエントロピーに応じて探索領域に適応する堅牢な自己調整データアソシエーションである。
ドイツ・カールスルーエ市周辺の都市・農村のシナリオを実データとして評価した。
論文 参考訳(メタデータ) (2022-07-28T12:29:39Z) - Regressing Location on Text for Probabilistic Geocoding [0.0]
テキストデータのジオコーディングのためのエンドツーエンド確率モデルを提案する。
ELECTRo-mapと呼ばれるモデルベースのソリューションと,イベントデータのテキストをジオコーディングする最先端のオープンソースシステムを比較した。
論文 参考訳(メタデータ) (2021-06-30T20:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。