論文の概要: Digital gazetteers: review and prospects for place name knowledge bases
- arxiv url: http://arxiv.org/abs/2507.08553v1
- Date: Fri, 11 Jul 2025 12:56:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-14 18:03:54.362045
- Title: Digital gazetteers: review and prospects for place name knowledge bases
- Title(参考訳): デジタルガゼッタ : 地名知識基盤のレビューと展望
- Authors: Kalana Wijegunarathna, Kristin Stock, Christopher B. Jones,
- Abstract要約: 我々は、データソース、コンポーネント、ソフトウェアおよびデータ管理技術、データ品質およびボランティアデータ、および、同じ現実世界の場所を参照するソースのマッチング方法についてレビューする。
我々は、名前の付いた場所のより豊かな表現、場所のアイデンティティと位置の時間的進化、データ統合のためのより効果的な方法の開発について、今後の研究の必要性を強調した。
- 参考スコア(独自算出の注目度): 0.5120567378386615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gazetteers typically store data on place names, place types and the associated coordinates. They play an essential role in disambiguating place names in online geographical information retrieval systems for navigation and mapping, detecting and disambiguating place names in text, and providing coordinates. Currently there are many gazetteers in use derived from many sources, with no commonly accepted standard for encoding the data. Most gazetteers are also very limited in the extent to which they represent the multiple facets of the named places yet they have potential to assist user search for locations with specific physical, commercial, social or cultural characteristics. With a view to understanding digital gazetteer technologies and advancing their future effectiveness for information retrieval, we provide a review of data sources, components, software and data management technologies, data quality and volunteered data, and methods for matching sources that refer to the same real-world places. We highlight the need for future work on richer representation of named places, the temporal evolution of place identity and location, and the development of more effective methods for data integration.
- Abstract(参考訳): ガゼッタは通常、場所名、場所タイプ、および関連する座標に関するデータを格納する。
それらは、ナビゲーションとマッピングのためのオンライン地理情報検索システムにおける地名の曖昧化、テキスト中の地名の検出と曖昧化、および座標の提供において重要な役割を担っている。
現在、多くのソースから派生したガゼッタが使われているが、データ符号化の標準は一般には受け入れられていない。
多くのガゼッタは、名前のついた場所の複数の面を表す程度に非常に制限されているが、特定の物理的、商業的、社会的、文化的特徴を持つ場所をユーザーが探すのを助ける可能性がある。
デジタルガゼッタ技術の理解と情報検索の今後の有効性向上をめざして、データソース、コンポーネント、ソフトウェアおよびデータ管理技術、データ品質とボランティアデータ、および同一の現実世界の場所を参照するソースのマッチング方法についてレビューする。
我々は、名前の付いた場所のより豊かな表現、場所のアイデンティティと位置の時間的進化、データ統合のためのより効果的な方法の開発について、今後の研究の必要性を強調した。
関連論文リスト
- Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - The mapKurator System: A Complete Pipeline for Extracting and Linking
Text from Historical Maps [7.209761597734092]
mapKuratorは、マシンラーニングモデルと包括的なデータ処理パイプラインを統合するエンドツーエンドシステムである。
我々はmapKuratorシステムをデプロイし、David Rumsey Historical Mapコレクションに6万以上の地図と1億以上のテキスト/場所名の処理を可能にしました。
論文 参考訳(メタデータ) (2023-06-29T16:05:40Z) - Multilingual News Location Detection using an Entity-Based Siamese
Network with Semi-Supervised Contrastive Learning and Knowledge Base [0.7734726150561089]
ニュース中の関連箇所の早期発見は、環境災害、戦争紛争、疫病の発生、政治的混乱などの極端な出来事において重要である。
テキストに明示的に言及されていない場合でも,関連する位置を推測するシステムを提案する。
我々は,ゴールド標準の多言語ニュースロケーションデータセットであるNewsLOCで研究コミュニティに貢献する。
論文 参考訳(メタデータ) (2022-12-22T16:42:21Z) - Location reference recognition from texts: A survey and comparison [9.36819544451632]
まず、地理情報検索、災害管理、災害監視、交通管理、空間人文科学、観光管理、犯罪管理の7つの典型的な応用分野を概説する。
次に、世界中の39,736個の位置参照を含む異なるタイプのテキストを持つ26の公開データセットに基づいて、最も広く使われている位置参照認識のための27の精度と計算効率を徹底的に評価した。
論文 参考訳(メタデータ) (2022-07-04T19:25:15Z) - Using Domain Knowledge for Low Resource Named Entity Recognition [2.749726993052939]
低リソース領域における名前付きエンティティ認識の性能向上のためにドメイン知識を利用することを提案する。
提案モデルでは、低リソースで名前付きエンティティ認識を処理しながら、異なるドメインでの大規模データ調整を回避する。
論文 参考訳(メタデータ) (2022-03-28T13:26:47Z) - Land use identification through social network interaction [0.0]
本研究では,NLP(Natural Language Processing)を用いた土地利用の識別手法を提案する。
目的は、住宅、商業、制度、産業、未建設の5つの主要な土地を識別することである。
論文 参考訳(メタデータ) (2021-12-05T22:55:57Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z) - Gender Recognition in Informal and Formal Language Scenarios via
Transfer Learning [11.048994919361034]
テキストデータに基づく性別、年齢、場所、性格などの人口統計特性の認識と識別は、異なるマーケティング戦略を改善するのに役立つ。
本稿では,再帰的・畳み込み型ニューラルネットワークの利用と,非公式言語や形式言語で書かれた文書における性別認識のための伝達学習戦略を提案する。
論文 参考訳(メタデータ) (2021-06-23T15:32:50Z) - Global Attention for Name Tagging [56.62059996864408]
ローカル、文書レベル、コーパスレベルのコンテキスト情報を活用することで、名前タグを改善するための新しいフレームワークを提案する。
本研究では,グローバルな注意を介し,文書レベルのコンテキスト情報とコーパスレベルのコンテキスト情報と,局所的なコンテキスト情報とを組み込むことを学習するモデルを提案する。
ベンチマークデータセットの実験は、我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-10-19T07:27:15Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z) - Placepedia: Comprehensive Place Understanding with Multi-Faceted
Annotations [79.80036503792985]
Placepediaは、240万のユニークな場所から3500万枚以上の写真を集めた大規模な場所データセットです。
写真に加えて、各場所にはGDP、人口など、膨大な多面的な情報も付属している。
このデータセットは大量のデータと豊富なアノテーションを持ち、様々な研究を行うことができる。
論文 参考訳(メタデータ) (2020-07-07T20:17:01Z) - From Topic Networks to Distributed Cognitive Maps: Zipfian Topic
Universes in the Area of Volunteered Geographic Information [59.0235296929395]
本研究では,テキストの話題レベルに関する地理情報のエンコードとネットワーク化について検討する。
本研究は,オンラインコミュニケーションにおいて地理的な場所が位置するテーマ宇宙のZipfian組織を示す。
互いに近いかどうかに関わらず、場所はトピックの宇宙における類似の作業にまたがる隣の場所にある。
論文 参考訳(メタデータ) (2020-02-04T18:31:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。