論文の概要: Automatic Search of Multiword Place Names on Historical Maps
- arxiv url: http://arxiv.org/abs/2410.15586v2
- Date: Tue, 22 Oct 2024 03:07:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 12:31:03.343823
- Title: Automatic Search of Multiword Place Names on Historical Maps
- Title(参考訳): 歴史地図を用いた複数単語地名の自動検索
- Authors: Rhett Olson, Jina Kim, Yao-Yi Chiang,
- Abstract要約: 本稿では,過去の地図上で与えられた複数単語の地名を検索する効率的なクエリ手法を提案する。
過去の地図上での単語認識手法を用いて,最小分散木を構築することにより,単一単語のテキストラベルを潜在的多語句にリンクする。
- 参考スコア(独自算出の注目度): 5.932055389589979
- License:
- Abstract: Historical maps are invaluable sources of information about the past, and scanned historical maps are increasingly accessible in online libraries. To retrieve maps from these large libraries that contain specific places of interest, previous work has applied computer vision techniques to recognize words on historical maps, enabling searches for maps that contain specific place names. However, searching for multiword place names is challenging due to complex layouts of text labels on historical maps. This paper proposes an efficient query method for searching a given multiword place name on historical maps. Using existing methods to recognize words on historical maps, we link single-word text labels into potential multiword phrases by constructing minimum spanning trees. These trees aim to link pairs of text labels that are spatially close and have similar height, angle, and capitalization. We then query these trees for the given multiword place name. We evaluate the proposed method in two experiments: 1) to evaluate the accuracy of the minimum spanning tree approach at linking multiword place names and 2) to evaluate the number and time range of maps retrieved by the query approach. The resulting maps reveal how places using multiword names have changed on a large number of maps from across history.
- Abstract(参考訳): 歴史地図は過去に関する情報の貴重な情報源であり、スキャンされた歴史地図はオンライン図書館でアクセスしやすくなっている。
特定の場所を含むこれらの大きな図書館から地図を検索するために、過去の研究はコンピュータビジョン技術を用いて歴史的地図上の単語を認識し、特定の場所名を含む地図の検索を可能にした。
しかし、歴史的地図上のテキストラベルの複雑なレイアウトのため、複数単語の地名の検索は困難である。
本稿では,過去の地図上で与えられた複数単語の地名を検索する効率的なクエリ手法を提案する。
過去の地図上での単語認識手法を用いて,最小分散木を構築することにより,単一単語のテキストラベルを潜在的多語句にリンクする。
これらの木は、空間的に近接し、高さ、角度、大文字化に類似したテキストラベルのペアをリンクすることを目的としている。
次に、これらの木に与えられたマルチワードの地名を問い合わせます。
提案手法を2つの実験で評価する。
1)複数単語の地名をリンクする際の最小スパンニングツリーアプローチの精度を評価すること。
2) 問合せ手法により検索した地図の数と時間範囲を評価する。
結果として得られた地図は、歴史的に多くの地図において、マルチワード名を用いた場所がどのように変化したかを明らかにしている。
関連論文リスト
- Tag Map: A Text-Based Map for Spatial Reasoning and Navigation with Large Language Models [15.454856838083511]
大言語モデル(LLM)は、ロボットが共通感覚推論を用いてタスクプランを生成するためのツールとして登場した。
最近の研究は、固定された意味クラスを持つ明示的な写像から暗黙的なオープンな語彙マップへと移行している。
LLMと簡単に統合しながら、数千のセマンティッククラスを表現できる明示的なテキストベースのマップを提案する。
論文 参考訳(メタデータ) (2024-09-23T18:26:19Z) - Hierarchical Text Spotter for Joint Text Spotting and Layout Analysis [52.01356859448068]
HTSは画像中のテキストを認識し、文字、単語、行、段落の4段階の階層構造を識別することができる。
HTSは、複数の単語レベルのテキストスポッティングベンチマークデータセットと幾何学的レイアウト解析タスクの最先端結果を達成する。
論文 参考訳(メタデータ) (2023-10-25T22:23:54Z) - The mapKurator System: A Complete Pipeline for Extracting and Linking
Text from Historical Maps [7.209761597734092]
mapKuratorは、マシンラーニングモデルと包括的なデータ処理パイプラインを統合するエンドツーエンドシステムである。
我々はmapKuratorシステムをデプロイし、David Rumsey Historical Mapコレクションに6万以上の地図と1億以上のテキスト/場所名の処理を可能にしました。
論文 参考訳(メタデータ) (2023-06-29T16:05:40Z) - Efficient Image-Text Retrieval via Keyword-Guided Pre-Screening [53.1711708318581]
現在の画像テキスト検索法は、N$関連時間複雑さに悩まされている。
本稿では,画像テキスト検索のための簡易かつ効果的なキーワード誘導事前スクリーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-14T09:36:42Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Synthetic Map Generation to Provide Unlimited Training Data for
Historical Map Text Detection [5.872532529455414]
そこで本研究では,テキスト検出モデルのトレーニングのために,注釈付き歴史地図画像の無限量の自動生成手法を提案する。
我々は,現在最先端のテキスト検出モデルが,合成歴史地図の恩恵を受けることを示す。
論文 参考訳(メタデータ) (2021-12-12T00:27:03Z) - An Automatic Approach for Generating Rich, Linked Geo-Metadata from
Historical Map Images [6.962949867017594]
本稿では,歴史地図画像の検索と索引付けの現実的問題に対処するエンド・ツー・エンドのアプローチを提案する。
我々はmapKuratorと呼ばれるシステムでこのアプローチを実装した。
論文 参考訳(メタデータ) (2021-12-03T01:44:38Z) - More Than Words: Collocation Tokenization for Latent Dirichlet
Allocation Models [71.42030830910227]
モデルが異なる環境でクラスタリングの品質を測定するための新しい指標を提案する。
マージトークンでトレーニングされたトピックは、マージされていないモデルよりも、より明確で、一貫性があり、トピックを区別する効果が高いトピックキーをもたらすことを示す。
論文 参考訳(メタデータ) (2021-08-24T14:08:19Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - Automatically Identifying Words That Can Serve as Labels for Few-Shot
Text Classification [12.418532541734193]
最近のテキスト分類のアプローチでは、テキスト入力をある種のタスク記述を含むクローズ質問に変換し、事前訓練された言語モデルで処理し、予測された単語をラベルにマッピングする。
この問題を軽減するために、少量のトレーニングデータからそのようなマッピングを自動的に見つけるアプローチを考案する。
多くのタスクにおいて、我々の手法で発見されたマッピングは、手作りのラベルと単語のマッピングとほぼ同等に機能する。
論文 参考訳(メタデータ) (2020-10-26T14:56:22Z) - A Multi-Perspective Architecture for Semantic Code Search [58.73778219645548]
テキストマッチングのための新しい多言語間ニューラルネットワークを提案する。
CoNaLaデータセットを用いた実験により,提案したモデルでは,従来の手法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2020-05-06T04:46:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。