論文の概要: MapReader: A Computer Vision Pipeline for the Semantic Exploration of
Maps at Scale
- arxiv url: http://arxiv.org/abs/2111.15592v1
- Date: Tue, 30 Nov 2021 17:37:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 15:03:13.166272
- Title: MapReader: A Computer Vision Pipeline for the Semantic Exploration of
Maps at Scale
- Title(参考訳): mapreader: 大規模地図の意味的探索のためのコンピュータビジョンパイプライン
- Authors: Kasra Hosseini, Daniel C.S. Wilson, Kaspar Beelen, Katherine McDonough
- Abstract要約: 我々はMapReaderを紹介します。これはPythonで書かれたフリーのオープンソースソフトウェアライブラリで、大きなマップコレクション(スキャンまたは誕生デジタル)を解析します。
MapReaderを使えば、コンピュータビジョンの専門知識がほとんど、あるいは全くないユーザが、Webサーバ経由でマップを検索できる。
MapReaderパイプラインからの出力は他の外部データセットとどのようにリンクするかを示す。
- 参考スコア(独自算出の注目度): 1.5894241142512051
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present MapReader, a free, open-source software library written in Python
for analyzing large map collections (scanned or born-digital). This library
transforms the way historians can use maps by turning extensive, homogeneous
map sets into searchable primary sources. MapReader allows users with little or
no computer vision expertise to i) retrieve maps via web-servers; ii)
preprocess and divide them into patches; iii) annotate patches; iv) train,
fine-tune, and evaluate deep neural network models; and v) create structured
data about map content. We demonstrate how MapReader enables historians to
interpret a collection of $\approx$16K nineteenth-century Ordnance Survey map
sheets ($\approx$30.5M patches), foregrounding the challenge of translating
visual markers into machine-readable data. We present a case study focusing on
British rail infrastructure and buildings as depicted on these maps. We also
show how the outputs from the MapReader pipeline can be linked to other,
external datasets, which we use to evaluate as well as enrich and interpret the
results. We release $\approx$62K manually annotated patches used here for
training and evaluating the models.
- Abstract(参考訳): 我々は、Pythonで書かれた無料のオープンソースソフトウェアライブラリであるMapReaderを紹介します。
このライブラリは、広範で均一なマップセットを検索可能な一次情報源に変換することによって、歴史学者が地図を使用する方法を変える。
MapReaderはコンピュータービジョンの専門知識をほとんど、あるいは全く持たないユーザーに提供
一 ウェブサーバを介して地図を取得すること。
二 前処理してパッチに分割すること。
三 パッチの注釈
四 深層ニューラルネットワークモデルの列車、微調整及び評価
五 地図の内容に関する構造化データを作成すること。
MapReaderは、歴史学者が19世紀のOrdnance Survey Mapシート(30.5Mパッチ)を$\approx$16Kで解釈し、視覚マーカーを機械可読データに変換するという課題を先導する。
本稿では、これらの地図に描かれたイギリスの鉄道インフラと建物に着目したケーススタディについて述べる。
また、mapreaderパイプラインからの出力を他の外部データセットとリンクする方法を示し、その結果を豊かにし、解釈するために使用します。
ここでモデルのトレーニングと評価に使用される手作業で約62kドルのパッチをリリースします。
関連論文リスト
- TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文 参考訳(メタデータ) (2024-11-22T06:13:42Z) - Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - Integrating Visual and Textual Inputs for Searching Large-Scale Map Collections with CLIP [0.09208007322096533]
自然言語入力を用いて大規模地図コレクションを対話的に検索する可能性について検討する。
ケーススタディでは,議会図書館のAPIを通じて公開されている地図の572,842枚を採用。
本稿では,議会地理地図局の職員との相談で作成した検索結果について紹介する。
論文 参考訳(メタデータ) (2024-10-02T02:51:02Z) - Radio Map Estimation -- An Open Dataset with Directive Transmitter
Antennas and Initial Experiments [49.61405888107356]
実世界の現実的な都市地図とオープンなデータソースからの航空画像とともに、シミュレーションされた経路損失無線マップのデータセットをリリースする。
モデルアーキテクチャ,入力特徴設計,航空画像からの無線マップの推定に関する実験を行った。
論文 参考訳(メタデータ) (2024-01-12T14:56:45Z) - Mind the map! Accounting for existing map information when estimating online HDMaps from sensor [15.275704436439012]
HDMapをセンサーから推定することで、コストを大幅に削減できる。
提案手法は,HDMapを推定する際の正確な状況の既存のマップを推定する。
我々は,新しいオンラインHDMap推定フレームワークであるMapEXを紹介する。
論文 参考訳(メタデータ) (2023-11-17T13:40:10Z) - Language-enhanced RNR-Map: Querying Renderable Neural Radiance Field
maps with natural language [51.805056586678184]
自然言語クエリプロンプトを用いた視覚ナビゲーションのための言語拡張型Renderable Neural Radiance Mapを提案する。
Le-RNR-Mapは、各ピクセルに配置された遅延符号からなるグリッド構造を用いる。
CLIPをベースとした埋め込みコードによりRNRマップを強化し,ラベルデータを追加せずに自然言語検索を可能にする。
論文 参考訳(メタデータ) (2023-08-17T08:27:01Z) - The mapKurator System: A Complete Pipeline for Extracting and Linking
Text from Historical Maps [7.209761597734092]
mapKuratorは、マシンラーニングモデルと包括的なデータ処理パイプラインを統合するエンドツーエンドシステムである。
我々はmapKuratorシステムをデプロイし、David Rumsey Historical Mapコレクションに6万以上の地図と1億以上のテキスト/場所名の処理を可能にしました。
論文 参考訳(メタデータ) (2023-06-29T16:05:40Z) - SNAP: Self-Supervised Neural Maps for Visual Positioning and Semantic
Understanding [57.108301842535894]
我々は、地上と頭上の画像からリッチなニューラル2Dマップを学習するディープネットワークSNAPを紹介する。
我々は、異なる入力から推定されるニューラルマップの整列をトレーニングし、何千万ものストリートビュー画像のカメラポーズでのみ監視する。
SNAPは、従来の手法の範囲を超えて、挑戦的な画像クエリの場所を解決できる。
論文 参考訳(メタデータ) (2023-06-08T17:54:47Z) - Synthetic Map Generation to Provide Unlimited Training Data for
Historical Map Text Detection [5.872532529455414]
そこで本研究では,テキスト検出モデルのトレーニングのために,注釈付き歴史地図画像の無限量の自動生成手法を提案する。
我々は,現在最先端のテキスト検出モデルが,合成歴史地図の恩恵を受けることを示す。
論文 参考訳(メタデータ) (2021-12-12T00:27:03Z) - An Automatic Approach for Generating Rich, Linked Geo-Metadata from
Historical Map Images [6.962949867017594]
本稿では,歴史地図画像の検索と索引付けの現実的問題に対処するエンド・ツー・エンドのアプローチを提案する。
我々はmapKuratorと呼ばれるシステムでこのアプローチを実装した。
論文 参考訳(メタデータ) (2021-12-03T01:44:38Z) - HDNET: Exploiting HD Maps for 3D Object Detection [99.49035895393934]
高精細度(hd)マップは、現代の3dオブジェクト検出器の性能と頑健性を高める強力な事前情報を提供する。
我々はHDマップから幾何学的特徴と意味的特徴を抽出する単一ステージ検出器を設計する。
地図は至る所では利用できないため、生のLiDARデータからフライ時の地図を推定するマップ予測モジュールも提案する。
論文 参考訳(メタデータ) (2020-12-21T21:59:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。