論文の概要: MapReader: A Computer Vision Pipeline for the Semantic Exploration of
Maps at Scale
- arxiv url: http://arxiv.org/abs/2111.15592v1
- Date: Tue, 30 Nov 2021 17:37:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 15:03:13.166272
- Title: MapReader: A Computer Vision Pipeline for the Semantic Exploration of
Maps at Scale
- Title(参考訳): mapreader: 大規模地図の意味的探索のためのコンピュータビジョンパイプライン
- Authors: Kasra Hosseini, Daniel C.S. Wilson, Kaspar Beelen, Katherine McDonough
- Abstract要約: 我々はMapReaderを紹介します。これはPythonで書かれたフリーのオープンソースソフトウェアライブラリで、大きなマップコレクション(スキャンまたは誕生デジタル)を解析します。
MapReaderを使えば、コンピュータビジョンの専門知識がほとんど、あるいは全くないユーザが、Webサーバ経由でマップを検索できる。
MapReaderパイプラインからの出力は他の外部データセットとどのようにリンクするかを示す。
- 参考スコア(独自算出の注目度): 1.5894241142512051
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present MapReader, a free, open-source software library written in Python
for analyzing large map collections (scanned or born-digital). This library
transforms the way historians can use maps by turning extensive, homogeneous
map sets into searchable primary sources. MapReader allows users with little or
no computer vision expertise to i) retrieve maps via web-servers; ii)
preprocess and divide them into patches; iii) annotate patches; iv) train,
fine-tune, and evaluate deep neural network models; and v) create structured
data about map content. We demonstrate how MapReader enables historians to
interpret a collection of $\approx$16K nineteenth-century Ordnance Survey map
sheets ($\approx$30.5M patches), foregrounding the challenge of translating
visual markers into machine-readable data. We present a case study focusing on
British rail infrastructure and buildings as depicted on these maps. We also
show how the outputs from the MapReader pipeline can be linked to other,
external datasets, which we use to evaluate as well as enrich and interpret the
results. We release $\approx$62K manually annotated patches used here for
training and evaluating the models.
- Abstract(参考訳): 我々は、Pythonで書かれた無料のオープンソースソフトウェアライブラリであるMapReaderを紹介します。
このライブラリは、広範で均一なマップセットを検索可能な一次情報源に変換することによって、歴史学者が地図を使用する方法を変える。
MapReaderはコンピュータービジョンの専門知識をほとんど、あるいは全く持たないユーザーに提供
一 ウェブサーバを介して地図を取得すること。
二 前処理してパッチに分割すること。
三 パッチの注釈
四 深層ニューラルネットワークモデルの列車、微調整及び評価
五 地図の内容に関する構造化データを作成すること。
MapReaderは、歴史学者が19世紀のOrdnance Survey Mapシート(30.5Mパッチ)を$\approx$16Kで解釈し、視覚マーカーを機械可読データに変換するという課題を先導する。
本稿では、これらの地図に描かれたイギリスの鉄道インフラと建物に着目したケーススタディについて述べる。
また、mapreaderパイプラインからの出力を他の外部データセットとリンクする方法を示し、その結果を豊かにし、解釈するために使用します。
ここでモデルのトレーニングと評価に使用される手作業で約62kドルのパッチをリリースします。
関連論文リスト
- Radio Map Estimation -- An Open Dataset with Directive Transmitter
Antennas and Initial Experiments [49.61405888107356]
実世界の現実的な都市地図とオープンなデータソースからの航空画像とともに、シミュレーションされた経路損失無線マップのデータセットをリリースする。
モデルアーキテクチャ,入力特徴設計,航空画像からの無線マップの推定に関する実験を行った。
論文 参考訳(メタデータ) (2024-01-12T14:56:45Z) - Mind the map! Accounting for existing map information when estimating online HDMaps from sensor [15.275704436439012]
HDMapをセンサーから推定することで、コストを大幅に削減できる。
提案手法は,HDMapを推定する際の正確な状況の既存のマップを推定する。
我々は,新しいオンラインHDMap推定フレームワークであるMapEXを紹介する。
論文 参考訳(メタデータ) (2023-11-17T13:40:10Z) - Language-enhanced RNR-Map: Querying Renderable Neural Radiance Field
maps with natural language [51.805056586678184]
自然言語クエリプロンプトを用いた視覚ナビゲーションのための言語拡張型Renderable Neural Radiance Mapを提案する。
Le-RNR-Mapは、各ピクセルに配置された遅延符号からなるグリッド構造を用いる。
CLIPをベースとした埋め込みコードによりRNRマップを強化し,ラベルデータを追加せずに自然言語検索を可能にする。
論文 参考訳(メタデータ) (2023-08-17T08:27:01Z) - The mapKurator System: A Complete Pipeline for Extracting and Linking
Text from Historical Maps [7.209761597734092]
mapKuratorは、マシンラーニングモデルと包括的なデータ処理パイプラインを統合するエンドツーエンドシステムである。
我々はmapKuratorシステムをデプロイし、David Rumsey Historical Mapコレクションに6万以上の地図と1億以上のテキスト/場所名の処理を可能にしました。
論文 参考訳(メタデータ) (2023-06-29T16:05:40Z) - SNAP: Self-Supervised Neural Maps for Visual Positioning and Semantic
Understanding [57.108301842535894]
我々は、地上と頭上の画像からリッチなニューラル2Dマップを学習するディープネットワークSNAPを紹介する。
我々は、異なる入力から推定されるニューラルマップの整列をトレーニングし、何千万ものストリートビュー画像のカメラポーズでのみ監視する。
SNAPは、従来の手法の範囲を超えて、挑戦的な画像クエリの場所を解決できる。
論文 参考訳(メタデータ) (2023-06-08T17:54:47Z) - Argoverse 2: Next Generation Datasets for Self-Driving Perception and
Forecasting [64.7364925689825]
Argoverse 2(AV2)は、自動運転分野の研究の知覚と予測のための3つのデータセットの集合である。
Lidarデータセットには、ラベルなしのLidar点雲とマップ整列ポーズの2万のシーケンスが含まれている。
Motion Forecastingデータセットには、各ローカルシーンにおける自動運転車と他のアクター間の興味深い、挑戦的なインタラクションのために採掘された25万のシナリオが含まれている。
論文 参考訳(メタデータ) (2023-01-02T00:36:22Z) - VectorMapNet: End-to-end Vectorized HD Map Learning [18.451587680552464]
本稿では,VectorMapNetと呼ばれるエンドツーエンドのベクトル化HDマップ学習パイプラインを紹介する。
このパイプラインは、地図要素間の空間的関係を明示的にモデル化し、下流の自律運転タスクに相応しいベクトル化されたマップを生成することができる。
VectorMapNetはnuScenesとArgo2データセットの両方で強力なマップ学習性能を実現する。
論文 参考訳(メタデータ) (2022-06-17T17:57:13Z) - Synthetic Map Generation to Provide Unlimited Training Data for
Historical Map Text Detection [5.872532529455414]
そこで本研究では,テキスト検出モデルのトレーニングのために,注釈付き歴史地図画像の無限量の自動生成手法を提案する。
我々は,現在最先端のテキスト検出モデルが,合成歴史地図の恩恵を受けることを示す。
論文 参考訳(メタデータ) (2021-12-12T00:27:03Z) - An Automatic Approach for Generating Rich, Linked Geo-Metadata from
Historical Map Images [6.962949867017594]
本稿では,歴史地図画像の検索と索引付けの現実的問題に対処するエンド・ツー・エンドのアプローチを提案する。
我々はmapKuratorと呼ばれるシステムでこのアプローチを実装した。
論文 参考訳(メタデータ) (2021-12-03T01:44:38Z) - HDNET: Exploiting HD Maps for 3D Object Detection [99.49035895393934]
高精細度(hd)マップは、現代の3dオブジェクト検出器の性能と頑健性を高める強力な事前情報を提供する。
我々はHDマップから幾何学的特徴と意味的特徴を抽出する単一ステージ検出器を設計する。
地図は至る所では利用できないため、生のLiDARデータからフライ時の地図を推定するマップ予測モジュールも提案する。
論文 参考訳(メタデータ) (2020-12-21T21:59:54Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。