論文の概要: MapSAM2: Adapting SAM2 for Automatic Segmentation of Historical Map Images and Time Series
- arxiv url: http://arxiv.org/abs/2510.27547v1
- Date: Fri, 31 Oct 2025 15:25:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:16.149877
- Title: MapSAM2: Adapting SAM2 for Automatic Segmentation of Historical Map Images and Time Series
- Title(参考訳): MapSAM2: 歴史的地図画像と時系列の自動セグメンテーションにSAM2を適用する
- Authors: Xue Xia, Randall Balestriero, Tao Zhang, Yixin Zhou, Andrew Ding, Dev Saini, Lorenz Hurni,
- Abstract要約: 歴史的地図画像と時系列の両方を自動的に分割する統合フレームワークであるMapSAM2を提案する。
画像の場合、タイルの集合をビデオとして処理し、メモリアテンション機構により、同様のタイルからコンテキストキューを組み込むことができる。
時系列に関して、アノテーションコストを低減するため、アノテーション付きSiegfried Building Time Seriesデータセットを導入します。
- 参考スコア(独自算出の注目度): 20.190148795374153
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Historical maps are unique and valuable archives that document geographic features across different time periods. However, automated analysis of historical map images remains a significant challenge due to their wide stylistic variability and the scarcity of annotated training data. Constructing linked spatio-temporal datasets from historical map time series is even more time-consuming and labor-intensive, as it requires synthesizing information from multiple maps. Such datasets are essential for applications such as dating buildings, analyzing the development of road networks and settlements, studying environmental changes etc. We present MapSAM2, a unified framework for automatically segmenting both historical map images and time series. Built on a visual foundation model, MapSAM2 adapts to diverse segmentation tasks with few-shot fine-tuning. Our key innovation is to treat both historical map images and time series as videos. For images, we process a set of tiles as a video, enabling the memory attention mechanism to incorporate contextual cues from similar tiles, leading to improved geometric accuracy, particularly for areal features. For time series, we introduce the annotated Siegfried Building Time Series Dataset and, to reduce annotation costs, propose generating pseudo time series from single-year maps by simulating common temporal transformations. Experimental results show that MapSAM2 learns temporal associations effectively and can accurately segment and link buildings in time series under limited supervision or using pseudo videos. We will release both our dataset and code to support future research.
- Abstract(参考訳): 歴史的地図は、異なる期間にまたがる地理的特徴を文書化する、ユニークで貴重なアーカイブである。
しかし, 歴史的地図画像の自動解析は, 広範囲なスタイリスティックな変動と, 注釈付きトレーニングデータの不足により, 依然として重要な課題である。
複数の地図から情報を合成する必要があるため、過去の地図時系列からリンクされた時空間データセットを構築するのはさらに時間がかかり、労力がかかる。
このようなデータセットは、デート・ビルディング、道路網や集落の発達分析、環境変化の研究などの応用に欠かせないものである。
歴史的地図画像と時系列の両方を自動的に分割する統合フレームワークであるMapSAM2を提案する。
ビジュアルファンデーションモデルに基づいて構築されたMapSAM2は、数ショットの微調整で多様なセグメンテーションタスクに適応する。
私たちの重要なイノベーションは、歴史的地図画像と時系列の両方をビデオとして扱うことです。
画像の場合、タイルの集合をビデオとして処理し、メモリアテンション機構が類似のタイルからのコンテキストキューを組み込むことで、特にアダル特徴の幾何学的精度が向上する。
時系列については,注釈付きSiegfried Building Time Series Datasetを導入し,アノテーションコストを削減するため,共通時間変換をシミュレートして,単一年図から擬似時系列を生成することを提案する。
実験の結果,MapSAM2は時間的関連を効果的に学習し,限られた監督や擬似ビデオを用いて時系列内の建物を正確に分類・リンクできることがわかった。
将来の研究をサポートするために、データセットとコードの両方をリリースします。
関連論文リスト
- HisTrackMap: Global Vectorized High-Definition Map Construction via History Map Tracking [24.21124150354725]
本稿では,地図要素の履歴軌跡を時間的に追跡することで,新たなエンドツーエンド追跡フレームワークのグローバルマップ構築を提案する。
このトラッキングフレームワーク内にMap-Trajectory Prior Fusionモジュールを導入し、追跡されたインスタンスの過去の事前情報を活用して、時間的滑らかさと連続性を改善する。
nuScenesとArgoverse2データセットに関する実質的な実験により、提案手法は、単一フレームおよび時間メトリクスの両方において、最先端(SOTA)メソッドよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-03-10T10:44:43Z) - Language in the Flow of Time: Time-Series-Paired Texts Weaved into a Unified Temporal Narrative [65.84249211767921]
テキスト・アズ・タイム・シリーズ(TaTS)は、既存の数値のみの時系列モデルにプラグインできる。
TaTSはモデルアーキテクチャを変更することなく予測性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2025-02-13T03:43:27Z) - Semantic Segmentation for Sequential Historical Maps by Learning from Only One Map [0.4915744683251151]
深層学習に基づくセマンティックセグメンテーションを用いたデジタル化の自動化手法を提案する。
このプロセスにおける重要な課題は、ディープニューラルネットワークのトレーニングに必要な地味なアノテーションの欠如である。
モデル微調整のための弱教師付き年齢追跡戦略を導入する。
論文 参考訳(メタデータ) (2025-01-03T14:55:22Z) - Self-supervised Video Instance Segmentation Can Boost Geographic Entity Alignment in Historical Maps [16.35356981558991]
ビデオ・インスタンス・セグメンテーション(VIS)を用いた歴史的地図における地理的実体のセグメンテーションとアソシエーションを組み合わせた新しいアプローチを提案する。
この課題を軽減するために,歴史地図上でのVIS性能を向上させる自己教師付き学習(SSL)技術について検討する。
論文 参考訳(メタデータ) (2024-11-26T13:31:51Z) - MapSAM: Adapting Segment Anything Model for Automated Feature Detection in Historical Maps [6.414068793245697]
我々は,パラメータ効率のよい微調整戦略であるMapSAMを紹介した。
具体的には、画像エンコーダにドメイン固有の知識を統合するために、Weight-Decomposed Low-Rank Adaptation (DoRA) を用いる。
手動入力を必要としない自動プロンプト生成プロセスを開発した。
論文 参考訳(メタデータ) (2024-11-11T13:18:45Z) - Deep Time Series Models: A Comprehensive Survey and Benchmark [60.742416934632416]
時系列は、その複雑でダイナミックな性質のために固有の課題を提示する。
近年、時系列コミュニティで顕著なブレークスルーが見られた。
多様な分析タスクのためのディープ時系列モデルの公正なベンチマークとして、時系列ライブラリ(TSLib)をリリースします。
論文 参考訳(メタデータ) (2024-07-18T08:31:55Z) - Cross-attention Spatio-temporal Context Transformer for Semantic
Segmentation of Historical Maps [18.016789471815855]
歴史的地図は、現代の地球観測技術が生まれる前に、地球表面の有用な時間的情報を提供する。
データ依存不確実性として知られるアレタリック不確実性は、元の地図シートの描画/フェーディング欠陥に固有のものである。
より広い範囲で情報を集約する地図と時間的シーケンスを融合するU-based networkを提案する。
論文 参考訳(メタデータ) (2023-10-19T09:49:58Z) - Novel Features for Time Series Analysis: A Complex Networks Approach [62.997667081978825]
時系列データは、気候、経済、医療などいくつかの領域で広く使われている。
最近の概念的アプローチは、複雑なネットワークへの時系列マッピングに依存している。
ネットワーク分析は、異なるタイプの時系列を特徴付けるのに使うことができる。
論文 参考訳(メタデータ) (2021-10-11T13:46:28Z) - Multi-Scale 2D Temporal Adjacent Networks for Moment Localization with
Natural Language [112.32586622873731]
自然言語による未編集映像から特定の瞬間を検索する問題に対処する。
我々は、時間スケールの異なる2次元マップのセットを用いて、ビデオモーメント間の時間的文脈をモデル化する。
モーメントローカライゼーションのためのシングルショットフレームワークであるMS-2D-TAN(Multi-Scale Temporal Adjacent Network)を提案する。
論文 参考訳(メタデータ) (2020-12-04T15:09:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。