論文の概要: Automatic Uncertainty-Aware Synthetic Data Bootstrapping for Historical Map Segmentation
- arxiv url: http://arxiv.org/abs/2511.15875v1
- Date: Wed, 19 Nov 2025 21:02:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.375227
- Title: Automatic Uncertainty-Aware Synthetic Data Bootstrapping for Historical Map Segmentation
- Title(参考訳): 歴史地図セグメンテーションのための自動不確実性認識合成データブートストラップ
- Authors: Lukas Arzoumanidis, Julius Knechtel, Jan-Henrik Haunert, Youness Dehbi,
- Abstract要約: 深層学習に基づくほとんどの手法は、歴史的地図では利用できない大量の注釈付きトレーニングデータに依存している。
我々は、土地被覆解釈などのタスクに適した、事実上無制限の合成歴史地図をブートストラップする。
提案手法の有効性と適用性を評価するため,ドメイン適応セマンティックセマンティックセグメンテーションに生成されたトレーニングデータセットを用いた。
- 参考スコア(独自算出の注目度): 0.48998185508205744
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The automated analysis of historical documents, particularly maps, has drastically benefited from advances in deep learning and its success across various computer vision applications. However, most deep learning-based methods heavily rely on large amounts of annotated training data, which are typically unavailable for historical maps, especially for those belonging to specific, homogeneous cartographic domains, also known as corpora. Creating high-quality training data suitable for machine learning often takes a significant amount of time and involves extensive manual effort. While synthetic training data can alleviate the scarcity of real-world samples, it often lacks the affinity (realism) and diversity (variation) necessary for effective learning. By transferring the cartographic style of an original historical map corpus onto vector data, we bootstrap an effectively unlimited number of synthetic historical maps suitable for tasks such as land-cover interpretation of a homogeneous historical map corpus. We propose an automatic deep generative approach and a alternative manual stochastic degradation technique to emulate the visual uncertainty and noise, also known as data-dependent uncertainty, commonly observed in historical map scans. To quantitatively evaluate the effectiveness and applicability of our approach, the generated training datasets were employed for domain-adaptive semantic segmentation on a homogeneous map corpus using a Self-Constructing Graph Convolutional Network, enabling a comprehensive assessment of the impact of our data bootstrapping methods.
- Abstract(参考訳): 歴史文書、特に地図の自動解析は、ディープラーニングの進歩と様々なコンピュータビジョンアプリケーションにおけるその成功から大いに恩恵を受けている。
しかし、ディープラーニングに基づくほとんどの手法は大量の注釈付きトレーニングデータに大きく依存しており、特にコーパス(corpora)として知られる特定の均質な地図ドメインに属するものについては、歴史的地図では利用できないことが多い。
機械学習に適した高品質なトレーニングデータを作成するには、かなりの時間を要することが多く、広範囲な手作業が伴う。
人工的なトレーニングデータは現実世界のサンプルの不足を軽減することができるが、効果的な学習に必要な親和性(現実主義)と多様性(多様性)を欠いていることが多い。
原歴史地図コーパスの地図形式をベクトルデータに転送することにより,同種歴史地図コーパスの土地被覆解釈などのタスクに適した,事実上無制限な合成歴史地図をブートストラップする。
本稿では,過去の地図スキャンでよく見られる,データ依存的不確実性(データ依存的不確実性)と視覚的不確実性(ノイズ)をエミュレートするための,自動深度生成手法と,それに代わる手動確率分解手法を提案する。
提案手法の有効性と適用性を定量的に評価するために,自己構築型グラフ畳み込みネットワークを用いた同種マップコーパス上でのドメイン適応セマンティックセマンティックセマンティックセグメンテーションに,生成したトレーニングデータセットを用いて,データブートストラップ法の影響を包括的に評価した。
関連論文リスト
- Selective Embedding for Deep Learning [0.4499833362998489]
ディープラーニングアルゴリズムは入力データに敏感であり、非定常条件下では性能が劣化することが多い。
本研究では,1つの入力チャネル内の複数のソースから短いセグメントのデータを交換する,新しいデータロード戦略である選択的埋め込みを導入する。
論文 参考訳(メタデータ) (2025-07-16T15:45:01Z) - Semantic Segmentation for Sequential Historical Maps by Learning from Only One Map [0.4915744683251151]
深層学習に基づくセマンティックセグメンテーションを用いたデジタル化の自動化手法を提案する。
このプロセスにおける重要な課題は、ディープニューラルネットワークのトレーニングに必要な地味なアノテーションの欠如である。
モデル微調整のための弱教師付き年齢追跡戦略を導入する。
論文 参考訳(メタデータ) (2025-01-03T14:55:22Z) - Stochastic Amortization: A Unified Approach to Accelerate Feature and Data Attribution [62.71425232332837]
雑音ラベル付きモデルを用いたトレーニングは安価で驚くほど効果的であることを示す。
このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文 参考訳(メタデータ) (2024-01-29T03:42:37Z) - Terrain-Informed Self-Supervised Learning: Enhancing Building Footprint Extraction from LiDAR Data with Limited Annotations [1.3243401820948064]
フットプリントマップの構築は、広範な後処理なしで正確なフットプリント抽出を約束する。
ディープラーニング手法は、一般化とラベルの効率の面で課題に直面している。
リモートセンシングに適した地形認識型自己教師型学習を提案する。
論文 参考訳(メタデータ) (2023-11-02T12:34:23Z) - Neural Semantic Surface Maps [52.61017226479506]
本稿では,2つの属とゼロの形状の地図を自動計算する手法を提案する。
提案手法は,手動のアノテーションや3Dトレーニングデータ要求を排除し,意味的表面-表面マップを生成する。
論文 参考訳(メタデータ) (2023-09-09T16:21:56Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Dataset Condensation with Gradient Matching [36.14340188365505]
本研究では,大規模なデータセットを,深層ニューラルネットワークをスクラッチからトレーニングするための情報的合成サンプルの小さなセットに凝縮させることを学習する,データセット凝縮という,データ効率のよい学習のためのトレーニングセット合成手法を提案する。
いくつかのコンピュータビジョンベンチマークでその性能を厳格に評価し、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-10T16:30:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。