論文の概要: Automated Label Placement on Maps via Large Language Models
- arxiv url: http://arxiv.org/abs/2507.22952v1
- Date: Tue, 29 Jul 2025 18:00:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:08.327413
- Title: Automated Label Placement on Maps via Large Language Models
- Title(参考訳): 大規模言語モデルによる地図上のラベルの自動配置
- Authors: Harry Shomer, Jiejun Xu,
- Abstract要約: データ編集問題としてタスクを定式化するALP(Automatic label Placement)の新たなパラダイムを導入する。
この方向を支援するため,実世界の地図上でALPを評価するためのベンチマークデータセットとして,MAPLEをキュレートした。
我々は,MAPLE 上で4つのオープンソース LLM を評価し,各種ランドマークの全体的な性能と一般化を解析した。
- 参考スコア(独自算出の注目度): 3.7553323195283697
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Label placement is a critical aspect of map design, serving as a form of spatial annotation that directly impacts clarity and interpretability. Despite its importance, label placement remains largely manual and difficult to scale, as existing automated systems struggle to integrate cartographic conventions, adapt to context, or interpret labeling instructions. In this work, we introduce a new paradigm for automatic label placement (ALP) that formulates the task as a data editing problem and leverages large language models (LLMs) for context-aware spatial annotation. To support this direction, we curate MAPLE, the first known benchmarking dataset for evaluating ALP on real-world maps, encompassing diverse landmark types and label placement annotations from open-source data. Our method retrieves labeling guidelines relevant to each landmark type leveraging retrieval-augmented generation (RAG), integrates them into prompts, and employs instruction-tuned LLMs to generate ideal label coordinates. We evaluate four open-source LLMs on MAPLE, analyzing both overall performance and generalization across different types of landmarks. This includes both zero-shot and instruction-tuned performance. Our results demonstrate that LLMs, when guided by structured prompts and domain-specific retrieval, can learn to perform accurate spatial edits, aligning the generated outputs with expert cartographic standards. Overall, our work presents a scalable framework for AI-assisted map finishing and demonstrates the potential of foundation models in structured data editing tasks. The code and data can be found at https://github.com/HarryShomer/MAPLE.
- Abstract(参考訳): ラベル配置は地図設計の重要な側面であり、明瞭さと解釈可能性に直接影響を及ぼす空間アノテーションの一形態として機能する。
ラベルの配置は、その重要性にもかかわらず、既存の自動システムは、地図の慣習の統合、文脈への適応、ラベルの解釈に苦慮しているため、手動で、拡張が難しいままである。
本研究では,データ編集問題としてタスクを定式化し,文脈対応空間アノテーションのための大規模言語モデル(LLM)を活用する,ALP(Automatic label Placement)の新たなパラダイムを提案する。
この方向性をサポートするため、実世界の地図上でALPを評価するための最初のベンチマークデータセットであるMAPLEをキュレートし、様々なランドマーク型とオープンソースのデータからのラベル配置アノテーションを含む。
提案手法は,RAG(Research-augmented Generation)を利用した各ランドマーク型に関するラベル付けガイドラインを検索し,それらをプロンプトに統合し,命令調整されたLCMを用いて理想的なラベル座標を生成する。
我々は,MAPLE 上で4つのオープンソース LLM を評価し,各種ランドマークの全体的な性能と一般化を解析した。
これにはゼロショットと命令チューニングの両方のパフォーマンスが含まれる。
この結果から,構造化プロンプトとドメイン固有検索によって導出されるLLMは,正確な空間編集を学習し,生成した出力を専門家の地図基準と整合させることができた。
全体として、我々の研究はAIによる地図作成のためのスケーラブルなフレームワークを示し、構造化データ編集タスクにおける基礎モデルの可能性を実証している。
コードとデータはhttps://github.com/HarryShomer/MAPLEで確認できる。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - Tag Map: A Text-Based Map for Spatial Reasoning and Navigation with Large Language Models [15.454856838083511]
大言語モデル(LLM)は、ロボットが共通感覚推論を用いてタスクプランを生成するためのツールとして登場した。
最近の研究は、固定された意味クラスを持つ明示的な写像から暗黙的なオープンな語彙マップへと移行している。
LLMと簡単に統合しながら、数千のセマンティッククラスを表現できる明示的なテキストベースのマップを提案する。
論文 参考訳(メタデータ) (2024-09-23T18:26:19Z) - TnT-LLM: Text Mining at Scale with Large Language Models [24.731544646232962]
大規模言語モデル(LLM)は、最小限の努力でエンドツーエンドのラベル生成と割り当てのプロセスを自動化する。
我々は,TnT-LLMが最先端のベースラインと比較した場合,より正確で関連性の高いラベルを生成することを示す。
また、現実のアプリケーションにおける大規模テキストマイニングにLLMを使うことの課題と機会に関する実践的経験と洞察を共有します。
論文 参考訳(メタデータ) (2024-03-18T18:45:28Z) - Large Language Models for Data Annotation and Synthesis: A Survey [49.8318827245266]
本調査は,データアノテーションと合成のための大規模言語モデルの有用性に焦点を当てる。
LLMがアノテートできるデータタイプの詳細な分類、LLM生成アノテーションを利用したモデルの学習戦略のレビュー、データアノテーションと合成にLLMを使用する際の主な課題と制限に関する詳細な議論を含む。
論文 参考訳(メタデータ) (2024-02-21T00:44:04Z) - Open-World Weakly-Supervised Object Localization [26.531408294517416]
我々は、OWSOL(Open-World Weakly-Supervised Object Localization)と呼ばれる、新しい弱い教師付きオブジェクトローカライゼーションタスクを導入する。
本稿では、ラベル付きデータとラベルなしデータの両方を用いて、オブジェクトローカライゼーションのための完全なG-CAMを生成するコントラスト表現協調学習のパラダイムを提案する。
我々は、画像Net-1KとiNatLoc500という2つの広く使われているデータセットを再編成し、OWSOLの評価ベンチマークとしてOpenImages150を提案する。
論文 参考訳(メタデータ) (2023-04-17T13:31:59Z) - AutoGeoLabel: Automated Label Generation for Geospatial Machine Learning [69.47585818994959]
リモートセンシングデータのためのラベルの自動生成のためのビッグデータ処理パイプラインを評価する。
我々は,大規模データプラットフォームであるIBM PAIRSを用いて,密集都市部でそのようなラベルを動的に生成する。
論文 参考訳(メタデータ) (2022-01-31T20:02:22Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。