論文の概要: OsmT: Bridging OpenStreetMap Queries and Natural Language with Open-source Tag-aware Language Models
- arxiv url: http://arxiv.org/abs/2512.04738v1
- Date: Thu, 04 Dec 2025 12:24:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:46.15996
- Title: OsmT: Bridging OpenStreetMap Queries and Natural Language with Open-source Tag-aware Language Models
- Title(参考訳): OsmT: オープンソースタグ対応言語モデルによるOpenStreetMapクエリと自然言語のブリッジ
- Authors: Zhuoyue Wan, Wentao Hu, Chen Jason Zhang, Yuanfeng Song, Shuaimin Li, Ruiqiang Xiao, Xiao-Yong Wei, Raymond Chi-Wing Wong,
- Abstract要約: 我々は、自然言語と構造化クエリ言語をブリッジするためのオープンソースのタグ対応言語モデルOsmTを提案する。
本稿では,タグ検索拡張(Tag Retrieval Augmentation,TRA)機構を導入する。
また、構造化クエリを自然言語の説明に変換する逆タスクであるOverpassQL-to-Textも定義しています。
- 参考スコア(独自算出の注目度): 30.29148893930439
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bridging natural language and structured query languages is a long-standing challenge in the database community. While recent advances in language models have shown promise in this direction, existing solutions often rely on large-scale closed-source models that suffer from high inference costs, limited transparency, and lack of adaptability for lightweight deployment. In this paper, we present OsmT, an open-source tag-aware language model specifically designed to bridge natural language and Overpass Query Language (OverpassQL), a structured query language for accessing large-scale OpenStreetMap (OSM) data. To enhance the accuracy and structural validity of generated queries, we introduce a Tag Retrieval Augmentation (TRA) mechanism that incorporates contextually relevant tag knowledge into the generation process. This mechanism is designed to capture the hierarchical and relational dependencies present in the OSM database, addressing the topological complexity inherent in geospatial query formulation. In addition, we define a reverse task, OverpassQL-to-Text, which translates structured queries into natural language explanations to support query interpretation and improve user accessibility. We evaluate OsmT on a public benchmark against strong baselines and observe consistent improvements in both query generation and interpretation. Despite using significantly fewer parameters, our model achieves competitive accuracy, demonstrating the effectiveness of open-source pre-trained language models in bridging natural language and structured query languages within schema-rich geospatial environments.
- Abstract(参考訳): 自然言語と構造化クエリ言語をブリッジすることは、データベースコミュニティにおける長年の課題である。
言語モデルの最近の進歩は、この方向に有望であることを示しているが、既存のソリューションは、高推論コスト、透明性の制限、軽量デプロイメントへの適応性の欠如といった、大規模なクローズドソースモデルに依存していることが多い。
本稿では、自然言語とOverpass Query Language(OverpassQL)をブリッジするために設計されたオープンソースのタグ対応言語モデルであるOsmTを紹介し、大規模なOpenStreetMap(OSM)データにアクセスするための構造化クエリ言語である。
生成したクエリの精度と構造的妥当性を高めるため、文脈的に関連するタグ知識を生成プロセスに組み込むTag Retrieval Augmentation(TRA)機構を導入する。
このメカニズムはOSMデータベースに存在する階層的およびリレーショナルな依存関係をキャプチャし、地理空間的クエリの定式化に固有のトポロジ的複雑さに対処するように設計されている。
さらに、構造化されたクエリを自然言語説明に変換する逆タスクであるOverpassQL-to-Textを定義し、クエリ解釈をサポートし、ユーザアクセシビリティを向上させる。
我々はOsmTを強力なベースラインに対して公開ベンチマークで評価し、クエリ生成と解釈の両方において一貫した改善を観察する。
パラメータが大幅に少ないにもかかわらず、我々のモデルは競合精度を達成し、スキーマに富んだ地理空間環境において、自然言語と構造化クエリ言語をブリッジするオープンソースの事前学習言語モデルの有効性を実証する。
関連論文リスト
- Text-to-SPARQL Goes Beyond English: Multilingual Question Answering Over Knowledge Graphs through Human-Inspired Reasoning [51.203811759364925]
mKGQAgentは、自然言語の質問をSPARQLクエリに変換し、モジュール化された解釈可能なサブタスクに変換するタスクを分解する。
2025年のText2SPARQLチャレンジにおいて、DBpediaとCorporateベースのKGQAベンチマークに基づいて評価され、私たちのアプローチは、他の参加者の中で第一に行われました。
論文 参考訳(メタデータ) (2025-07-22T19:23:03Z) - Large Language Models are Good Relational Learners [55.40941576497973]
本稿では,グラフニューラルネットワーク(GNN)に基づくエンコーダを用いて,大規模言語モデル(LLM)のための構造化リレーショナルプロンプトを生成する新しいアーキテクチャであるRel-LLMを紹介する。
従来のテキストベースのシリアライズ手法とは異なり,本手法はデータベース固有の関係構造を保ちながら,LLMが複雑なエンティティ関係を処理・推論することを可能にする。
論文 参考訳(メタデータ) (2025-06-06T04:07:55Z) - PICASO: Permutation-Invariant Context Composition with State Space Models [98.91198288025117]
State Space Models (SSM) は、コンテキストのデータベースを固定次元の状態にマッピング可能にすることで、有望なソリューションを提供する。
本研究では,SSM力学から導かれる単純な数学的関係を,生のコンテキストトークンの連結効果を効率的に近似する複数の状態に構成する。
我々は,WikiText と MSMARCO をゼロショットと微調整の両方で評価し,平均5.4倍のスピードアップを楽しみながら最強の演奏ベースラインと一致できることを示す。
論文 参考訳(メタデータ) (2025-02-24T19:48:00Z) - MST5 -- Multilingual Question Answering over Knowledge Graphs [1.6470999044938401]
知識グラフ質問回答(KGQA)は、自然言語を用いたグラフベースモデルに格納された膨大な知識のクエリを単純化する。
既存の多言語KGQAシステムは、英語システムに匹敵する性能を達成するための課題に直面している。
本稿では,言語コンテキストとエンティティ情報を言語モデルの処理パイプラインに直接組み込むことで,多言語KGQAシステムを強化するための簡易なアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-08T15:37:51Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - NL2KQL: From Natural Language to Kusto Query [1.7931930942711818]
NL2KQLは、大規模言語モデル(LLM)を使用して自然言語クエリ(NLQ)をKusto Query Language(KQL)クエリに変換する革新的なフレームワークである。
NL2KQLのパフォーマンスを検証するために、オンライン(クエリ実行に基づく)とオフライン(クエリ解析に基づく)メトリクスの配列を使用します。
論文 参考訳(メタデータ) (2024-04-03T01:09:41Z) - Text-to-OverpassQL: A Natural Language Interface for Complex Geodata
Querying of OpenStreetMap [17.01783992725517]
OpenStreetMap (OSM)からジオデータをクエリするための自然言語インタフェースを容易にするタスクであるText-to-OverpassQLを提案する。
自然言語入力からOverpassクエリを生成することは、複数のユースケースに役立つ。
論文 参考訳(メタデータ) (2023-08-30T14:33:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。