論文の概要: Toward Multi-Database Query Reasoning for Text2Cypher
- arxiv url: http://arxiv.org/abs/2605.10373v1
- Date: Mon, 11 May 2026 11:17:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.756361
- Title: Toward Multi-Database Query Reasoning for Text2Cypher
- Title(参考訳): Text2Cypherのマルチデータベースクエリ推論に向けて
- Authors: Makbule Gulcin Ozsoy,
- Abstract要約: Text2Cypherはグラフデータベース用のCypherクエリを生成する。
既存のText2Cypherシステムの多くは、既知のスキーマ上でクエリが生成される単一のプリセレクトグラフデータベースを前提としている。
単一データベースクエリ生成からマルチデータベースクエリ推論へのシフトを提案する。
- 参考スコア(独自算出の注目度): 0.20305676256390937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models have significantly improved natural language interfaces to databases by translating user questions into executable queries. In particular, Text2Cypher focuses on generating Cypher queries for graph databases, enabling users to access graph data without query language expertise. Most existing Text2Cypher systems assume a single preselected graph database, where queries are generated over a known schema. However, real-world systems are often distributed across multiple independent graph databases organized by domain or system boundaries, where relevant information may span multiple sources. To address this limitation, we propose a shift from single-database query generation to multi-database query reasoning. Instead of assuming a fixed execution context, the system must reason about (i) relevant databases, (ii) how to decompose a question across them, and (iii) how to integrate partial results. We formalize this setting through a three-phase roadmap: database routing, multi-database decomposition, and heterogeneous query reasoning across database types and query languages. This work provides a structured formulation of multi-database reasoning for Text2Cypher and identifies challenges in source selection, query decomposition, and result integration, aiming to support more realistic and scalable natural language interfaces to graph databases.
- Abstract(参考訳): 大規模言語モデルは、ユーザ質問を実行可能なクエリに変換することで、自然言語インタフェースをデータベースに大幅に改善した。
特にText2Cypherは,グラフデータベース用のCypherクエリの生成に重点を置いている。
既存のText2Cypherシステムの多くは、既知のスキーマ上でクエリが生成される単一のプリセレクトグラフデータベースを前提としている。
しかし、現実のシステムはドメインやシステムの境界によって組織された複数の独立したグラフデータベースに分散することが多く、関連する情報は複数のソースにまたがる可能性がある。
この制限に対処するため,単一データベースクエリ生成からマルチデータベースクエリ推論へのシフトを提案する。
固定された実行コンテキストを仮定する代わりに、システムは推論しなければなりません。
(i)関係データベース
二 質問を分解する方法、及び
三 部分的な結果の統合の仕方
データベースルーティング、マルチデータベース分解、データベースタイプとクエリ言語間の不均一なクエリ推論という3段階のロードマップを通じて、この設定を形式化する。
この研究は、Text2Cypherのマルチデータベース推論を構造化し、ソース選択、クエリ分解、結果統合の課題を特定し、グラフデータベースへのより現実的でスケーラブルな自然言語インターフェースのサポートを目指している。
関連論文リスト
- UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification [50.59009084277447]
論理生成からスキーマ要素の検索を分離するフレームワークUNJOINを紹介する。
最初の段階では、各列をテーブル名でプレフィックスすることで、データベース内のすべてのテーブルの列名を単一のテーブル表現にマージします。
第2段階では、クエリは、この単純化されたスキーマに基づいて生成され、JOIN、UNION、リレーショナルロジックを再構築することで、元のスキーマにマップされる。
論文 参考訳(メタデータ) (2025-05-23T17:28:43Z) - SM3-Text-to-Query: Synthetic Multi-Model Medical Text-to-Query Benchmark [4.049028351548513]
異なるデータベースモデルは、クエリの複雑さとパフォーマンスに大きな影響を与えます。
SM3-Text-to-Queryは,最初のマルチモデル医療用テキスト-to-Queryベンチマークである。
論文 参考訳(メタデータ) (2024-11-08T12:27:13Z) - Text2SQL is Not Enough: Unifying AI and Databases with TAG [47.45480855418987]
Table-Augmented Generation (TAG) は、データベース上の自然言語の質問に答えるパラダイムである。
我々は、TAG問題を研究するためのベンチマークを開発し、標準手法がクエリの20%以上を正しく答えることを発見した。
論文 参考訳(メタデータ) (2024-08-27T00:50:14Z) - Database-Augmented Query Representation for Information Retrieval [71.41745087624528]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
我々はDAQuを多様な検索シナリオで検証し、全体の検索性能を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - xDBTagger: Explainable Natural Language Interface to Databases Using
Keyword Mappings and Schema Graph [0.17188280334580192]
自然言語クエリをインターフェース内の構造化クエリ言語(NLQ)にリレーショナルデータベースに変換することは、難しい作業である。
我々は xDBTagger を提案する。xDBTagger は説明可能なハイブリッド翻訳パイプラインで,ユーザがテキストと視覚の両方で行う決定について説明する。
xDBTaggerは精度の点で有効であり、クエリを最先端のパイプラインベースシステムと比較して最大10000倍の効率で変換する。
論文 参考訳(メタデータ) (2022-10-07T18:17:09Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z) - Translating synthetic natural language to database queries: a polyglot
deep learning framework [0.0]
Polyglotterは自然言語検索とデータベースクエリのマッピングをサポートする。
トレーニングのために手動で注釈付きデータを作成する必要はない。
我々のフレームワークは, 合成データベースと実データベースの両方で良好に動作することを示す。
論文 参考訳(メタデータ) (2021-04-14T17:43:51Z) - Towards a Natural Language Query Processing System [0.0]
本稿では,自然言語クエリインタフェースとバックエンド関係データベースの設計と開発について報告する。
この研究の斬新さは、自然言語クエリを構造化クエリ言語に変換するために必要なメタデータを格納するために、グラフデータベースを中間層として定義することにある。
サンプルクエリの翻訳結果は90%の精度で得られた。
論文 参考訳(メタデータ) (2020-09-25T19:52:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。