Fugu-MT 論文翻訳(概要): Text2Cypher: Bridging Natural Language and Graph Databases

論文の概要: Text2Cypher: Bridging Natural Language and Graph Databases

arxiv url: http://arxiv.org/abs/2412.10064v1
Date: Fri, 13 Dec 2024 11:50:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-16 15:37:48.947298
Title: Text2Cypher: Bridging Natural Language and Graph Databases
Title（参考訳）: Text2Cypher: 自然言語とグラフデータベースのブリッジ
Authors: Makbule Gulcin Ozsoy, Leila Messallem, Jon Besga, Gianandrea Minneci,
Abstract要約: Text2Cypherは、自然言語クエリをCypherクエリ言語に変換することで、このギャップを埋めることを目指している。公開されているいくつかのデータセットを合計44,387のインスタンスに組み合わせ、整理し、整理した方法について説明している。
参考スコア（独自算出の注目度）: 0.3774866290142281
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Knowledge graphs use nodes, relationships, and properties to represent arbitrarily complex data. When stored in a graph database, the Cypher query language enables efficient modeling and querying of knowledge graphs. However, using Cypher requires specialized knowledge, which can present a challenge for non-expert users. Our work Text2Cypher aims to bridge this gap by translating natural language queries into Cypher query language and extending the utility of knowledge graphs to non-technical expert users. While large language models (LLMs) can be used for this purpose, they often struggle to capture complex nuances, resulting in incomplete or incorrect outputs. Fine-tuning LLMs on domain-specific datasets has proven to be a more promising approach, but the limited availability of high-quality, publicly available Text2Cypher datasets makes this challenging. In this work, we show how we combined, cleaned and organized several publicly available datasets into a total of 44,387 instances, enabling effective fine-tuning and evaluation. Models fine-tuned on this dataset showed significant performance gains, with improvements in Google-BLEU and Exact Match scores over baseline models, highlighting the importance of high-quality datasets and fine-tuning in improving Text2Cypher performance.
Abstract（参考訳）: 知識グラフは、任意の複雑なデータを表すためにノード、関係、プロパティを使用する。グラフデータベースに格納されると、Cypherクエリ言語は知識グラフの効率的なモデリングとクエリを可能にする。しかし、Cypherを使用するには専門知識が必要であるため、専門家でないユーザにとっては課題となる可能性がある。私たちの研究であるText2Cypherは、自然言語クエリをCypherクエリ言語に変換することによって、このギャップを埋めることを目的としています。大きな言語モデル(LLM)はこの目的のために使われるが、複雑なニュアンスを捉えるのに苦労することが多く、不完全あるいは誤った出力をもたらす。ドメイン固有のデータセットに関する微調整 LLM は、より有望なアプローチであることが証明されている。本研究では、公開されているいくつかのデータセットを合計44,387のインスタンスに組み合わせ、整理し、整理し、効果的に微調整と評価を可能にした方法について述べる。このデータセットを微調整したモデルでは、ベースラインモデルよりもGoogle-BLEUとExact Matchスコアが改善され、高品質なデータセットの重要性が強調され、Text2Cypherのパフォーマンス改善に微調整が加えられた。

関連論文リスト

Enrich-on-Graph: Query-Graph Alignment for Complex Reasoning with LLM Enriching [61.824094419641575]
大言語モデル(LLM)は知識グラフ質問応答(KGQA)のような知識集約的なシナリオにおける幻覚と事実的誤りに苦しむこれは、構造化知識グラフ(KG)と非構造化クエリのセマンティックギャップによるもので、その焦点や構造に固有の違いが原因である。既存の手法は通常、バニラKGの資源集約的で非スケーリング可能な推論を用いるが、このギャップを見落としている。我々は、LLMの事前知識を活用してKGを充実させる柔軟なフレームワークEnrich-on-Graph(EoG)を提案し、グラフとクエリ間のセマンティックギャップを埋める。
論文参考訳（メタデータ） (2025-09-25T06:48:52Z)
AmbiGraph-Eval: Can LLMs Effectively Handle Ambiguous Graph Queries? [31.91169297907121]
AmbiGraph-Evalは、専門家が検証したグラフクエリの回答と組み合わせた、現実世界のあいまいなクエリの新しいベンチマークである。本研究は, 曖昧性処理における重要なギャップを明らかにし, 特殊解像度技術における今後の課題を動機づけるものである。
論文参考訳（メタデータ） (2025-08-13T09:06:59Z)
Improving Large Vision-Language Models' Understanding for Field Data [62.917026891829025]
本研究では、大規模ビジョン言語モデルのフィールドデータ理解を改善するためのフレームワークであるFieldLVLMを紹介する。 FieldLVLMは、フィールド対応言語生成戦略とデータ圧縮マルチモーダルモデルチューニングの2つの主要コンポーネントから構成される。新たに提案されたベンチマークデータセットの実験結果から、フィールドLVLMは、科学的なフィールドデータを含むタスクにおいて、既存の手法を著しく上回っていることが示された。
論文参考訳（メタデータ） (2025-07-24T11:28:53Z)
Enhancing Text2Cypher with Schema Filtering [0.0]
Cypherはグラフデータベースのための強力なクエリ言語である。近年の大規模言語モデルの進歩により、自然言語の質問をCypherクエリ - Text2Cypherに翻訳できるようになった。本研究では、Text2Cypherタスクのさまざまなスキーマフィルタリング方法を検討し、トークンの長さ、パフォーマンス、コストへの影響を分析する。
論文参考訳（メタデータ） (2025-05-08T10:42:20Z)
GraphRAFT: Retrieval Augmented Fine-Tuning for Knowledge Graphs on Graph Databases [0.0]
GraphRAFTは、LCMを微調整して、確実に正しいCypherクエリを生成する、検索と推論のためのフレームワークである。本手法は,自然グラフDBに格納された知識グラフを用いて,棚から取り出すことができる最初の方法である。
論文参考訳（メタデータ） (2025-04-07T20:16:22Z)
ZOGRASCOPE: A New Benchmark for Property Graphs [3.0748861313823]
本稿では,暗号クエリ言語用に設計されたベンチマークであるZOGRASCOPEを紹介する。グラフのセマンティック解析は, LLM を単体で行うだけでは解けない, 難解なオープンな問題であることを示す。
論文参考訳（メタデータ） (2025-03-07T09:33:30Z)
LLM as GNN: Graph Vocabulary Learning for Text-Attributed Graph Foundation Models [54.82915844507371]
Text-Attributed Graphs (TAG) は、現実のシナリオにおいてユビキタスである。大規模言語モデル(LLMs)とグラフニューラルネットワーク(GNNs)をTAGsに統合する努力にもかかわらず、既存のアプローチは分離されたアーキテクチャに悩まされている。本稿では,グラフ語彙学習に基づくTAGのための汎用GFMであるPromptGFMを提案する。
論文参考訳（メタデータ） (2025-03-05T09:45:22Z)
Query-Aware Learnable Graph Pooling Tokens as Prompt for Large Language Models [3.9489815622117566]
Learnable Graph Pooling Token (LGPT)は、フレキシブルで効率的なグラフ表現を可能にする。提案手法は,大規模言語モデルを訓練することなく,GraphQAベンチマークで4.13%の性能向上を実現している。
論文参考訳（メタデータ） (2025-01-29T10:35:41Z)
Hierarchical Compression of Text-Rich Graphs via Large Language Models [63.75293588479027]
テキストリッチグラフは、eコマースや学術グラフのようなデータマイニングの文脈で広く使われている。本稿では,LLMの能力とテキストリッチグラフの構造を整合させる新しい手法であるHiComを紹介する。 HiComは、Eコマースと引用グラフのノード分類において、GNNとLLMのバックボーンよりも優れている。
論文参考訳（メタデータ） (2024-06-13T07:24:46Z)
GraphEdit: Large Language Models for Graph Structure Learning [62.618818029177355]
グラフ構造学習(GSL)は、グラフ構造データ中のノード間の固有の依存関係と相互作用をキャプチャすることに焦点を当てている。既存のGSL法は、監督信号として明示的なグラフ構造情報に大きく依存している。グラフ構造化データの複雑なノード関係を学習するために,大規模言語モデル(LLM)を利用したグラフ編集を提案する。
論文参考訳（メタデータ） (2024-02-23T08:29:42Z)
GLaM: Fine-Tuning Large Language Models for Domain Knowledge Graph Alignment via Neighborhood Partitioning and Generative Subgraph Encoding [39.67113788660731]
グラフ対応LAnguage Models (GLaM) を開発するためのフレームワークを紹介する。特定のグラフに基づく知識でモデルを構築することは、構造に基づく推論のためのモデルの能力を拡張することを実証する。
論文参考訳（メタデータ） (2024-02-09T19:53:29Z)
Query of CC: Unearthing Large Scale Domain-Specific Knowledge from Public Corpora [104.16648246740543]
大規模言語モデルに基づく効率的なデータ収集手法を提案する。この方法は、大きな言語モデルを通してシード情報をブートストラップし、公開コーパスから関連データを検索する。特定のドメインに関する知識関連のデータを収集するだけでなく、潜在的な推論手順でデータを抽出する。
論文参考訳（メタデータ） (2024-01-26T03:38:23Z)
Large Language Models on Graphs: A Comprehensive Survey [77.16803297418201]
グラフ上の大規模言語モデルに関連するシナリオとテクニックを体系的にレビューする。まず,LLMをグラフに適用する可能性シナリオを,純グラフ,テキスト分散グラフ,テキストペアグラフの3つのカテゴリにまとめる。本稿では,そのような手法の現実的な応用について論じ,オープンソースコードとベンチマークデータセットを要約する。
論文参考訳（メタデータ） (2023-12-05T14:14:27Z)
GPT4Graph: Can Large Language Models Understand Graph Structured Data ? An Empirical Evaluation and Benchmarking [17.7473474499538]
ChatGPTのような大規模言語モデルは、人工知能にとって欠かせないものとなっている。本研究では,グラフデータの解釈において,LLMの精度を評価するための調査を行う。この知見は,言語モデルとグラフ理解のギャップを埋めるための貴重な洞察に寄与する。
論文参考訳（メタデータ） (2023-05-24T11:53:19Z)
Explaining Patterns in Data with Language Models via Interpretable Autoprompting [143.4162028260874]
本稿では,データを説明する自然言語文字列を生成するアルゴリズムである,解釈可能なオートプロンプト(iPrompt)を提案する。 iPromptは、基盤となるデータセット記述を正確に見つけることで、意味のある洞察を得ることができる。 fMRIデータセットを用いた実験は、iPromptが科学的発見に役立つ可能性を示している。
論文参考訳（メタデータ） (2022-10-04T18:32:14Z)
Exploiting Structured Knowledge in Text via Graph-Guided Representation Learning [73.0598186896953]
本稿では、知識グラフからのガイダンスを用いて、生テキスト上で学習する2つの自己教師型タスクを提案する。エンティティレベルのマスキング言語モデルに基づいて、最初のコントリビューションはエンティティマスキングスキームです。既存のパラダイムとは対照的に,本手法では事前学習時にのみ,知識グラフを暗黙的に使用する。
論文参考訳（メタデータ） (2020-04-29T14:22:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。