論文の概要: Meta Engine: A Unified Semantic Query Engine on Heterogeneous LLM-Based Query Systems
- arxiv url: http://arxiv.org/abs/2602.01701v1
- Date: Mon, 02 Feb 2026 06:16:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.948106
- Title: Meta Engine: A Unified Semantic Query Engine on Heterogeneous LLM-Based Query Systems
- Title(参考訳): Meta Engine: 不均一なLLMベースのクエリシステム上での統一セマンティッククエリエンジン
- Authors: Ruyu Li, Tinghui Zhang, Haodi Ma, Daisy Zhe Wang, Yifan Wang,
- Abstract要約: 構造化されていないデータとして、多くのマルチモーダルデータ(テキスト、画像、ビデオなど)がセマンティクスに隠されている。
構造化されていないデータに対するセマンティッククエリをサポートするLLMベースのセマンティッククエリシステムもいくつか提案されている。
本稿では,クエリシステムにおける新しいクエリシステムであるMeta Engineを紹介する。
すべてのベースラインを一貫して上回り、ほとんどの場合、F1は3~6倍、特定のデータセットでは最大24倍になる。
- 参考スコア(独自算出の注目度): 7.4630710425423965
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the increasingly use of multi-modal data, semantic query has become more and more demanded in data management systems, which is an important way to access and analyze multi-modal data. As unstructured data, most information of multi-modal data (text, image, video, etc) hides in the semantics, which cannot be accessed by the traditional database queries like SQL. Given the power of Large Language Model (LLM) in understanding semantics and processing natural language, in recent years several LLM-based semantic query systems have been proposed, to support semantic querying over unstructured data. However, this rapid growth has produced a fragmented ecosystem. Applications face significant integration challenges due to (1) disparate APIs of different semantic query systems and (2) a fundamental trade-off between specialization and generality. Many semantic query systems are highly specialized, offering state-of-the-art performance within a single modality but struggling with multi-modal data. Conversely, some "all-in-one" systems handle multiple modalities but often exhibit suboptimal performance compared to their specialized counterparts in specific modalities. This paper introduces Meta Engine, a novel "query system on query systems", designed to resolve those aforementioned challenges. Meta Engine is a unified semantic query engine that integrates heterogeneous, specialized LLM-based query systems. Its architecture comprises five key components: (1) a Natural Language (NL) Query Parser, (2) an Operator Generator, (3) a Query Router, (4) a set of Adapters, and (5) a Result Aggregator. In the evaluation, Meta Engine consistently outperforms all baselines, yielding 3-6x higher F1 in most cases and up to 24x on specific datasets.
- Abstract(参考訳): マルチモーダルデータの利用が増加し、データ管理システムではセマンティッククエリがますます要求されるようになり、マルチモーダルデータにアクセスし分析する重要な方法となっている。
構造化されていないデータとして、ほとんどのマルチモーダルデータ(テキスト、画像、ビデオなど)はセマンティクスに隠れており、SQLのような従来のデータベースクエリではアクセスできない。
意味論の理解と自然言語処理におけるLLM(Large Language Model)の力を踏まえ,近年,非構造化データのセマンティッククエリをサポートするLLMベースのセマンティッククエリシステムがいくつか提案されている。
しかし、この急速な成長は断片的な生態系を生み出した。
1)異なるセマンティッククエリシステムのAPIが異なっており、(2)特殊化と汎用性の基本的なトレードオフがあるため、アプリケーションは重要な統合課題に直面します。
多くのセマンティッククエリシステムは高度に専門化されており、単一のモダリティ内で最先端のパフォーマンスを提供するが、マルチモーダルデータでは困難である。
逆に、「オール・イン・ワン」システムでは複数のモダリティを扱うが、特定のモダリティにおける特定のモダリティと比較して、しばしば最適以下のパフォーマンスを示す。
本稿では,これらの課題を解決するために,新しいクエリシステムであるMeta Engineを紹介する。
Meta Engineは、ヘテロジニアスで特殊なLLMベースのクエリシステムを統合する、統合されたセマンティッククエリエンジンである。
そのアーキテクチャは、(1)自然言語(NL)クエリパーサ、(2)オペレータジェネレータ、(3)クエリルータ、(4)アダプタのセット、(5)結果アグリゲータの5つのキーコンポーネントから構成される。
評価では、Meta Engineがすべてのベースラインを一貫して上回り、ほとんどのケースではF1が3~6倍、特定のデータセットでは24倍になる。
関連論文リスト
- SemBench: A Benchmark for Semantic Query Processing Engines [32.37997040464244]
本稿では,セマンティッククエリ処理エンジンという,新しい種類のシステムを対象としたベンチマークを提案する。
私たちのベンチマークでは、シナリオ、モダリティ、演算子という3つの重要な次元に多様性を導入しています。
我々は,3つの学術システム(LOTUS,Palimpzest,ThalamusDB)と1つの産業システムであるGoogle BigQueryについてベンチマークを行った。
論文 参考訳(メタデータ) (2025-11-03T16:25:19Z) - Powering Job Search at Scale: LLM-Enhanced Query Understanding in Job Matching Systems [10.9341814749217]
LLM(Large Language Model)を利用した統合クエリ理解フレームワークを提案する。
提案手法は,ユーザクエリとプロファイル属性などのコンテキスト信号とを共同でモデル化し,構造化された解釈を生成する。
このフレームワークは、オンラインA/Bテストにおける関連品質を改善し、システムの複雑さを著しく低減する。
論文 参考訳(メタデータ) (2025-08-19T21:35:43Z) - Explainable Multi-Modal Data Exploration in Natural Language via LLM Agent [6.147666891384964]
XMODEは自然言語で説明可能なマルチモーダルデータ探索を可能にするシステムである。
XMODEは、マルチモーダル情報システムの探索を可能にする現実世界のユースケースにインスパイアされている。
論文 参考訳(メタデータ) (2024-12-24T13:42:44Z) - MM-Embed: Universal Multimodal Retrieval with Multimodal LLMs [78.5013630951288]
本稿では,マルチモーダル大言語モデル(MLLM)を用いた情報検索手法を提案する。
まず,16個の検索タスクを持つ10個のデータセットに対して,MLLMをバイエンコーダレトリバーとして微調整する。
我々のモデルMM-Embedはマルチモーダル検索ベンチマークM-BEIR上で最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-11-04T20:06:34Z) - BabelBench: An Omni Benchmark for Code-Driven Analysis of Multimodal and Multistructured Data [61.936320820180875]
大規模言語モデル(LLM)は、様々な領域でますます重要になっている。
BabelBenchは、コード実行によるマルチモーダルなマルチ構造化データ管理におけるLLMの熟練度を評価する革新的なベンチマークフレームワークである。
BabelBenchの実験結果から,ChatGPT 4のような最先端モデルでさえ,大幅な改善の余地があることが示唆された。
論文 参考訳(メタデータ) (2024-10-01T15:11:24Z) - CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。
従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。
粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - Text Summarization with Latent Queries [60.468323530248945]
本稿では,LaQSumについて紹介する。LaQSumは,既存の問合せ形式と抽象的な要約のための文書から遅延クエリを学習する,最初の統一テキスト要約システムである。
本システムでは, 潜伏クエリモデルと条件付き言語モデルとを協調的に最適化し, ユーザがテスト時に任意のタイプのクエリをプラグイン・アンド・プレイできるようにする。
本システムでは,クエリタイプ,文書設定,ターゲットドメインの異なる要約ベンチマークにおいて,強力な比較システムの性能を強く向上させる。
論文 参考訳(メタデータ) (2021-05-31T21:14:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。