論文の概要: SABER: A SQL-Compatible Semantic Document Processing System Based on Extended Relational Algebra
- arxiv url: http://arxiv.org/abs/2509.00277v1
- Date: Fri, 29 Aug 2025 23:27:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.158221
- Title: SABER: A SQL-Compatible Semantic Document Processing System Based on Extended Relational Algebra
- Title(参考訳): SABER:拡張リレーショナル代数に基づくSQL互換セマンティック文書処理システム
- Authors: Changjae Lee, Zhuoyue Zhao, Jinjun Xiong,
- Abstract要約: 本稿では,意味演算の論理計画構築,最適化,形式的正当性保証の可能性を開放する意味代数学 SABER (Semantic Algebra based on Extended algebras) を提案する。
既存のSDPSに対して統一インターフェースを提供することにより,任意のSDPSから意味論的に互換性のある演算子の実装を効果的に組み合わせ,整合させることが可能であることを示す。
- 参考スコア(独自算出の注目度): 10.968891383585886
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The emergence of large-language models (LLMs) has enabled a new class of semantic data processing systems (SDPSs) to support declarative queries against unstructured documents. Existing SDPSs are, however, lacking a unified algebraic foundation, making their queries difficult to compose, reason, and optimize. We propose a new semantic algebra, SABER (Semantic Algebra Based on Extended Relational algebra), opening the possibility of semantic operations' logical plan construction, optimization, and formal correctness guarantees. We further propose to implement SABER in a SQL-compatible syntax so that it natively supports mixed structured/unstructured data processing. With SABER, we showcase the feasibility of providing a unified interface for existing SDPSs so that it can effectively mix and match any semantically-compatible operator implementation from any SDPS, greatly enhancing SABER's applicability for community contributions.
- Abstract(参考訳): 大規模言語モデル (LLMs) の出現により、非構造化文書に対する宣言的クエリをサポートする新しいタイプの意味データ処理システム (SDPSs) が実現された。
しかし、既存のSDPSは統一代数的基盤を欠いているため、それらのクエリは構成、推論、最適化が困難である。
本稿では,意味演算の論理的計画構築,最適化,形式的正当性保証の可能性を開放する意味代数学 SABER (Semantic Algebra based on Extended Relational algebra) を提案する。
また、SQL互換の構文でSABERを実装し、混合構造化/非構造化データ処理をネイティブにサポートすることを提案する。
SABER では,既存の SDPS に統一されたインターフェースを提供することにより,任意の SDPS から意味論的に互換性のある演算子の実装を効果的に組み合わせ,適合させることができる可能性を示し,コミュニティコントリビューションへの SABER の適用性を大幅に向上させる。
関連論文リスト
- HyST: LLM-Powered Hybrid Retrieval over Semi-Structured Tabular Data [0.4779196219827507]
HyST(Hybrid search over Semi-structured Tabular data)は、構造化フィルタリングとセマンティック埋め込み検索を組み合わせたハイブリッド検索フレームワークである。
半構造化ベンチマークにおいてHySTがトラジショナルベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2025-08-25T14:06:27Z) - eSapiens: A Real-World NLP Framework for Multimodal Document Understanding and Enterprise Knowledge Processing [6.450269621190948]
企業環境での質問応答システムeSapiensを紹介する。
eSapiensは、二重モジュールアーキテクチャを介して構造化データベースと非構造化コーパスをブリッジする。
我々は、RAGTruthベンチマークでeSapiensを評価し、完全性、幻覚、文脈利用といった重要な側面における性能を分析した。
論文 参考訳(メタデータ) (2025-06-20T06:07:20Z) - Large Language Models are Good Relational Learners [55.40941576497973]
本稿では,グラフニューラルネットワーク(GNN)に基づくエンコーダを用いて,大規模言語モデル(LLM)のための構造化リレーショナルプロンプトを生成する新しいアーキテクチャであるRel-LLMを紹介する。
従来のテキストベースのシリアライズ手法とは異なり,本手法はデータベース固有の関係構造を保ちながら,LLMが複雑なエンティティ関係を処理・推論することを可能にする。
論文 参考訳(メタデータ) (2025-06-06T04:07:55Z) - Augmented Knowledge Graph Querying leveraging LLMs [2.5311562666866494]
我々は、知識グラフ(KG)のクエリを強化するフレームワークであるSparqLLMを紹介する。
SparqLLMは、生データからKGを構築するために、Extract, Transform, and Load (ETL)パイプラインを実行する。
また、Large Language Models(LLMs)を利用した自然言語インターフェースを備え、自動SPARQLクエリ生成を実現している。
論文 参考訳(メタデータ) (2025-02-03T12:18:39Z) - SocialGPT: Prompting LLMs for Social Relation Reasoning via Greedy Segment Optimization [70.11167263638562]
社会的関係推論は、友人、配偶者、同僚などの関係カテゴリを画像から識別することを目的としている。
まず、VFM(Vision Foundation Models)の知覚能力と、モジュラーフレームワーク内でのLLM(Large Language Models)の推論能力を組み合わせた、シンプルだが巧妙な名前のフレームワークを提示する。
論文 参考訳(メタデータ) (2024-10-28T18:10:26Z) - Beyond Inter-Item Relations: Dynamic Adaption for Enhancing LLM-Based Sequential Recommendation [83.87767101732351]
逐次リコメンデータシステム(SRS)は,ユーザの過去のインタラクションシーケンスに基づいて,ユーザが好む次の項目を予測する。
様々なAIアプリケーションにおける大規模言語モデル(LLM)の台頭に触発されて、LLMベースのSRSの研究が急増している。
我々は,大きめの粒度適応の上に構築された逐次レコメンデーションモデルであるDARecを提案する。
論文 参考訳(メタデータ) (2024-08-14T10:03:40Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - SetCSE: Set Operations using Contrastive Learning of Sentence Embeddings [6.988934943372354]
SetCSEは複雑なセマンティクスを表現するためにセットを使用し、構造化情報クエリのための明確に定義された操作を組み込む。
そこで本稿では,文の埋め込みモデルに対する意味論の理解を高めるために,集合間のコントラスト学習手法を提案する。
本研究では,SetCSEが複合意味論に関する人間の言語表現の慣習に準拠していることを示す。
論文 参考訳(メタデータ) (2024-04-25T02:05:30Z) - Analyzing Semantics of Aggregate Answer Set Programming Using
Approximation Fixpoint Theory [1.295566630218982]
三項満足関係の概念を導入し、その観点から安定した意味論を定義する。
3次満足度関係は,標準ゲルフォンド・リフシッツレダクトと,AFTの枠組みで定義された安定意味論のギャップを橋渡しすることを示す。
論文 参考訳(メタデータ) (2021-04-30T07:06:27Z) - Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。
PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。
GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文 参考訳(メタデータ) (2021-04-12T21:24:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。