論文の概要: Blue Data Intelligence Layer: Streaming Data and Agents for Multi-source Multi-modal Data-Centric Applications
- arxiv url: http://arxiv.org/abs/2604.15233v1
- Date: Thu, 16 Apr 2026 17:10:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:32.017246
- Title: Blue Data Intelligence Layer: Streaming Data and Agents for Multi-source Multi-modal Data-Centric Applications
- Title(参考訳): Blue Data Intelligence Layer:マルチソースマルチモーダルデータ中心アプリケーションのためのストリーミングデータとエージェント
- Authors: Moin Aminnaseri, Farima Fatahi Bayat, Nikita Bhutani, Jean-Flavien Bussotti, Kevin Chan, Rafael Li Chen, Yanlin Feng, Jackson Hassell, Estevam Hruschka, Eser Kandogan, Hannah Kim, James Levine, Seiji Maekawa, Jalal Mahmud, Kushan Mitra, Naoki Otani, Pouya Pezeshkpour, Nima Shahbazi, Chen Shen, Dan Zhang,
- Abstract要約: NL2システムは、データとの自然言語インタラクションの必要性の高まりに対処することを目的としている。
我々は、マルチソース、マルチモーダル、データ中心のアプリケーションをサポートするように設計されたBlueのデータインテリジェンス層(DIL)を提示する。
- 参考スコア(独自算出の注目度): 26.71604287422676
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: NL2SQL systems aim to address the growing need for natural language interaction with data. However, real-world information rarely maps to a single SQL query because (1) users express queries iteratively (2) questions often span multiple data sources beyond the closed-world assumption of a single database, and (3) queries frequently rely on commonsense or external knowledge. Consequently, satisfying realistic data needs require integrating heterogeneous sources, modalities, and contextual data. In this paper, we present Blue's Data Intelligence Layer (DIL) designed to support multi-source, multi-modal, and data-centric applications. Blue is a compound AI system that orchestrates agents and data for enterprise settings. DIL serves as the data intelligence layer for agentic data processing, to bridge the semantic gap between user intent and available information by unifying structured enterprise data, world knowledge accessible through LLMs, and personal context obtained through interaction. At the core of DIL is a data registry that stores metadata for diverse data sources and modalities to enable both native and natural language queries. DIL treats LLMs, the Web, and the User as source 'databases', each with their own query interface, elevating them to first-class data sources. DIL relies on data planners to transform user queries into executable query plans. These plans are declarative abstractions that unify relational operators with other operators spanning multiple modalities. DIL planners support decomposition of complex requests into subqueries, retrieval from diverse sources, and finally reasoning and integration to produce final results. We demonstrate DIL through two interactive scenarios in which user queries dynamically trigger multi-source retrieval, cross-modal reasoning, and result synthesis, illustrating how compound AI systems can move beyond single database NL2SQL.
- Abstract(参考訳): NL2SQLシステムは、データとの自然言語インタラクションの必要性の高まりに対処することを目的としている。
しかし,(1) ユーザがクエリを反復的に表現すること,(2) 質問は単一のデータベースのクローズドワールド仮定を超えた複数のデータソースにまたがることが多く,(3) クエリはコモンセンスや外部知識に依存することが多いため,現実の情報は単一のSQLクエリにマップされることは滅多にない。
したがって、現実的なデータを満たすためには、異質なソース、モダリティ、コンテキストデータを統合する必要がある。
本稿では,マルチソース,マルチモーダル,データ中心のアプリケーションをサポートするように設計されたBlue's Data Intelligence Layer(DIL)を提案する。
Blueは、企業設定のためのエージェントとデータをオーケストレーションする複合AIシステムである。
DILはエージェントデータ処理のためのデータインテリジェンスレイヤとして機能し、構造化されたエンタープライズデータ、LLMを通じてアクセス可能な世界知識、対話を通じて得られる個人的コンテキストを統一することで、ユーザ意図と利用可能な情報のセマンティックギャップを埋める。
DILの中核にあるデータレジストリは、さまざまなデータソースとモダリティのメタデータを格納し、ネイティブおよび自然言語クエリの両方を可能にする。
DIL は LLM 、 Web 、および User をソースとして扱い、それぞれに独自のクエリインターフェースを持ち、それらをファーストクラスのデータソースに昇格させる。
DILは、ユーザクエリを実行可能なクエリプランに変換するために、データプランナに依存しています。
これらの計画は、複数のモダリティにまたがる他の演算子と関係演算子を統合する宣言的抽象化である。
DILプランナは、複雑なリクエストをサブクエリに分解し、さまざまなソースから検索し、最終的な結果を生成するための推論と統合をサポートする。
ユーザクエリがマルチソース検索、クロスモーダル推論、結果合成を動的にトリガする2つの対話的なシナリオを通じて、DILを実証し、複合AIシステムが単一のデータベースNL2SQLを超えてどのように動くかを説明する。
関連論文リスト
- AskDB: An LLM Agent for Natural Language Interaction with Relational Databases [0.06524460254566904]
我々はAskDBを紹介した。AskDBは自然言語を介してデータベースと対話するための大規模言語モデル駆動エージェントである。
AskDBは自然言語によるデータ分析と管理操作のオーバースクルデータベースの両方をサポートする。
我々の結果は、AskDBがリレーショナルデータベースシステムのための統一的でインテリジェントなエージェントである可能性を強調し、エンドユーザーに直感的でアクセスしやすい体験を提供する。
論文 参考訳(メタデータ) (2025-11-20T08:06:09Z) - TEXT2DB: Integration-Aware Information Extraction with Large Language Model Agents [64.11547566154947]
本稿では,IE 出力と対象データベースの統合を重視した IE TEXT2DB の新たな定式化を提案する。
データインフィル、行数、列の追加といった一般的な要求を特徴とする新しいベンチマークを導入する。
実験によると、OPALは異なるコードプランを生成し、必要なIEモデルを呼び出すことで、多様なデータベーススキーマにうまく適応できる。
論文 参考訳(メタデータ) (2025-10-28T02:49:40Z) - DeepMMSearch-R1: Empowering Multimodal LLMs in Multimodal Web Search [61.77858432092777]
DeepMMSearch-R1は,オンデマンドでマルチターンWeb検索が可能な,最初のマルチモーダルな大規模言語モデルである。
DeepMMSearch-R1は、画像検索をより効果的にするために、入力画像の関連する作物に基づいてWeb検索を開始することができる。
我々は、アプローチの優位性を実証するために、知識集約型ベンチマークを幅広く実施する。
論文 参考訳(メタデータ) (2025-10-14T17:59:58Z) - LLM-based Multi-Agent Blackboard System for Information Discovery in Data Science [69.1690891731311]
従来のAIモデルのためのブラックボードアーキテクチャに着想を得た,新しいマルチエージェント通信パラダイムを提案する。
このフレームワークでは、中央エージェントが共有ブラックボードにリクエストをポストし、自律的な従属エージェントがその能力に基づいて応答する。
明示的なデータ発見を必要とする3つのベンチマークに対して,本手法の評価を行った。
論文 参考訳(メタデータ) (2025-09-30T22:34:23Z) - DBRouting: Routing End User Queries to Databases for Answerability [11.6206961865716]
データソースがデータベースである適切なデータソースにエンドユーザクエリをルーティングする,新たなタスクを定義する。
我々は、トレーニングデータを用いて微調整された事前トレーニングとタスク固有の埋め込みの両方を使用して、オープンソースのLLMを使用してデータセットのベースラインを作成する。
データソースの数が増えると、タスクが難しくなります。
論文 参考訳(メタデータ) (2025-01-27T17:09:47Z) - Explainable Multi-Modal Data Exploration in Natural Language via LLM Agent [6.147666891384964]
XMODEは自然言語で説明可能なマルチモーダルデータ探索を可能にするシステムである。
XMODEは、マルチモーダル情報システムの探索を可能にする現実世界のユースケースにインスパイアされている。
論文 参考訳(メタデータ) (2024-12-24T13:42:44Z) - Relational Database Augmented Large Language Model [59.38841050766026]
大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクに優れる。
彼らは、トレーニングや教師付き微調整プロセスを通じてのみ、新しい知識を取り入れることができる。
この正確で最新のプライベート情報は、通常リレーショナルデータベースに格納される。
論文 参考訳(メタデータ) (2024-07-21T06:19:10Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - IQLS: Framework for leveraging Metadata to enable Large Language Model based queries to complex, versatile Data [0.20482269513546458]
Intelligent Query and Learning System (IQLS)は、自然言語を使ってデータ検索を単純化することで、プロセスを単純化する。
利用可能なメタデータと利用可能なデータモデルに基づいて、構造化されたデータをフレームワークにマッピングする。
IQLSは、インターフェイスを通じてユーザクエリによって与えられるタスクをエージェントが実行可能にする。
論文 参考訳(メタデータ) (2024-05-04T13:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。