論文の概要: A Query Engine for the Agents
- arxiv url: http://arxiv.org/abs/2605.27785v1
- Date: Wed, 27 May 2026 00:09:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.615631
- Title: A Query Engine for the Agents
- Title(参考訳): エージェントのためのクエリエンジン
- Authors: Kenny Daniel,
- Abstract要約: オブジェクトストレージから直接ParquetとApache Icebergを読み込む3つのオープンソースのJavaScriptライブラリであるHyperparamを紹介します。
SquirrelingはフィルタバウンドクエリでDuckDB-WASMよりも300倍以上高速にLLM形式の非同期UDFを実行する。
規律としてのデータエンジニアリングは、現在運用中のAIネイティブクライアントアプリケーションの更新が必要である、と私たちは主張する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The fastest-growing data in production today is unstructured text: agent traces, chat logs, reasoning chains, model outputs. People want to analyze it, and the questions worth asking ("show me where the agent got confused") cannot be answered by SQL alone, since text is not queryable without a model in the query path. The natural place this analysis is happening is the new class of AI applications (Claude Code, Cursor, Claude Desktop, in-browser agents) that run client-side and host both a human user and an LLM agent in the same process. These applications increasingly want to work with data, but the lakehouse read path has been hard to use from a JS runtime: Spark, Trino, and managed warehouses do not fit there. To build this new kind of AI data application, three properties of the engine become first-order: a JS-native distribution that drops into the runtime the application already runs in, a bundle small enough to ship inside a cold tab or per-turn agent sandbox, and a way to interleave analytic operators with model-based interpretation of text. We present Hyperparam, three open-source JavaScript libraries (Hyparquet, Squirreling, Icebird) totaling under 70 KB, that read Parquet and Apache Iceberg directly from object storage and meet the third property with per-cell, async-native SQL execution, so expensive cells fire only when downstream operators demand them. Squirreling runs LLM-shaped async UDFs over 300x faster than DuckDB-WASM on filter-bounded queries (and 192x on sort-bounded queries) and completes a ten-task agent analyst suite at two-thirds lower cost. We argue that data engineering as a discipline needs to update for the AI-native client applications now in production and the agents that work alongside their users.
- Abstract(参考訳): エージェントトレース、チャットログ、推論チェーン、モデル出力などだ。
クエリパスのモデルなしでは、テキストがクエリできないため、人々はそれを分析したいし、質問する価値のある質問(エージェントが混乱した場所を示す)はSQLだけでは答えられません。
この分析が行われる自然な場所は、新しいAIアプリケーション(Claude Code、Cursor、Claude Desktop、ブラウザ内エージェント)のクラスで、クライアント側で動作し、人間ユーザとLLMエージェントの両方を同じプロセスでホストする。
これらのアプリケーションはますますデータを扱うようになりたがっているが、Lakehouseの読み取りパスはJSランタイムからの使用が困難になっている。
この新しいタイプのAIデータアプリケーションを構築するために、エンジンの3つの特性が優先される。JSネイティブなディストリビューションは、アプリケーションがすでに実行しているランタイムにドロップし、コールドタブやターン単位のエージェントサンドボックス内に出荷可能なバンドルと、モデルベースのテキスト解釈による解析オペレータのインターリーブ方法である。
Hyparquet、Squirreling、Icebirdの3つのオープンソースJavaScriptライブラリであるHyperparamを紹介します。ParquetとApache Icebergをオブジェクトストレージから直接読み出し、第3のプロパティをセルごとの非同期SQL実行で満たします。
Squirrelingはフィルタバウンドクエリ(およびソートバウンドクエリの192倍)でDuckDB-WASMよりも300倍高速なLLM形式の非同期UDFを実行し、10タスクエージェントアナリストスイートを3分の2のコストで完成する。
規律としてのデータエンジニアリングは、現在運用中のAIネイティブクライアントアプリケーションと、ユーザと一緒に動作するエージェントにアップデートする必要があります。
関連論文リスト
- Speculative Interaction Agents: Building Real-Time Agents with Asynchronous I/O and Speculative Tool Calling [64.40340291543971]
我々は,小さなエッジスケールモデルとのリアルタイムインタラクションを実現するための投機的インタラクションエージェントを提案する。
また、ストリーミング入力と非同期応答を処理するためにモデルを適応させるクロックベースのトレーニング手法を提案する。
このアプローチは、Qwen2.5-3B-InstructとLlama-3.2-3B-Instructモデルを複数のツール呼び出しベンチマークで1.6-2.2$times$ Speedupを提供する。
論文 参考訳(メタデータ) (2026-05-13T11:20:52Z) - Graph-of-Agents: A Graph-based Framework for Multi-Agent LLM Collaboration [57.23877089929136]
Graph-of-Agents (GoA)はマルチエージェントLLM通信をモデリングするための新しいグラフベースのフレームワークである。
GoAは3つの選択されたエージェントしか使用せず、最近のマルチエージェントLCMベースラインよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-04-18T21:13:03Z) - Cortex AISQL: A Production SQL Engine for Unstructured Data [11.480345698642006]
AIはSnowflakeで本番環境にデプロイされ、分析、検索、コンテンツ理解にまたがるさまざまな顧客のワークロードに電力を供給する。
本稿では、AI対応クエリ最適化が、AI推論コストを第一級最適化目標として扱う方法を示す。
第二に、適応モデルカスケードは、高速プロキシモデルを通じてほとんどの行をルーティングすることで、推論コストを削減する。
第三に、セマンティックなジョインクエリの書き換えは、ジョイン操作の二次的な時間の複雑さを線形に下げる。
論文 参考訳(メタデータ) (2025-11-10T22:14:13Z) - BAPPA: Benchmarking Agents, Plans, and Pipelines for Automated Text-to-SQL Generation [3.2476501707160543]
既存の大規模言語モデル(LLM)は、大きなスキーマサイズと複雑な推論のために、自然な命令からsqlを生成するのに苦労する。
本研究では,3つのマルチエージェントLPMパイプラインを探索し,小規模から大規模のオープンソースモデルにまたがる系統的なパフォーマンスベンチマークを行う。
Bird-Bench Mini-Dev セットの実験では、マルチエージェントの議論は小さなモデルの性能を向上させることができ、Qwen2.5-7b-Instruct の実行精度は最大10.6%向上した。
論文 参考訳(メタデータ) (2025-11-06T08:00:15Z) - Two are better than one: Context window extension with multi-grained self-injection [111.1376461868317]
SharedLLMは、多粒度コンテキスト圧縮とクエリ対応情報検索の設計哲学に基づく新しいアプローチである。
本研究では,テキストチャンクの多粒度コンテキスト情報を効率的にエンコードし,保存し,検索するための木構造データ構造を提案する。
論文 参考訳(メタデータ) (2024-10-25T06:08:59Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - SheetAgent: Towards A Generalist Agent for Spreadsheet Reasoning and Manipulation via Large Language Models [45.930510174309845]
大規模言語モデル(LLM)は,最近,スプレッドシートの自動操作のために試みられている。
SheetAgentはPlanner、Informer、Retrieverの3つの共同モジュールで構成されている。
SheetAgentはベースラインよりも複数のベンチマークで20~40%のパスレート改善を実現している。
論文 参考訳(メタデータ) (2024-03-06T11:48:08Z) - Allies: Prompting Large Language Model with Beam Search [107.38790111856761]
本研究では,ALIESと呼ばれる新しい手法を提案する。
入力クエリが与えられた場合、ALLIESはLLMを活用して、元のクエリに関連する新しいクエリを反復的に生成する。
元のクエリのスコープを反復的に精錬して拡張することにより、ALLIESは直接検索できない隠れた知識をキャプチャし、利用する。
論文 参考訳(メタデータ) (2023-05-24T06:16:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。