論文の概要: Agentic Cost-Aware Query Planning with Knowledge Distillation for Big Data Analytics
- arxiv url: http://arxiv.org/abs/2605.17831v1
- Date: Mon, 18 May 2026 04:07:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.804558
- Title: Agentic Cost-Aware Query Planning with Knowledge Distillation for Big Data Analytics
- Title(参考訳): ビッグデータ分析のための知識蒸留によるエージェントコスト対応クエリプランニング
- Authors: Mahdi Naser-Moghadasi,
- Abstract要約: 本稿では,ルールベースの教師プランナ,UPB1バンディット探索,コスト認識予測,知識蒸留を組み合わせたエージェントクエリ計画システムを提案する。
蒸留された学生プランナーは、高速推論のために教師とバンドの意思決定を模倣することを学びます。
我々の単一ファイル実装は、リソース制限されたマシン上で再現可能なビッグデータ分析を可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Query optimization in big data analytics remains computationally expensive, particularly for resource-constrained environments where traditional optimizers fail to satisfy memory and latency constraints. We present an agentic query planning system that combines a rule-based teacher planner, UCB1 bandit exploration, cost-aware prediction, and knowledge distillation to a lightweight student planner. Our teacher planner generates SQL plans using six key optimization strategies, while UCB1 bandit search efficiently explores the plan space under explicit resource constraints. A Random Forest cost model predicts query latency from plan features, enabling cost-aware decisions. A distilled student planner (Logistic Regression or Gradient Boosting) learns to mimic teacher-bandit decisions for fast inference. Evaluation on NYC Taxi and IMDB datasets demonstrates 23% latency reduction compared to default planners while maintaining 94% constraint satisfaction. The student planner achieves 89% accuracy in replicating optimal plans with 15x faster inference time. Our single-file implementation enables reproducible big-data analytics on resource-limited machines and is publicly available at https://github.com/mahdinaser/agentic-kd-planner.
- Abstract(参考訳): ビッグデータ分析におけるクエリの最適化は、特に従来のオプティマイザがメモリとレイテンシの制約を満たすのに失敗するリソース制約のある環境では、依然として計算コストがかかる。
本稿では,ルールベースの教師プランナ,UPB1バンディット探索,コスト認識予測,知識蒸留を組み合わせたエージェントクエリ計画システムを提案する。
教師プランナーは6つの主要な最適化戦略を用いてSQLプランを生成する一方、UCB1の帯域探索は明示的なリソース制約の下でプランスペースを効率的に探索する。
Random Forestのコストモデルは、プラン機能からクエリレイテンシを予測し、コストを意識した決定を可能にする。
蒸留された学生プランナー(ロジスティック回帰またはグラディエントブースティング)は、高速推論のための教師とバンドの意思決定を模倣することを学ぶ。
NYC TaxiとIMDBデータセットの評価では、デフォルトのプランナに比べて23%のレイテンシ低下を示し、94%の制約満足度を維持している。
学生プランナーは最適計画の複製において89%の精度を15倍高速な推論時間で達成する。
我々のシングルファイル実装は、リソース制限されたマシン上で再現可能なビッグデータ分析を可能にし、https://github.com/mahdinaser/agentic-kd-planner.comで公開されています。
関連論文リスト
- Self-Improvement for Fast, High-Quality Plan Generation [13.377592170793994]
復号器のみの変換器は、未確認の問題インスタンスに対して高品質な計画を生成することができることを示す。
また、準最適データに基づいて訓練された初期モデルを自己改善する方法を示す。
論文 参考訳(メタデータ) (2026-05-05T10:55:18Z) - No-Regret Learning Under Adversarial Resource Constraints: A Spending Plan Is All You Need! [56.80767500991973]
アクション選択の前に報酬とコストが観測される$(i)$オンラインリソース割当と、アクション選択後、完全なフィードバックや盗賊フィードバックの下で、リソース制限付きオンライン学習である$(ii)$オンラインリソース割当に焦点を当てた。
報酬とコスト分布が時間とともに任意に変化する場合、これらの設定でサブ線形後悔を達成することは不可能であることが知られている。
我々は、支出計画に従う基準線に対する半線形後悔を実現する一般的な(基本的)二重的手法を設計し、また、支出計画が予算のバランスの取れた配分を保証すると、アルゴリズムの性能が向上する。
論文 参考訳(メタデータ) (2025-06-16T08:42:31Z) - $\texttt{SPECS}$: Faster Test-Time Scaling through Speculative Drafts [55.231201692232894]
$textttSPECS$は、投機的デコードにインスパイアされた遅延対応のテスト時間スケーリングメソッドである。
我々の結果は、$textttSPECS$matchはビームサーチの精度を上回り、最大$sim$19.1%のレイテンシを削減していることを示している。
論文 参考訳(メタデータ) (2025-06-15T05:50:05Z) - On The Planning Abilities of OpenAI's o1 Models: Feasibility, Optimality, and Generalizability [59.72892401927283]
さまざまなベンチマークタスクでOpenAIのo1モデルの計画能力を評価する。
その結果,o1-preview は GPT-4 よりもタスク制約に順応していることがわかった。
論文 参考訳(メタデータ) (2024-09-30T03:58:43Z) - TransPath: Learning Heuristics For Grid-Based Pathfinding via
Transformers [64.88759709443819]
探索の効率を顕著に向上させると考えられる,インスタンス依存のプロキシを学習することを提案する。
私たちが最初に学ぶことを提案するプロキシは、補正係数、すなわち、インスタンスに依存しないコスト・ツー・ゴの見積もりと完璧な見積もりの比率である。
第2のプロキシはパス確率であり、グリッドセルが最も短いパスに横たわっている可能性を示している。
論文 参考訳(メタデータ) (2022-12-22T14:26:11Z) - Planning with Dynamically Estimated Action Costs [2.8326418377665346]
実際のAI計画アプリケーションには、アクションコストに関する情報が不可欠だ。
近年のアプローチでは、データからしばしば学習されるブラックボックス外部アクションコスト推定器が計画段階で適用されている。
本稿では,行動コストを考慮した決定論的計画の一般化を提案する。
論文 参考訳(メタデータ) (2022-06-08T21:10:37Z) - REX: Revisiting Budgeted Training with an Improved Schedule [14.618325490983052]
本稿では,Reflectred Exponential(REX)スケジュールと呼ばれる新しいプロファイルとサンプリングレートの組み合わせを提案する。
REXは、いくつかの最先端の学習率スケジュールのパフォーマンスを一致または超えながら、低予算で線形スケジュールを上回ります。
論文 参考訳(メタデータ) (2021-07-09T04:17:35Z) - A Survey on Advancing the DBMS Query Optimizer: Cardinality Estimation,
Cost Model, and Plan Enumeration [17.75042918159419]
コストベースのアルゴリズムは、現在のほとんどのデータベースシステムで採用されている。
コストモデル、カーディナリティでは、オペレータによる数字の数は重要な役割を果たします。
基数推定の不正確さ、コストの誤差、および巨大な計画空間モデルにより、アルゴリズムは複雑なクエリに対して妥当な時間で最適な実行計画を見つけることができない。
論文 参考訳(メタデータ) (2021-01-05T13:47:45Z) - A Predictive Autoscaler for Elastic Batch Jobs [8.354712625979776]
Deep Learning、HPC、Sparkといった大規模なバッチジョブは、従来のオンラインサービスよりもはるかに多くの計算リソースとコストを必要とします。
顧客とオーバプロビジョンインスタンスに対して,柔軟なインターフェースを提供するための予測オートスケーラを提案する。
論文 参考訳(メタデータ) (2020-10-10T17:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。