論文の概要: RELOAD: A Robust and Efficient Learned Query Optimizer for Database Systems
- arxiv url: http://arxiv.org/abs/2604.14725v1
- Date: Thu, 16 Apr 2026 07:35:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.78489
- Title: RELOAD: A Robust and Efficient Learned Query Optimizer for Database Systems
- Title(参考訳): RELOAD: データベースシステムのためのロバストで効率的な学習クエリ最適化
- Authors: Seokwon Lee, Jaeyoung Sim, Sihyun Kim, Yuhsing Li, Yiwen Zhu, Kwanghyun Park,
- Abstract要約: データベースシステムのための堅牢で効率的な学習クエリであるRELOADを提案する。
我々は、最先端のRLベースのクエリ最適化技術と比較して、2.4倍の堅牢性と3.1倍の効率を示す。
- 参考スコア(独自算出の注目度): 9.540898133316729
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in query optimization have shifted from traditional rule-based and cost-based techniques towards machine learning-driven approaches. Among these, reinforcement learning (RL) has attracted significant attention due to its ability to optimize long-term performance by learning policies over query planning. However, existing RL-based query optimizers often exhibit unstable performance at the level of individual queries, including severe performance regressions, and require prolonged training to reach the plan quality of expert, cost-based optimizers. These shortcomings make learned query optimizers difficult to deploy in practice and remain a major barrier to their adoption in production database systems. To address these challenges, we present RELOAD, a robust and efficient learned query optimizer for database systems. RELOAD focuses on (i) robustness, by minimizing query-level performance regressions and ensuring consistent optimization behavior across executions, and (ii) efficiency, by accelerating convergence to expert-level plan quality. Through extensive experiments on standard benchmarks, including Join Order Benchmark, TPC-DS, and Star Schema Benchmark, RELOAD demonstrates up to 2.4x higher robustness and 3.1x greater efficiency compared to state-of-the-art RL-based query optimization techniques.
- Abstract(参考訳): クエリ最適化の最近の進歩は、従来のルールベースおよびコストベースのテクニックから、マシンラーニング駆動アプローチへと移行している。
これらのうち、クエリ計画よりも学習ポリシーによって長期的パフォーマンスを最適化する能力によって、強化学習(RL)が注目されている。
しかし、既存のRLベースのクエリオプティマイザは、厳格なパフォーマンスレグレッションを含む個々のクエリのレベルで不安定なパフォーマンスを示すことが多く、専門家の計画品質に到達するには長期のトレーニングが必要である。
これらの欠点は、学習したクエリオプティマイザを実際にデプロイすることが難しくし、本番データベースシステムで採用する上で大きな障壁を保ちます。
これらの課題に対処するため、データベースシステムのための堅牢で効率的なクエリオプティマイザであるRELOADを提案する。
RELOADは焦点をあてる
(i)堅牢性、クエリレベルのパフォーマンスレグレッションを最小化し、実行間で一貫した最適化動作を確保することにより、
(II) 専門家レベルの計画品質への収束を加速することにより効率を向上する。
Join Order Benchmark、TPC-DS、Star Schema Benchmarkといった標準ベンチマークに関する広範な実験を通じて、RELOADは最先端のRLベースのクエリ最適化技術と比較して、2.4倍高い堅牢性と3.1倍の効率を示す。
関連論文リスト
- Optimizing Prompts for Large Language Models: A Causal Approach [8.091354120300972]
本稿では,因果推定の問題として設計を即時的に再編成するフレームワークを提案する。
CPOは、人間工学的なプロンプトや最先端の自動化よりも一貫して優れています。
論文 参考訳(メタデータ) (2026-02-02T06:37:11Z) - When should I search more: Adaptive Complex Query Optimization with Reinforcement Learning [26.489185170468062]
適応複雑クエリ最適化(ACQO)と呼ばれる新しいRLフレームワークを提案する。
我々のフレームワークは、いつ、どのように検索プロセスを拡張するかを適応的に決定するように設計されている。
ACQOは3つの複雑なクエリベンチマークで最先端のパフォーマンスを達成し、確立されたベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2026-01-29T03:16:53Z) - WebLeaper: Empowering Efficiency and Efficacy in WebAgent via Enabling Info-Rich Seeking [60.35109192765302]
情報検索は、自律的な推論と意思決定を可能にする中核的な能力である。
我々は、高カバレッジなISタスクを構築し、効率的なソリューショントラジェクトリを生成するためのフレームワークであるWebLeaperを提案する。
本手法は,強いベースラインに対する有効性と効率性の向上を継続的に達成する。
論文 参考訳(メタデータ) (2025-10-28T17:51:42Z) - Rethinking On-policy Optimization for Query Augmentation [49.87723664806526]
本稿では,様々なベンチマークにおいて,プロンプトベースとRLベースのクエリ拡張の最初の体系的比較を示す。
そこで我々は,検索性能を最大化する擬似文書の生成を学習する,新しいハイブリッド手法 On-policy Pseudo-document Query Expansion (OPQE) を提案する。
論文 参考訳(メタデータ) (2025-10-20T04:16:28Z) - Learning to Route: A Rule-Driven Agent Framework for Hybrid-Source Retrieval-Augmented Generation [55.47971671635531]
大言語モデル(LLM)は、一般質問回答(QA)において顕著な性能を示した。
Retrieval-Augmented Generation (RAG)は、LLMを外部知識で強化することで、この制限に対処する。
既存のシステムは、主に構造化されていないドキュメントに依存しているが、主にリレーショナルデータベースを見下ろしている。
論文 参考訳(メタデータ) (2025-09-30T22:19:44Z) - Sample-efficient LLM Optimization with Reset Replay [13.739451157239756]
Reset Replay (LoRR) は、任意の好みベースの最適化フレームワークにおいて、サンプリング効率を高めるために設計されたプラグインである。
LoRRは、ネットワークの可塑性を保存する初期データを再利用する定期的なリセット戦略を取り入れている。
実験により,LoRRは数学的および一般的な推論ベンチマークにおいて,様々な選好最適化手法の性能を著しく向上させることが示された。
論文 参考訳(メタデータ) (2025-08-08T15:56:49Z) - Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay [69.67914133280296]
強化学習(RL)は、大規模言語モデル(LLM)の微調整に有効なアプローチとなっている。
LLM RLファインチューニングにおけるデータ効率向上のための2つの手法を提案する。
本手法は,従来のGRPOアルゴリズムと同等の性能を示しながら,RLの微調整時間を23%から62%削減する。
論文 参考訳(メタデータ) (2025-06-05T17:55:43Z) - Robust Plan Evaluation based on Approximate Probabilistic Machine Learning [3.0784574277021406]
本稿ではリスク認識学習アプローチに基づく総合的なフレームワークであるRoq(Roust Query)を提案する。
Roqには、クエリ実行のコストと関連するリスクを予測するために設計された、新しい学習コストモデルが含まれている。
我々は、Roqが、最先端技術と比較して、堅牢なクエリ最適化において大幅に改善されていることを実証した。
論文 参考訳(メタデータ) (2024-01-26T21:16:37Z) - JoinGym: An Efficient Query Optimization Environment for Reinforcement
Learning [58.71541261221863]
結合順序選択(JOS)は、クエリの実行コストを最小化するために結合操作を順序付けする問題である。
木質強化学習(RL)のためのクエリ最適化環境JoinGymを提案する。
JoinGymは内部で、事前計算されたデータセットから中間結果の濃度を調べることで、クエリプランのコストをシミュレートする。
論文 参考訳(メタデータ) (2023-07-21T17:00:06Z) - Lero: A Learning-to-Rank Query Optimizer [49.841082217997354]
これは、ネイティブクエリの上に構築され、クエリ最適化を改善するために継続的に学習される。
Leroはスクラッチから学習を構築するのではなく、数十年にわたるデータベースの知恵を活用し、ネイティブ性を改善するように設計されている。
Leroはいくつかのベンチマークでほぼ最適なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-02-14T07:31:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。