論文の概要: Polars inside Intel SGX2 Enclaves: An Empirical Study of Confidential Analytical Query Processing
- arxiv url: http://arxiv.org/abs/2605.21797v1
- Date: Wed, 20 May 2026 22:47:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.016272
- Title: Polars inside Intel SGX2 Enclaves: An Empirical Study of Confidential Analytical Query Processing
- Title(参考訳): Intel SGX2 Enclavesの内部ポラリス:信頼分析クエリ処理の実証的研究
- Authors: Wei Wang, Burns Smith, Kenny Leftin,
- Abstract要約: 本稿では,Azure Blob Storageを使用したTPC-H SF30上で,Intel SGX2エンクレーブ内で動作するArrow-native DataFrameエンジンであるPolarsについて検討する。
我々は、標準のTPC-Hパワースコアと、データ入力オーバーヘッドから計算オーバーヘッドを分離するためにテーブルローディング時間を除去するクエリのみのバリエーションの両方を報告する。
- 参考スコア(独自算出の注目度): 2.6853734738584047
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Trusted Execution Environments (TEEs) have renewed interest in confidential analytics, but most prior evaluations focus on SQL database engines or earlier SGX generations. This paper studies an Arrow-native DataFrame engine, Polars, running inside Intel SGX2 enclaves via Gramine on TPC-H SF30 with Azure Blob Storage. We report both the standard TPC-H power score and a query-only variant that removes table-loading time in order to separate compute overhead from data-ingestion overhead. Across four dataset-width configurations (approximately 22-73 GB), end-to-end overhead remains nearly constant at 1.49-1.56$\times$, but this composite metric obscures two distinct behaviors: query-only overhead declines from 1.51-1.52$\times$ to 1.43-1.44$\times$, whereas table-loading overhead rises from 2.27$\times$ to 4.07$\times$. We further show that overhead is not uniform across queries: for the len130 configuration, the median per-query SGX slowdown is 1.45$\times$ with a maximum of 2.57$\times$, and a small set of queries exhibits pronounced run-to-run spikes consistent with stateful EPC pressure. Finally, we compare Polars' lazy and eager APIs under the same TEE setting. Lazy execution is 2.25-2.27$\times$ faster overall, while eager execution fails with out-of-memory errors at 41 GB and above. Relative to the recent DuckDB-SGX2 study, our results suggest that SGX2 can support Arrow-native analytical processing with a similar order of security overhead, but that load-path amplification and API-level optimization are first-order determinants of end-to-end performance.
- Abstract(参考訳): Trusted Execution Environments (TEEs) は機密分析に新たな関心を持っているが、以前の評価ではSQLデータベースエンジンや以前のSGX世代に重点を置いていた。
本稿では,Azure Blob Storageを使用したTPC-H SF30上で,Intel SGX2エンクレーブ内で動作するArrow-native DataFrameエンジンであるPolarsについて検討する。
我々は、標準のTPC-Hパワースコアと、データ入力オーバーヘッドから計算オーバーヘッドを分離するためにテーブルローディング時間を除去するクエリのみのバリエーションの両方を報告する。
4つのデータセット幅構成(約22-73 GB)で、エンドツーエンドのオーバーヘッドは1.49-1.56$\times$でほぼ一定であるが、この複合メトリックは、クエリのみのオーバーヘッドが1.51-1.52$\times$から1.43-1.44$\times$に減少する一方、テーブルローディングのオーバーヘッドは2.27$\times$から4.07$\times$に上昇する。
len130設定の場合、クエリごとの平均的なSGXのスローダウンは1.45$\times$で最大2.57$\times$で、クエリの小さなセットは、ステートフルなEPC圧力と一致した実行時スパイクを示す。
最後に、同じTEE設定でPolarsの遅延APIと熱心なAPIを比較します。
遅延実行は総じて2.25-2.27$\times$で、熱心な実行は41GB以上のメモリ外エラーで失敗する。
最近のDuckDB-SGX2研究と比較すると、SGX2はArrow-native解析処理を同様のセキュリティオーバヘッドでサポートできるが、ロードパスの増幅とAPIレベルの最適化はエンドツーエンドのパフォーマンスの第一次決定要因である。
関連論文リスト
- Pre-Execution Query Slot-Time Prediction in Cloud Data Warehouses: A Feature-Scoped Machine Learning Approach [0.0]
クラウドデータウェアハウスは、消費されるスロット時間に基づく請求計算を行う。
共有マルチテナント環境では、クエリコストは可変であり、実行前に見積もるのは困難である。
本稿では,事前実行可観測信号のみを用いて,実行前にBigQueryのスロットタイムを予測する機械学習手法を提案する。
論文 参考訳(メタデータ) (2026-04-22T03:15:16Z) - Improving Efficiency of GPU Kernel Optimization Agents using a Domain-Specific Language and Speed-of-Light Guidance [2.6106833542109693]
エージェントが操作する抽象化レベルについて、2つの重要な観察を行う。
CUTLASSが支援するGPUカーネル用のコンパイラを備えたDSLであるCUTLASSでこれらの原則を実装します。
我々は、SOLガイダンスを使用して、ヘッドルームを推定し、最適化試験をガイドし、SOLに近い問題を優先順位付けし、ベンチマークをゲームするカーネルにフラグを付ける。
論文 参考訳(メタデータ) (2026-03-30T21:16:39Z) - Envy-Free Allocation of Indivisible Goods via Noisy Queries [66.16311857301167]
エージェントのバリュエーションを直接観察できない、かなり分割不可能な商品を割り当てる問題を導入する。
本手法では,要求されるクエリ数の上限値と上限値の上限値を求める。
我々の上限は、非適応的なクエリと計算時間で実行される単純なしきい値に基づくアロケーションアルゴリズムに基づいている。
論文 参考訳(メタデータ) (2026-02-06T03:44:40Z) - TwinFormer: A Dual-Level Transformer for Long-Sequence Time-Series Forecasting [0.0]
TwinFormerは時系列予測のための階層型トランスフォーマーである。
入力を重複しない時間パッチに分割し、2段階に分けて処理する。
軽量GRUは、直接マルチ水平予測のために、グローバルにコンテキスト化されたパッチトークンを集約する。
論文 参考訳(メタデータ) (2025-12-13T11:50:18Z) - A First Runtime Analysis of the PAES-25: An Enhanced Variant of the Pareto Archived Evolution Strategy [1.223779595809275]
本稿では,PAES-25の数学的実行時解析について述べる。
PAES-25は,m$-LOTZに1ビットの変異を伴って,厳密なランタイム境界を導出する。
標準的なビット突然変異を持つPAES-25は、予想される$O(n4)$イテレーションで、双方向のLOTZベンチマークを最適化する。
論文 参考訳(メタデータ) (2025-07-04T15:38:29Z) - HiRE: High Recall Approximate Top-$k$ Estimation for Efficient LLM
Inference [68.59839755875252]
HiREは2つの新しいコンポーネントから構成される: (i) (i) (i) (i) (i) (i) (i) (i) (i) (i) (ii) DA-TOP-$k$: 効率的なマルチデバイス近似トップ-k$演算子) (i) (i) (i) (i) (i) (i) (i) DA-TOP-$k$演算子) 。
我々は、10億のパラメータモデルにおいて、HiREがソフトマックスとフィードフォワード層の両方に適用され、ほぼ一致した事前学習と下流の精度を実現し、1台のTPUv5eデバイスで1.47Times$の推論遅延を高速化することを示した。
論文 参考訳(メタデータ) (2024-02-14T18:04:36Z) - JoinGym: An Efficient Query Optimization Environment for Reinforcement
Learning [58.71541261221863]
結合順序選択(JOS)は、クエリの実行コストを最小化するために結合操作を順序付けする問題である。
木質強化学習(RL)のためのクエリ最適化環境JoinGymを提案する。
JoinGymは内部で、事前計算されたデータセットから中間結果の濃度を調べることで、クエリプランのコストをシミュレートする。
論文 参考訳(メタデータ) (2023-07-21T17:00:06Z) - On the Optimal Bounds for Noisy Computing [17.56584950469176]
Wevisit the problem of computing with noisy information considered in Feige et al. 1994。
与えられた要素に対して、目標は、各クエリの結果が確率$p$で反転されたときに、少なくとも1-delta$の確率で所望の関数を正しく回復することである。
本稿では、過去の結果に基づいて各クエリを適応的に設計できる適応型サンプリング設定と、過去の結果に依存しない非適応型サンプリング設定の両方について考察する。
論文 参考訳(メタデータ) (2023-06-21T00:31:23Z) - On the Unlikelihood of D-Separation [69.62839677485087]
解析的な証拠として、大きなグラフ上では、d-分離は存在が保証されたとしても珍しい現象である。
PCアルゴリズムでは、その最悪ケース保証がスパースグラフで失敗することが知られているが、平均ケースでも同じことが言える。
UniformSGSでは、既存のエッジに対してランニング時間が指数的であることが知られているが、平均的な場合、それは既存のほとんどのエッジにおいても期待されるランニング時間であることを示す。
論文 参考訳(メタデータ) (2023-03-10T00:11:18Z) - How to Query An Oracle? Efficient Strategies to Label Data [59.89900843097016]
機械学習におけるデータセットのラベル付けに専門家の託宣を照会する際の基本的な問題について考察する。
本稿では,サンプルをラベル付けするために,ラウンド・バイ・ラウンドでランダム化されたバッチアルゴリズムを提案し,クエリレートが$O(fracNk2)$であることを示す。
さらに,適応型グリージークエリ方式を提案し,三重項クエリを用いたサンプルあたり平均$approx 0.2N$クエリを実現する。
論文 参考訳(メタデータ) (2021-10-05T20:15:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。