論文の概要: Perona: Robust Infrastructure Fingerprinting for Resource-Efficient Big
Data Analytics
- arxiv url: http://arxiv.org/abs/2211.08227v1
- Date: Tue, 15 Nov 2022 15:48:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 16:05:41.154735
- Title: Perona: Robust Infrastructure Fingerprinting for Resource-Efficient Big
Data Analytics
- Title(参考訳): Perona: リソース効率の良いビッグデータ分析のためのロバストインフラストラクチャフィンガープリント
- Authors: Dominik Scheinert, Soeren Becker, Jonathan Bader, Lauritz Thamsen,
Jonathan Will, Odej Kao
- Abstract要約: ビッグデータ分析で使用するために,堅牢なインフラストラクチャフィンガープリントのための新しいアプローチであるPeronaを紹介します。
Peronaは、ベンチマークツールの共通セットと設定をターゲットリソースに採用しているため、ベンチマークメトリクスは直接比較され、ランキングが有効になる。
われわれのアプローチは、我々の実験から収集したデータと、リソース構成最適化に関する関連する作業の両方に基づいて評価する。
- 参考スコア(独自算出の注目度): 0.06524460254566904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Choosing a good resource configuration for big data analytics applications
can be challenging, especially in cloud environments. Automated approaches are
desirable as poor decisions can reduce performance and raise costs. The
majority of existing automated approaches either build performance models from
previous workload executions or conduct iterative resource configuration
profiling until a near-optimal solution has been found. In doing so, they only
obtain an implicit understanding of the underlying infrastructure, which is
difficult to transfer to alternative infrastructures and, thus, profiling and
modeling insights are not sustained beyond very specific situations.
We present Perona, a novel approach to robust infrastructure fingerprinting
for usage in the context of big data analytics. Perona employs common sets and
configurations of benchmarking tools for target resources, so that resulting
benchmark metrics are directly comparable and ranking is enabled. Insignificant
benchmark metrics are discarded by learning a low-dimensional representation of
the input metric vector, and previous benchmark executions are taken into
consideration for context-awareness as well, allowing to detect resource
degradation. We evaluate our approach both on data gathered from our own
experiments as well as within related works for resource configuration
optimization, demonstrating that Perona captures the characteristics from
benchmark runs in a compact manner and produces representations that can be
used directly.
- Abstract(参考訳): ビッグデータ分析アプリケーションのための優れたリソース構成の選択は、特にクラウド環境では困難である。
自動アプローチは、低い意思決定によってパフォーマンスが低下し、コストが上昇するので望ましい。
既存の自動化アプローチの大部分は、以前のワークロード実行からパフォーマンスモデルを構築するか、ほぼ最適に近いソリューションが見つかるまで反復的なリソース構成プロファイリングを実行する。
そうすることで、基盤となるインフラストラクチャの暗黙の理解しか得られず、代替インフラストラクチャへの転送が困難になるため、プロファイリングやモデリングの洞察は、非常に特定の状況を超えては維持されない。
我々は,ビッグデータ分析の文脈におけるロバストなインフラストラクチャフィンガープリント手法であるperonaを提案する。
Peronaは、ベンチマークツールの共通セットと設定をターゲットリソースに採用しているため、ベンチマークメトリクスは直接比較され、ランキングが有効になる。
入力メトリックベクトルの低次元表現を学習することで重要なベンチマークメトリクスを破棄し、以前のベンチマークの実行もコンテキスト認識にも考慮し、リソース劣化を検出する。
我々は、我々の実験から収集したデータと関連するリソース構成最適化の作業の両方に基づいて、このアプローチを評価し、peronaがベンチマーク実行時の特性をコンパクトに捉え、直接使用できる表現を生成することを実証した。
関連論文リスト
- Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト・イズ・キー (Context is Key) (CiK) は、時系列予測ベンチマークであり、様々な種類のテキストコンテキストと数値データをペアリングする。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
実験では、文脈情報の導入の重要性を強調し、LLMに基づく予測モデルを用いた場合の驚くべき性能を示すとともに、それらの重要な欠点を明らかにした。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment [104.18002641195442]
既存のペアデータを必要としない、効果的でスケーラブルなトレーニングパラダイムである自己拡張型優先度最適化(SAPO)を導入する。
負の反応を自律的に生成するセルフプレイの概念に基づいて、我々はさらに、データ探索とエクスプロイトを強化するために、非政治的な学習パイプラインを組み込む。
論文 参考訳(メタデータ) (2024-05-31T14:21:04Z) - Building Interpretable and Reliable Open Information Retriever for New
Domains Overnight [67.03842581848299]
情報検索は、オープンドメイン質問応答(QA)など、多くのダウンストリームタスクにとって重要な要素である。
本稿では、エンティティ/イベントリンクモデルとクエリ分解モデルを用いて、クエリの異なる情報単位により正確にフォーカスする情報検索パイプラインを提案する。
より解釈可能で信頼性が高いが,提案したパイプラインは,5つのIRおよびQAベンチマークにおける通過カバレッジと記述精度を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-08-09T07:47:17Z) - OPTION: OPTImization Algorithm Benchmarking ONtology [4.060078409841919]
OPTION(OPTImization algorithm benchmarking ONtology)は、ベンチマークプラットフォーム用のセマンティックにリッチでマシン可読なデータモデルである。
私たちのオントロジーは、ベンチマークプロセスに関わるコアエンティティのセマンティックアノテーションに必要な語彙を提供します。
また、自動データ統合、相互運用性の改善、強力なクエリ機能を提供する。
論文 参考訳(メタデータ) (2022-11-21T10:34:43Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Optimal Resource Allocation for Serverless Queries [8.59568779761598]
以前の作業では、リソース割り当てと実行時の積極的なトレードオフを無視しながら、ピークアロケーションの予測に重点を置いていた。
本稿では,新しいクエリと過去のクエリの両方に対して,アグレッシブなトレードオフでパフォーマンスを予測できる最適なリソース割り当てシステムを提案する。
論文 参考訳(メタデータ) (2021-07-19T02:55:48Z) - Comparative Code Structure Analysis using Deep Learning for Performance
Prediction [18.226950022938954]
本稿では,アプリケーションの静的情報(抽象構文木やASTなど)を用いてコード構造の変化に基づいて性能変化を予測することの実現可能性を評価することを目的とする。
組込み学習手法の評価により,木系長短メモリ(LSTM)モデルでは,ソースコードの階層構造を利用して遅延表現を発見し,最大84%(個人的問題)と73%(複数の問題を含む組み合わせデータセット)の精度で性能変化を予測できることが示された。
論文 参考訳(メタデータ) (2021-02-12T16:59:12Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z) - A critical analysis of metrics used for measuring progress in artificial
intelligence [9.387811897655016]
我々は、3867の機械学習モデルのパフォーマンス結果をカバーするデータに基づいて、現在のパフォーマンス指標の状況を分析する。
結果から、現在使用されているメトリクスの大部分は、モデルの性能の不十分なリフレクションをもたらす可能性のある特性を持っていることが示唆される。
報告された指標の曖昧さを記述し、モデル性能の解釈と比較が困難になる可能性がある。
論文 参考訳(メタデータ) (2020-08-06T11:14:37Z) - IOHanalyzer: Detailed Performance Analyses for Iterative Optimization
Heuristics [3.967483941966979]
IOHanalyzerは、IOHのパフォーマンスデータを分析、比較、視覚化するための新しいユーザフレンドリーなツールである。
IOHanalyzerは、固定目標実行時間とベンチマークアルゴリズムの固定予算性能に関する詳細な統計を提供する。
IOHanalyzerは、主要なベンチマークプラットフォームから直接パフォーマンスデータを処理できる。
論文 参考訳(メタデータ) (2020-07-08T08:20:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。