論文の概要: Predicting User Experience on Laptops from Hardware Specifications
- arxiv url: http://arxiv.org/abs/2402.08964v1
- Date: Wed, 14 Feb 2024 06:10:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-15 16:45:05.503041
- Title: Predicting User Experience on Laptops from Hardware Specifications
- Title(参考訳): ハードウェア仕様からLaptopsのユーザエクスペリエンスを予測する
- Authors: Saswat Padhi, Sunil K. Bhasin, Udaya K. Ammu, Alex Bergman, Allan
Knies
- Abstract要約: 私たちは、Webブラウジング、ビデオ再生、オーディオ/ビデオ通話という、一般的なエンドユーザワークロード上の9つのUXメトリクスを追跡します。
100KのUXデータポイントのデータセットを使用して、デバイス仕様からメトリック値を予測するために、勾配の増大した回帰木をトレーニングします。
9つの指標全体で、平均R2$スコア(データセットに適合)は97.8%、平均MAAPEは10.1%である。
- 参考スコア(独自算出の注目度): 0.01249953711944024
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Estimating the overall user experience (UX) on a device is a common challenge
faced by manufacturers. Today, device makers primarily rely on microbenchmark
scores, such as Geekbench, that stress test specific hardware components, such
as CPU or RAM, but do not satisfactorily capture consumer workloads. System
designers often rely on domain-specific heuristics and extensive testing of
prototypes to reach a desired UX goal, and yet there is often a mismatch
between the manufacturers' performance claims and the consumers' experience.
We present our initial results on predicting real-life experience on laptops
from their hardware specifications. We target web applications that run on
Chromebooks (ChromeOS laptops) for a simple and fair aggregation of experience
across applications and workloads. On 54 laptops, we track 9 UX metrics on
common end-user workloads: web browsing, video playback and audio/video calls.
We focus on a subset of high-level metrics exposed by the Chrome browser, that
are part of the Web Vitals initiative for judging the UX on web applications.
With a dataset of 100K UX data points, we train gradient boosted regression
trees that predict the metric values from device specifications. Across our 9
metrics, we note a mean $R^2$ score (goodness-of-fit on our dataset) of 97.8%
and a mean MAAPE (percentage error in prediction on unseen data) of 10.1%.
- Abstract(参考訳): デバイス上のユーザエクスペリエンス全体(UX)を見積もるのは,製造業者が直面する一般的な課題です。
今日では、デバイスメーカーは主に、cpuやramなどの特定のハードウェアコンポーネントをテストするが、消費者のワークロードを十分に把握しない、geekbenchなどのマイクロベンチマークスコアに依存している。
システム設計者は、望ましいux目標を達成するために、ドメイン固有のヒューリスティックやプロトタイプの広範なテストに依存することが多いが、製造者のパフォーマンス要求と消費者の経験の間にはミスマッチがある。
ハードウェア仕様からノートパソコンの実際の体験を予測するための最初の結果を示す。
chromebook(chromeosラップトップ)上で動作するwebアプリケーションを対象として、アプリケーションとワークロード間のエクスペリエンスをシンプルかつ公平に集約しています。
54のラップトップ上では、Webブラウジング、ビデオ再生、オーディオ/ビデオ通話という、一般的なエンドユーザワークロード上の9つのUXメトリクスを追跡します。
我々は、webアプリケーションにおけるuxを判断するためのweb vitalsイニシアチブの一部であるchromeブラウザが公開するハイレベルなメトリクスのサブセットにフォーカスしています。
10kのuxデータポイントのデータセットを使って、デバイス仕様からメトリック値を予測する勾配強化回帰ツリーをトレーニングします。
9つの指標のうち、平均r^2$スコア(データセットに適合する点)は97.8%、平均maapeスコアは10.1%である。
関連論文リスト
- Towards Realistic Evaluation of Commit Message Generation by Matching Online and Offline Settings [77.20838441870151]
コミットメッセージ生成は、ソフトウェアエンジニアリングにおいて重要なタスクであり、正しく評価することが難しい。
オンラインメトリック - VCSに生成されたメッセージをコミットする前にユーザが導入する編集回数 - を使用して、オフライン実験用のメトリクスを選択します。
その結果,編集距離が最も高い相関を示すのに対し,BLEUやMETEORなどの類似度は低い相関を示すことがわかった。
論文 参考訳(メタデータ) (2024-10-15T20:32:07Z) - A Detailed Historical and Statistical Analysis of the Influence of
Hardware Artifacts on SPEC Integer Benchmark Performance [0.4427733388120187]
標準性能評価コーポレーション(SPEC)のCPUベンチマークは、何十年もの間、コンピュータ性能の指標として広く使われてきた。
過去の取り組みでは、SPECベンチマークスイートが時間とともにどのように経験的に進化したのか、というような質問に対する回答は提供されていない。
これらの質問に対する回答は,コンピュータシステムパフォーマンスの将来に対する洞察を与えてくれるだろうか?
論文 参考訳(メタデータ) (2024-01-30T02:30:22Z) - Ageing Analysis of Embedded SRAM on a Large-Scale Testbed Using Machine
Learning [0.0]
老朽化検出と障害予測は、多くのInternet of Thingsデプロイメントにおいて不可欠である。
汎用テストベッドから154枚の基板を大規模に解析した。
以上の結果から, 加齢の影響は微妙ではあるが, 有効利用時間を推定できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-07-13T11:37:47Z) - FLEdge: Benchmarking Federated Machine Learning Applications in Edge Computing Systems [61.335229621081346]
フェデレートラーニング(FL)は,ネットワークエッジ上での分散ディープラーニングのプライバシ強化を実現する上で,有効なテクニックとなっている。
本稿では,既存のFLベンチマークを補完するFLEdgeを提案する。
論文 参考訳(メタデータ) (2023-06-08T13:11:20Z) - Predicting the Performance of a Computing System with Deep Networks [4.301276597844756]
未確認ハードウェアのベンチマークスコアを予測するために、Deep Learningモデルを構築する可能性を実証する。
完全接続ネットワークと2つの畳み込みニューラルネットワーク(1つのbespokeと1つのResNetにインスパイアされた)の3つの異なるネットワークを評価し,それぞれ0.96,0.98,0.94の印象的なR2$スコアを実証した。
論文 参考訳(メタデータ) (2023-02-27T10:08:21Z) - MAPLE-X: Latency Prediction with Explicit Microprocessor Prior Knowledge [87.41163540910854]
ディープニューラルネットワーク(DNN)レイテンシのキャラクタリゼーションは、時間を要するプロセスである。
ハードウェアデバイスの事前知識とDNNアーキテクチャのレイテンシを具体化し,MAPLEを拡張したMAPLE-Xを提案する。
論文 参考訳(メタデータ) (2022-05-25T11:08:20Z) - MAPLE-Edge: A Runtime Latency Predictor for Edge Devices [80.01591186546793]
汎用ハードウェアの最先端遅延予測器であるMAPLEのエッジデバイス指向拡張であるMAPLE-Edgeを提案する。
MAPLEと比較して、MAPLE-Edgeはより小さなCPUパフォーマンスカウンタを使用して、ランタイムとターゲットデバイスプラットフォームを記述することができる。
また、共通ランタイムを共有するデバイスプール上でトレーニングを行うMAPLEとは異なり、MAPLE-Edgeは実行時に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2022-04-27T14:00:48Z) - Are Missing Links Predictable? An Inferential Benchmark for Knowledge
Graph Completion [79.07695173192472]
InferWikiは推論能力、仮定、パターンの既存のベンチマークを改善している。
各テストサンプルは、トレーニングセットの支持データで予測可能である。
実験では,大きさや構造が異なるInferWikiの2つの設定をキュレートし,比較データセットとしてCoDExに構築プロセスを適用する。
論文 参考訳(メタデータ) (2021-08-03T09:51:15Z) - Superiority of Simplicity: A Lightweight Model for Network Device
Workload Prediction [58.98112070128482]
本稿では,歴史観測に基づく時系列予測のための軽量な解を提案する。
ニューラルネットワークと平均予測器という2つのモデルからなる異種アンサンブル法で構成されている。
利用可能なFedCSIS 2020チャレンジデータセットの総合的なR2$スコア0.10を達成している。
論文 参考訳(メタデータ) (2020-07-07T15:44:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。