論文の概要: MobileUPReg: Identifying User-Perceived Performance Regressions in Mobile OS Versions
- arxiv url: http://arxiv.org/abs/2509.16864v1
- Date: Sun, 21 Sep 2025 01:30:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 14:55:17.314411
- Title: MobileUPReg: Identifying User-Perceived Performance Regressions in Mobile OS Versions
- Title(参考訳): MobileUPReg: モバイルOSバージョンにおけるユーザ認識のパフォーマンス低下を識別する
- Authors: Wei Liu, Yi Wen Heng, Feng Lin, Tse-Hsun, Chen, Ahmed E. Hassan,
- Abstract要約: モバイルオペレーティングシステム(OS)は頻繁に更新されるが、そのような更新はパフォーマンスのレグレッションを導入することで、意図せずにユーザエクスペリエンスを劣化させる可能性がある。
既存の検出技術はシステムレベルのメトリクスに依存したり、特定のOSコンポーネントにフォーカスすることが多い。
我々は,OSバージョン間でユーザ認識されたパフォーマンスレグレッションを検出するブラックボックスフレームワークであるMobileUPRegを提案する。
- 参考スコア(独自算出の注目度): 23.30663566219316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mobile operating systems (OS) are frequently updated, but such updates can unintentionally degrade user experience by introducing performance regressions. Existing detection techniques often rely on system-level metrics (e.g., CPU or memory usage) or focus on specific OS components, which may miss regressions actually perceived by users -- such as slower responses or UI stutters. To address this gap, we present MobileUPReg, a black-box framework for detecting user-perceived performance regressions across OS versions. MobileUPReg runs the same apps under different OS versions and compares user-perceived performance metrics -- response time, finish time, launch time, and dropped frames -- to identify regressions that are truly perceptible to users. In a large-scale study, MobileUPReg achieves high accuracy in extracting user-perceived metrics and detects user-perceived regressions with 0.96 precision, 0.91 recall, and 0.93 F1-score -- significantly outperforming a statistical baseline using the Wilcoxon rank-sum test and Cliff's Delta. MobileUPReg has been deployed in an industrial CI pipeline, where it analyzes thousands of screencasts across hundreds of apps daily and has uncovered regressions missed by traditional tools. These results demonstrate that MobileUPReg enables accurate, scalable, and perceptually aligned regression detection for mobile OS validation.
- Abstract(参考訳): モバイルオペレーティングシステム(OS)は頻繁に更新されるが、そのような更新はパフォーマンスのレグレッションを導入することで、意図せずにユーザエクスペリエンスを劣化させる可能性がある。
既存の検出技術はシステムレベルのメトリクス(CPUやメモリ使用量など)に依存したり、特定のOSコンポーネントにフォーカスすることが多い。
このギャップに対処するため、OSバージョン間でユーザ認識されたパフォーマンスレグレッションを検出するブラックボックスフレームワークであるMobileUPRegを提示する。
MobileUPRegは、異なるOSバージョンの下で同じアプリを実行し、ユーザの認識したパフォーマンス指標(応答時間、終了時間、起動時間、ドロップフレーム)を比較して、本当にユーザにとって認識可能なレグレッションを特定する。
大規模な調査では、MobileUPRegは、ユーザの知覚したメトリクスを抽出する際の高精度を達成し、0.96の精度、0.91のリコール、0.93のF1スコアでユーザ認識の回帰を検出する。
MobileUPRegは産業用CIパイプラインにデプロイされ、毎日数百のアプリにわたる数千のスクリーンキャストを分析し、従来のツールが見逃したレグレッションを明らかにした。
これらの結果から,MobileUPRegはモバイルOS検証のための正確かつスケーラブルで,知覚的に整合した回帰検出を可能にすることが示された。
関連論文リスト
- Screencast-Based Analysis of User-Perceived GUI Responsiveness [53.53923672866705]
Toolsはモバイルのスクリーンキャストから直接GUIの応答性を測定するテクニックである。
コンピュータービジョンを使ってユーザーインタラクションを検出し、フレームレベルの視覚変化を分析し、2つの重要なメトリクスを計算する。
ツールはインダストリアルテストパイプラインにデプロイされ、毎日数千のスクリーンキャストを分析している。
論文 参考訳(メタデータ) (2025-08-02T12:13:50Z) - Regression-aware Continual Learning for Android Malware Detection [9.695692033183485]
マルウェアは急速に進化し、機械学習(ML)ベースの検出器を継続的に適応させる。
継続的学習(CL)はスケーラブルな代替手段として登場し、完全なデータアクセスなしにインクリメンタルな更新を可能にする。
しかし、セキュリティレグレッションは、一度正しく検出されたが、モデル更新後の検出を回避したマルウェアサンプルのような、サンプルレベルでの有害な予測変更をキャプチャする。
CLをベースとしたマルウェア検知器のセキュリティレグレッションを形式化し,定量化し,その軽減を目的としたレグレッション・アウェア・ペナルティを提案する。
論文 参考訳(メタデータ) (2025-07-24T11:31:23Z) - What If We Had Used a Different App? Reliable Counterfactual KPI Analysis in Wireless Systems [52.499838151272016]
本稿では、RANによって異なるアプリが実装された場合のトラフィックの値を推定する問題に対処する。
本稿では,無線システムに対する共形予測に基づく対実解析手法を提案する。
論文 参考訳(メタデータ) (2024-09-30T18:47:26Z) - Monitoring and Adapting ML Models on Mobile Devices [17.28565076128893]
ユーザからのフィードバックを必要とせずに、モバイルデバイス上でモデルを継続的に監視し、適応するための、最初のエンドツーエンドシステムを設計する。
私たちのキーとなる観察は、しばしばモデル劣化は特定の根本原因によるもので、大規模なデバイス群に影響を与える可能性があるということです。
2つのコンピュータビジョンデータセット上でシステム評価を行い、既存のアプローチと比較して精度を継続的に向上させることを示す。
論文 参考訳(メタデータ) (2023-05-12T21:33:26Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Using sequential drift detection to test the API economy [4.056434158960926]
APIエコノミーは、API(高度なプログラミングインターフェース)の広範な統合を指す。
使用パターンを監視し、システムがこれまで使用されなかった方法でいつ使用されているかを特定することが望ましい。
この作業では、ヒストグラムとAPI使用のコールグラフの両方を分析し、システムの利用パターンがシフトしたかどうかを判断する。
論文 参考訳(メタデータ) (2021-11-09T13:24:19Z) - Regression Bugs Are In Your Model! Measuring, Reducing and Analyzing
Regressions In NLP Model Updates [68.09049111171862]
この研究は、NLPモデル更新における回帰エラーの定量化、低減、分析に重点を置いている。
回帰フリーモデル更新を制約付き最適化問題に定式化する。
モデルアンサンブルが回帰を減らす方法を実証的に分析します。
論文 参考訳(メタデータ) (2021-05-07T03:33:00Z) - RepPoints V2: Verification Meets Regression for Object Detection [65.120827759348]
本稿ではRepPointsのローカライズ予測に検証タスクを導入する。
RepPoints v2は、オリジナルのRepPointsよりも約2.0mAPの一貫性のある改善を提供する。
提案手法は、インスタンスセグメンテーションのようなアプリケーションと同様に、他のオブジェクト検出フレームワークをより高めることができることを示す。
論文 参考訳(メタデータ) (2020-07-16T17:57:08Z) - Superiority of Simplicity: A Lightweight Model for Network Device
Workload Prediction [58.98112070128482]
本稿では,歴史観測に基づく時系列予測のための軽量な解を提案する。
ニューラルネットワークと平均予測器という2つのモデルからなる異種アンサンブル法で構成されている。
利用可能なFedCSIS 2020チャレンジデータセットの総合的なR2$スコア0.10を達成している。
論文 参考訳(メタデータ) (2020-07-07T15:44:16Z) - Lumos: A Library for Diagnosing Metric Regressions in Web-Scale
Applications [13.52733069152118]
ABテストの原理を用いて構築されたPythonライブラリであるLumosを紹介し、メトリクス回帰を体系的に診断する。
LumosはMicrosoftのリアルタイムコミュニケーションアプリケーションSkypeとMicrosoft Teamsのコンポーネントチーム間でデプロイされている。
これによりエンジニアリングチームは、メトリクスの実際の変更を100回検出し、異常検知器によって検出された1000回の誤報を拒否することが可能になった。
論文 参考訳(メタデータ) (2020-06-23T07:02:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。