Fugu-MT 論文翻訳(概要): Optimizing Storage Overhead of User Behavior Log for ML-embedded Mobile Apps

論文の概要: Optimizing Storage Overhead of User Behavior Log for ML-embedded Mobile Apps

arxiv url: http://arxiv.org/abs/2510.13405v1
Date: Wed, 15 Oct 2025 11:03:17 GMT
ステータス: 翻訳完了
システム内更新日: 2025-10-16 20:13:28.6334
Title: Optimizing Storage Overhead of User Behavior Log for ML-embedded Mobile Apps
Title（参考訳）: ML組み込みモバイルアプリにおけるユーザ行動ログのストレージオーバヘッド最適化
Authors: Chen Gong, Yan Zhuang, Zhenzhe Zheng, Yiliu Chen, Sheng Wang, Fan Wu, Guihai Chen,
Abstract要約: マシンラーニング(ML)モデルは、パーソナライズされたインテリジェントなサービスを実現するために、現代モバイルアプリにますます統合されています。 AdaLogはML組み込みモバイルアプリのユーザビヘイビアログのストレージ効率を改善するように設計されている。 AdaLogは、システムのオーバーヘッドを最小限にして、振る舞いログのサイズを19%から44%削減する。
参考スコア（独自算出の注目度）: 49.40237450598784
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Machine learning (ML) models are increasingly integrated into modern mobile apps to enable personalized and intelligent services. These models typically rely on rich input features derived from historical user behaviors to capture user intents. However, as ML-driven services become more prevalent, recording necessary user behavior data imposes substantial storage cost on mobile apps, leading to lower system responsiveness and more app uninstalls. To address this storage bottleneck, we present AdaLog, a lightweight and adaptive system designed to improve the storage efficiency of user behavior log in ML-embedded mobile apps, without compromising model inference accuracy or latency. We identify two key inefficiencies in current industrial practices of user behavior log: (i) redundant logging of overlapping behavior data across different features and models, and (ii) sparse storage caused by storing behaviors with heterogeneous attribute descriptions in a single log file. To solve these issues, AdaLog first formulates the elimination of feature-level redundant data as a maximum weighted matching problem in hypergraphs, and proposes a hierarchical algorithm for efficient on-device deployment. Then, AdaLog employs a virtually hashed attribute design to distribute heterogeneous behaviors into a few log files with physically dense storage. Finally, to ensure scalability to dynamic user behavior patterns, AdaLog designs an incremental update mechanism to minimize the I/O operations needed for adapting outdated behavior log. We implement a prototype of AdaLog and deploy it into popular mobile apps in collaboration with our industry partner. Evaluations on real-world user data show that AdaLog reduces behavior log size by 19% to 44% with minimal system overhead (only 2 seconds latency and 15 MB memory usage), providing a more efficient data foundation for broader adoption of on-device ML.
Abstract（参考訳）: マシンラーニング(ML)モデルは、パーソナライズされたインテリジェントなサービスを実現するために、現代モバイルアプリにますます統合されています。これらのモデルは通常、ユーザの意図を捉えるために、歴史的なユーザの振る舞いから派生した豊富な入力機能に依存します。しかし、ML駆動サービスがより普及するにつれて、必要なユーザ行動データを記録することによって、モバイルアプリにかなりのストレージコストが課されるため、システムの応答性が低下し、アプリのアンインストールが増加します。このストレージボトルネックに対処するために,ML組み込みモバイルアプリにおけるユーザ行動ログのストレージ効率を改善するために設計された,軽量で適応的なシステムであるAdaLogを提案する。ユーザ行動ログの現在の産業実践における2つの重要な非効率性を特定します。一異なる特徴・モデルにまたがる重なり合う行動データの冗長ロギング (II)不均質な属性記述による振舞いを単一のログファイルに格納することによるスパースストレージ。これらの問題を解決するために、AdaLogはまずハイパーグラフにおける最大重み付けマッチング問題として特徴レベルの冗長データの排除を定式化し、デバイス上での効率的な配置のための階層的アルゴリズムを提案する。次に、AdaLogは事実上ハッシュされた属性設計を使用して、不均一な振る舞いを物理的に高密度なストレージを持つ数個のログファイルに分散する。最後に、動的なユーザ動作パターンへのスケーラビリティを確保するため、AdaLogは、古い動作ログの適応に必要なI/O操作を最小限に抑えるために、インクリメンタルな更新メカニズムを設計する。 AdaLogのプロトタイプを実装し、業界パートナと共同で、人気のあるモバイルアプリにデプロイします。実際のユーザデータに対する評価によると、AdaLogはシステムのオーバーヘッドを最小限に抑えながら、振る舞いログのサイズを19%から44%削減し(2秒のレイテンシと15MBのメモリ使用量のみ)、デバイス上でのMLをより広く採用するための、より効率的なデータ基盤を提供する。

関連論文リスト

Improve Large Language Model Systems with User Logs [31.771424321946782]
UNOは、ユーザログで大きな言語モデル(LLM)を改善するためのフレームワークである。ログを半構造化されたルールと好みのペアに抽出し、クエリとフィードバックによるクラスタリングを使用してデータの異質性を管理する。 UNOは最先端の有効性と効率を達成し、検索拡張生成(RAG)とメモリベースラインを大きく上回っている。
論文参考訳（メタデータ） (2026-02-06T07:55:26Z)
Sparse-dLLM: Accelerating Diffusion LLMs with Dynamic Cache Eviction [58.044803442346115]
Diffusion Large Language Models (dLLMs) は推論と並列デコードにおいてブレークスルーを実現するが、推論中に計算の複雑さやメモリオーバーヘッドに悩まされる。 Sparse-dLLMは、動的キャッシュ消去とスパースアテンションを統合した最初のトレーニングフリーフレームワークであり、遅延双方向スパースキャッシングを経由するスパースアテンションである。
論文参考訳（メタデータ） (2025-08-04T16:14:03Z)
Log-Augmented Generation: Scaling Test-Time Reasoning with Reusable Computation [80.69067017594709]
大規模言語モデル(LLM)とそのエージェントモデルは、以前のタスクからの推論を維持するのに苦労する。本稿では,従来の計算を直接再利用し,テスト時に過去のログから推論する新しいフレームワークであるLAGを提案する。本手法は,ログを使用しない標準的なエージェントシステムよりも優れている。
論文参考訳（メタデータ） (2025-05-20T14:14:38Z)
LogParser-LLM: Advancing Efficient Log Parsing with Large Language Models [19.657278472819588]
LLM機能と統合された新しいログであるLog-LLMを紹介する。粒度を解析する複雑な課題に対処し、ユーザが特定のニーズに合わせて粒度を調整できるようにするための新しい指標を提案する。提案手法の有効性は,Loghub-2kと大規模LogPubベンチマークを用いて実験的に検証した。
論文参考訳（メタデータ） (2024-08-25T05:34:24Z)
HELP: Hierarchical Embeddings-based Log Parsing [0.25112747242081457]
ログは、ソフトウェアのメンテナンスと障害診断のための、第一級の情報ソースである。ログ解析は、異常検出、トラブルシューティング、根本原因分析などの自動ログ解析タスクの前提条件である。既存のオンライン解析アルゴリズムは、ログドリフトの影響を受けやすい。
論文参考訳（メタデータ） (2024-08-15T17:54:31Z)
LogFormer: A Pre-train and Tuning Pipeline for Log Anomaly Detection [73.69399219776315]
本稿では,ログ異常検出(LogFormer)のためのTransformerベースの統合フレームワークを提案する。具体的には、ログデータの共有セマンティック知識を得るために、まず、ソースドメイン上で事前学習を行う。そして、そのような知識を共有パラメータを介して対象領域に転送する。
論文参考訳（メタデータ） (2024-01-09T12:55:21Z)
A Large-Scale Evaluation for Log Parsing Techniques: How Far Are We? [42.56249610409624]
実世界のソフトウェアシステムにおけるログデータの特徴をよりよく反映できる,アノテーション付きログデータセットの新たなコレクションであるLoghub-2.0を提供する。我々は、より厳密で実践的な設定で15の最先端ログを徹底的に再評価し、特に、既存のメトリクスの非バランスなデータ分布に対する感度を緩和する新しい評価基準を導入する。
論文参考訳（メタデータ） (2023-08-21T16:24:15Z)
AutoLog: A Log Sequence Synthesis Framework for Anomaly Detection [34.91789047641838]
AutoLogは、異常検出のための最初の自動ログ生成手法である。実際にシステムを実行することなく、実行時のログシーケンスを生成する。人間の知識に基づいて、取得した各実行パスに異常ラベルを伝搬する。
論文参考訳（メタデータ） (2023-08-18T05:56:18Z)
KML: Using Machine Learning to Improve Storage Systems [0.2810625954925814]
機械学習技術はパターンを学習し、それらから一般化し、最適なソリューションを可能にすることを約束する。我々はKMLアーキテクチャのプロトタイプを開発し、最適な読み出しと読み出しサイズという2つの問題に適用する。実験の結果、KMLはOSのリソースをほとんど消費せず、遅延を無視できるだけでなく、I/Oスループットを最大2.3倍または15倍改善できるパターンを学習できることがわかった。
論文参考訳（メタデータ） (2021-11-22T21:59:50Z)
Robust and Transferable Anomaly Detection in Log Data using Pre-Trained Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文参考訳（メタデータ） (2021-02-23T09:17:05Z)
Self-Attentive Classification-Based Anomaly Detection in Unstructured Logs [59.04636530383049]
ログ表現を学習するための分類法であるLogsyを提案する。従来の方法と比較して,F1スコアの平均0.25の改善を示す。
論文参考訳（メタデータ） (2020-08-21T07:26:55Z)
Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。既存のアプローチは、ログ特化や手動ルール抽出に依存している。本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文参考訳（メタデータ） (2020-03-17T19:25:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。