論文の概要: Optimizing Feature Extraction for On-device Model Inference with User Behavior Sequences
- arxiv url: http://arxiv.org/abs/2603.21508v1
- Date: Mon, 23 Mar 2026 02:53:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.455099
- Title: Optimizing Feature Extraction for On-device Model Inference with User Behavior Sequences
- Title(参考訳): ユーザ行動系列を用いたオンデバイスモデル推論のための特徴抽出の最適化
- Authors: Chen Gong, Zhenzhe Zheng, Yiliu Chen, Sheng Wang, Fan Wu, Guihai Chen,
- Abstract要約: AutoFeatureは、モデル推論の精度を損なうことなくデバイス上の機能抽出を高速化するように設計された自動機能抽出エンジンである。
オンライン評価では、AutoFeatureは、昼時間に1.33x-3.93x、夜間に1.43x-4.53xのエンド・ツー・エンド・デバイス・モデルの実行遅延を削減している。
- 参考スコア(独自算出の注目度): 41.87849354025844
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine learning models are widely integrated into modern mobile apps to analyze user behaviors and deliver personalized services. Ensuring low-latency on-device model execution is critical for maintaining high-quality user experiences. While prior research has primarily focused on accelerating model inference with given input features, we identify an overlooked bottleneck in real-world on-device model execution pipelines: extracting input features from raw application logs. In this work, we explore a new direction of feature extraction optimization by analyzing and eliminating redundant extraction operations across different model features and consecutive model inferences. We then introduce AutoFeature, an automated feature extraction engine designed to accelerate on-device feature extraction process without compromising model inference accuracy. AutoFeature comprises three core designs: (1) graph abstraction to formulate the extraction workflows of different input features as one directed acyclic graph, (2) graph optimization to identify and fuse redundant operation nodes across different features within the graph; (3) efficient caching to minimize operations on overlapping raw data between consecutive model inferences. We implement a system prototype of AutoFeature and integrate it into five industrial mobile services spanning search, video and e-commerce domains. Online evaluations show that AutoFeature reduces end-to-end on-device model execution latency by 1.33x-3.93x during daytime and 1.43x-4.53x at night.
- Abstract(参考訳): 機械学習モデルは、ユーザの振る舞いを分析し、パーソナライズされたサービスを提供するために、モダンなモバイルアプリに広く統合されている。
低レイテンシのオンデバイスモデル実行を保証することは、高品質なユーザエクスペリエンスを維持する上で非常に重要です。
これまでの研究は、与えられた入力機能によるモデル推論の高速化に重点を置いてきたが、実際のオンデバイスモデル実行パイプラインで見落とされたボトルネックを特定し、生のアプリケーションログから入力機能を抽出した。
本研究では,異なるモデル特徴量および連続モデル推論における冗長な抽出操作を解析・除去することで,特徴抽出最適化の新しい方向性を探求する。
次に、モデル推論の精度を損なうことなくデバイス上の特徴抽出プロセスを高速化する自動特徴抽出エンジンであるAutoFeatureを紹介する。
AutoFeatureは、(1) 異なる入力特徴の抽出ワークフローを1つの有向非巡回グラフとして定式化するグラフ抽象化、(2) グラフ内の異なる特徴をまたいで冗長な操作ノードを識別・融合するグラフ最適化、(3) 連続するモデル推論間の生データの重なり合う操作を最小化する効率的なキャッシュ、の3つのコア設計から構成される。
我々はAutoFeatureのシステムのプロトタイプを実装し、検索、ビデオ、eコマースドメインにまたがる5つの産業モバイルサービスに統合する。
オンライン評価では、AutoFeatureは、昼時間に1.33x-3.93x、夜間に1.43x-4.53xのエンド・ツー・エンド・デバイス・モデルの実行遅延を削減している。
関連論文リスト
- ShuffleGate: An Efficient and Self-Polarizing Feature Selection Method for Large-Scale Deep Models in Industry [12.690406065558394]
ShuffleGateはインスタンス間ですべての機能を同時にシャッフルする。
モデルを再トレーニングすることなく、適切に分離された重要なスコアを生成し、パフォーマンスを見積もることができます。
様々なシナリオで、Bilibiliの検索モデルの日々のイテレーションにうまく統合されています。
論文 参考訳(メタデータ) (2025-03-12T12:05:03Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - A Generative Approach for Production-Aware Industrial Network Traffic
Modeling [70.46446906513677]
ドイツにあるTrumpf工場に配備されたレーザー切断機から発生するネットワークトラフィックデータについて検討した。
我々は、トラフィック統計を分析し、マシンの内部状態間の依存関係をキャプチャし、ネットワークトラフィックを生産状態依存プロセスとしてモデル化する。
可変オートエンコーダ(VAE)、条件付き可変オートエンコーダ(CVAE)、生成逆ネットワーク(GAN)など、様々な生成モデルの性能の比較を行った。
論文 参考訳(メタデータ) (2022-11-11T09:46:58Z) - A High-Performance Customer Churn Prediction System based on
Self-Attention [9.83578821760002]
本研究は,商業銀行顧客に関する公開データセットの実験を行う。
本稿では,自己注意強化型ニューラルネットワーク(HNNSAE)を提案する。
論文 参考訳(メタデータ) (2022-06-03T12:16:24Z) - Multimodal End-to-End Sparse Model for Emotion Recognition [40.71488291980002]
2つのフェーズを繋ぐ完全エンドツーエンドのモデルを開発し、それらを共同で最適化します。
また、エンドツーエンドのトレーニングを可能にするために、現在のデータセットを再構成します。
実験結果から,我々の完全エンドツーエンドモデルは現在の最先端モデルを大きく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2021-03-17T14:05:05Z) - SA-Det3D: Self-Attention Based Context-Aware 3D Object Detection [9.924083358178239]
本稿では,3次元物体検出におけるコンテキストモデリングのための2種類の自己注意法を提案する。
まず,現状のbev,voxel,ポイントベース検出器にペアワイズ自着機構を組み込む。
次に,ランダムにサンプリングされた位置の変形を学習することにより,最も代表的な特徴のサブセットをサンプリングするセルフアテンション変種を提案する。
論文 参考訳(メタデータ) (2021-01-07T18:30:32Z) - AutoFIS: Automatic Feature Interaction Selection in Factorization Models
for Click-Through Rate Prediction [75.16836697734995]
自動特徴相互作用選択(AutoFIS)と呼ばれる2段階のアルゴリズムを提案する。
AutoFISは、目標モデルを収束させるためにトレーニングするのと同等の計算コストで、因子化モデルに対する重要な特徴的相互作用を自動的に識別することができる。
AutoFISはHuawei App Storeレコメンデーションサービスのトレーニングプラットフォームにデプロイされている。
論文 参考訳(メタデータ) (2020-03-25T06:53:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。