論文の概要: STAP: A Shuffle-Tokenized App Predictor with Ultra Long Context for Vocabulary-Free Mobile App Prediction
- arxiv url: http://arxiv.org/abs/2605.29863v1
- Date: Thu, 28 May 2026 12:44:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.249023
- Title: STAP: A Shuffle-Tokenized App Predictor with Ultra Long Context for Vocabulary-Free Mobile App Prediction
- Title(参考訳): STAP: 語彙のないモバイルアプリ予測のための超長いコンテキストを持つシャッフル対応アプリ予測器
- Authors: Chengyu Fan, Hang Liu,
- Abstract要約: 既存のモデルは固定アプリ語彙に依存しており、異なるアプリエコシステムをまたがる一般化を防いでいる。
固定語彙を必要としないトランスフォーマーモデルSTAPを提案する。
異なる大陸の2つのデータセットに対する実験により、STAPは強いクロスデータセットゼロショット予測精度を達成することが示された。
- 参考スコア(独自算出の注目度): 3.5809657956404135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting the next mobile application a user will launch is essential for intelligent device resource management and proactive assistance. Existing models rely on fixed app vocabularies, which prevents them from generalizing across different app ecosystems. Many also depend on user-specific knowledge, which complicates deployment in cold start scenarios. We propose STAP, a Transformer-based model that eliminates the need for a fixed vocabulary. STAP replaces true app identities with randomly reassigned virtual indices via a shuffle mechanism, and compensates for discarded semantic information by processing behavioral sequences with an ultra-long context design. A theoretical analysis shows that, given a sufficiently long context, the predicted distribution converges to the correct one despite the anonymity of the mapping. Experiments on two datasets from different continents demonstrate that STAP achieves strong cross-dataset zero-shot prediction accuracy -- a setting where all existing fixed-vocabulary methods are inherently inapplicable -- while its cold start performance within each dataset remains competitive with leading models. Furthermore, we introduce a deployment strategy that enables the model to retain a sufficiently long context during continuous inference while keeping latency within acceptable bounds.
- Abstract(参考訳): ユーザが起動する次のモバイルアプリケーションを予測することは、インテリジェントなデバイスリソース管理と積極的な支援に不可欠である。
既存のモデルは固定アプリ語彙に依存しており、異なるアプリエコシステムをまたがる一般化を防いでいる。
その多くは、コールドスタートシナリオでのデプロイメントを複雑にする、ユーザ固有の知識にも依存しています。
固定語彙を必要としないトランスフォーマーモデルSTAPを提案する。
STAPはシャッフル機構を介して、真のアプリケーションIDをランダムに再割り当てされた仮想インデックスに置き換え、超長期のコンテキスト設計で動作シーケンスを処理することで、破棄されたセマンティック情報を補償する。
理論解析により、十分に長い文脈で予測された分布は、写像の匿名性にもかかわらず正しい分布に収束することを示した。
異なる大陸の2つのデータセットに関する実験は、STAPが強力なクロスデータセットゼロショット予測精度(既存のすべての固定語彙メソッドが本質的に適用不可能な設定)を達成することを示した。
さらに,モデルが許容範囲内で遅延を保ちながら,連続推論中に十分に長いコンテキストを保たせるように配置戦略を導入する。
関連論文リスト
- TapSampling: Inference-Time Sampling with a Task-Progress-Understanding Verifier for Robotic Manipulation [61.35569005726248]
既存の具体的制御研究は、トレーニングデータとモデルサイズをスケールすることで、顕著なパフォーマンス向上を示す。
拡散や自己回帰モデルのような非決定論的生成モデルは、エンボディドコントロールの分野で広く採用されている。
推測時間サンプリングのためのプラグイン・アンド・プレイフレームワークである textbfTapSampling を提案する。
論文 参考訳(メタデータ) (2026-05-25T08:03:31Z) - OVI-MAP:Open-Vocabulary Instance-Semantic Mapping [108.66131262110095]
OVI-MAPは、RGB-D入力から漸進的に構築される、クラスに依存しない3Dインスタンスマップである。
意味的特徴は、視覚言語モデルを用いて、選択された少数のビューからのみ抽出される。
我々のシステムはリアルタイムに動作し、標準ベンチマークで最先端のオープン語彙マッピングのベースラインを上回ります。
論文 参考訳(メタデータ) (2026-03-27T15:50:59Z) - MISApp: Multi-Hop Intent-Aware Session Graph Learning for Next App Prediction [4.997426047348826]
マルチホップセッショングラフ学習に基づく次世代アプリ予測のためのプロファイルフリーフレームワークMISAppを提案する。
MISAppは、異なる構造範囲で遷移依存をキャプチャするために、マルチホップセッショングラフを構築する。
実験によると、MISAppは標準設定とコールドスタート設定の両方で競争ベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-03-23T07:30:45Z) - Matching Features, Not Tokens: Energy-Based Fine-Tuning of Language Models [102.20309135516186]
クロスエントロピー(CE)トレーニングは、言語モデルの密集したスケーラブルな監視を提供する。
言語モデル微調整のための特徴マッチング手法を提案する。
この目的を効率的に最適化するために,エネルギーベースファインチューニングを提案する。
論文 参考訳(メタデータ) (2026-03-12T17:57:50Z) - FitPro: A Zero-Shot Framework for Interactive Text-based Pedestrian Retrieval in Open World [13.089848592467675]
テキストベースのPedestrian Retrieval (TPR)は、自然言語の記述に従って視覚的なシーンで特定の歩行者を検索する。
セマンティック理解とクロスシーン適応性を強化したオープンワールド対話型ゼロショットTPRフレームワークFitProを提案する。
論文 参考訳(メタデータ) (2025-09-20T12:55:18Z) - PATFinger: Prompt-Adapted Transferable Fingerprinting against Unauthorized Multimodal Dataset Usage [19.031839603738057]
マルチモーダルデータセットは、クロスモーダルセマンティクスを提供することで、事前訓練されたビジョン適応モデルに活用することができる。
本稿では,PATFingerと呼ばれる新しいプロンプト言語変換可能なフィンガープリント手法を提案する。
提案手法では,モデルにトリガを学習させる代わりに,固有データセット属性を指紋として利用する。
論文 参考訳(メタデータ) (2025-04-15T09:53:02Z) - TGT: A Temporal Gating Transformer for Smartphone App Usage Prediction [8.738528109590863]
本研究では,時間帯に隠蔽表現を条件付ける時間的ゲーティングモジュールを備えたTransformerフレームワークを提案する。
TGTは15の競争ベースラインをはるかに上回り、HR@1で顕著な利益を上げ、コールドスタートシナリオ下で堅牢性を維持する。
論文 参考訳(メタデータ) (2025-02-24T08:31:51Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - STOP: A dataset for Spoken Task Oriented Semantic Parsing [66.14615249745448]
エンドツーエンド音声言語理解(SLU)は単一モデルを用いて音声から直接意図を予測する。
Spoken Task-Oriented semantic Parsing (STOP) データセットをリリースします。
人間が録音した音声に加えて、我々はTS生成バージョンをリリースし、エンド・ツー・エンドのSLUシステムの低リソース領域適応の性能をベンチマークする。
論文 参考訳(メタデータ) (2022-06-29T00:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。