論文の概要: Machine Learning to Predict Digital Frustration from Clickstream Data
- arxiv url: http://arxiv.org/abs/2512.20438v1
- Date: Tue, 23 Dec 2025 15:27:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.924717
- Title: Machine Learning to Predict Digital Frustration from Clickstream Data
- Title(参考訳): クリックストリームデータからデジタルフラストレーションを予測する機械学習
- Authors: Jibin Joseph,
- Abstract要約: この研究は、実際のeコマースサイトからのクリックストリームデータを使用して、セッションがフラストレーションを受けたかどうかを予測する。
フラストレーションは、怒りのバースト、前後方向のナビゲーション(Uターン)、カートチャーン、検索闘争、長いさまよるセッションに基づく特定のルールを用いて定義される。
XGBoostの精度は約90%、ROC AUCは0.9579、LSTMは91%、ROC AUCは0.9705である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many businesses depend on their mobile apps and websites, so user frustration while trying to complete a task on these channels can cause lost sales and complaints. In this research, I use clickstream data from a real e-commerce site to predict whether a session is frustrated or not. Frustration is defined using certain rules based on rage bursts, back and forth navigation (U turns), cart churn, search struggle, and long wandering sessions, and applies these rules to 5.4 million raw clickstream events (304,881 sessions). From each session, I build tabular features and train standard classifier models. I also use the full event sequence to train a discriminative LSTM classifier. XGBoost reaches about 90% accuracy, ROC AUC of 0.9579, while the LSTM performs best with about 91% accuracy and a ROC AUC of 0.9705. Finally, the research shows that with only the first 20 to 30 interactions, the LSTM already predicts frustration reliably.
- Abstract(参考訳): 多くの企業はモバイルアプリやWebサイトに依存しているため、これらのチャネルのタスクを完了しようとするユーザーのフラストレーションは、売上と不平を招きかねない。
本研究では、実際のeコマースサイトからのクリックストリームデータを用いて、セッションがフラストレーションを受けたかどうかを予測する。
フラストレーションは、怒りのバースト、前後方向のナビゲーション(Uターン)、カートチャーン、検索闘争、長いさまよったセッションに基づく特定のルールを使用して定義され、これらのルールを540万の生クリックストリームイベント(304,881セッション)に適用する。
各セッションから、私は表のフィーチャを構築し、標準の分類器モデルを訓練します。
また、完全なイベントシーケンスを使用して、差別的なLSTM分類器を訓練します。
XGBoostの精度は約90%、ROC AUCは0.9579、LSTMは91%、ROC AUCは0.9705である。
最後に、LSTMは最初の20から30の相互作用だけで、すでにフラストレーションを確実に予測している。
関連論文リスト
- Temporal Fusion Transformer for Multi-Horizon Probabilistic Forecasting of Weekly Retail Sales [5.023398151088689]
本稿では、TFT(Temporal Fusion Transformer)を用いた毎週のウォルマート販売に関する新しい研究について述べる。
パイプラインはQuantile Lossを通じて1週間から5週間の確率予測を生成する。
固定された2012年のホールトアウトデータセットで、TFTは1店舗当たり57.9k米ドルのRMSEと0.9875ドルのR2ドルを達成している。
論文 参考訳(メタデータ) (2025-11-01T13:34:29Z) - Causal Intervention Sequence Analysis for Fault Tracking in Radio Access Networks [18.99444800453706]
1)根本原因の可能性のある指標を見つけ出し、(2)これらのイベントが展開する正確な順序を明らかにする。
私たちのモデルは、正常な振る舞いを障害に変える因果連鎖を学習します。
モンテカルロのテストでは、正しいトリガーシーケンスを高精度でピンポイントし、速度を失うことなく数百万のデータポイントにスケールする。
論文 参考訳(メタデータ) (2025-10-02T14:34:59Z) - SessionIntentBench: A Multi-task Inter-session Intention-shift Modeling Benchmark for E-commerce Customer Behavior Understanding [64.45047674586671]
本稿では,意図木の概念を導入し,データセットキュレーションパイプラインを提案する。
我々は,L(V)LMsのセッション間意図シフト理解能力を評価するマルチモーダルベンチマークSessionIntentBenchを構築した。
1,952,177の意図的エントリ,1,132,145のセッション意図軌跡,および10,905のセッションを使用してマイニングされた13,003,664のタスクにより,既存のセッションデータを活用可能なスケーラブルな方法を提供する。
論文 参考訳(メタデータ) (2025-07-27T09:04:17Z) - VeriThinker: Learning to Verify Makes Reasoning Model Efficient [52.74493506816969]
大型推論モデルは、Chain-of-Thought (CoT)推論を用いて複雑なタスクで優れている。
過度に考える傾向は、必然的に長い推論連鎖に繋がる。
我々は,CoT圧縮の新しい手法であるVeriThinkerを紹介する。
論文 参考訳(メタデータ) (2025-05-23T14:17:56Z) - Unbiased Learning to Rank Meets Reality: Lessons from Baidu's Large-Scale Search Dataset [48.708591046906896]
Unbiased Learning-to-rank(ULTR)は、ユーザクリックから学習するための確立したフレームワークである。
Baidu-ULTRデータセットで利用可能な実験を再検討し、拡張する。
標準的な非バイアスの学習 to ランク技術は、クリック予測を堅牢に改善するが、ランク付け性能を一貫して改善するのに苦労している。
論文 参考訳(メタデータ) (2024-04-03T08:00:46Z) - Soft Frequency Capping for Improved Ad Click Prediction in Yahoo Gemini
Native [1.9315883475944244]
Yahooのネイティブ広告(Gemini Nativeとも呼ばれる)は毎日何十億もの広告インプレッションを提供しており、年間1億米ドルのランレートに達している。
Offsetは、勾配降下(SGD)ベースのアプローチを使用して、新しいログデータのバッチ毎にモデルを更新するワンパスアルゴリズムである。
ユーザアド機能として周波数特徴をOFFSETモデルに組み込んだソフト周波数キャッピング(SFC)手法を提案し,その重みベクトルはロジスティック回帰により学習する。
論文 参考訳(メタデータ) (2023-12-08T14:12:49Z) - Session-aware Item-combination Recommendation with Transformer Network [22.583356710043066]
ユーザからのフィードバックとアンロックセッションを予測するために、2つの頭を持つトランスフォーマーベースのネットワークを使用します。
カグルにおける最後の私的リーダーボードでは、分類精度0.39224で第2位にランクインした。
論文 参考訳(メタデータ) (2021-11-13T17:20:49Z) - Modern Cybersecurity Solution using Supervised Machine Learning [0.456877715768796]
従来のファイアウォールと侵入検知システムは、設定されたルールにマッチしない新しい攻撃、ゼロデイ攻撃、トラフィックパターンの検出に失敗する。
我々はNetflowデータセットを用いて、データ分析を適用した後に特徴を抽出した。
我々の実験は、機械学習アルゴリズムがBotトラフィック、Malwareトラフィック、バックグラウンドトラフィックをいかに効率的に検出できるかに焦点を当てている。
論文 参考訳(メタデータ) (2021-09-15T22:03:50Z) - TACRED Revisited: A Thorough Evaluation of the TACRED Relation
Extraction Task [80.38130122127882]
TACREDはリレーショナル抽出(RE)において最も大きく、最も広く使われているクラウドソースデータセットの1つである
パフォーマンスの天井に到達したのか、改善の余地はあるのか?
ラベルエラーは絶対F1テストエラーの8%を占めており、例の50%以上を可逆化する必要がある。
論文 参考訳(メタデータ) (2020-04-30T15:07:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。