論文の概要: Predictive modeling and anomaly detection in large-scale web portals through the CAWAL framework
- arxiv url: http://arxiv.org/abs/2502.00413v1
- Date: Sat, 01 Feb 2025 12:21:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 15:00:03.880371
- Title: Predictive modeling and anomaly detection in large-scale web portals through the CAWAL framework
- Title(参考訳): CAWALフレームワークによる大規模Webポータルの予測モデリングと異常検出
- Authors: Ozkan Canay, Umit Kocabicak,
- Abstract要約: 本研究では,CAWALフレームワークを通じて収集されたセッションおよびページビューデータを用いて,高度な予測モデリングとWeb利用マイニングアプリケーションにおける異常検出を行う手法を提案する。
その結果,ユーザの行動やシステムパフォーマンスの指標を詳細に把握し,大規模Webポータルの効率性,信頼性,スケーラビリティを向上させるための信頼性の高いソリューションであることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This study presents an approach that uses session and page view data collected through the CAWAL framework, enriched through specialized processes, for advanced predictive modeling and anomaly detection in web usage mining (WUM) applications. Traditional WUM methods often rely on web server logs, which limit data diversity and quality. Integrating application logs with web analytics, the CAWAL framework creates comprehensive session and page view datasets, providing a more detailed view of user interactions and effectively addressing these limitations. This integration enhances data diversity and quality while eliminating the preprocessing stage required in conventional WUM, leading to greater process efficiency. The enriched datasets, created by cross-integrating session and page view data, were applied to advanced machine learning models, such as Gradient Boosting and Random Forest, which are known for their effectiveness in capturing complex patterns and modeling non-linear relationships. These models achieved over 92% accuracy in predicting user behavior and significantly improved anomaly detection capabilities. The results show that this approach offers detailed insights into user behavior and system performance metrics, making it a reliable solution for improving large-scale web portals' efficiency, reliability, and scalability.
- Abstract(参考訳): 本研究では、Web 利用マイニング(WUM)アプリケーションにおける高度な予測モデリングと異常検出のために、CAWAL フレームワークを通じて収集されたセッションおよびページビューデータを用いて、特殊なプロセスによって強化されたアプローチを提案する。
従来のWUMメソッドは、データの多様性と品質を制限するWebサーバログに依存することが多い。
アプリケーションログとWeb分析を統合することで、CAWALフレームワークは、包括的なセッションとページビューデータセットを生成し、ユーザインタラクションのより詳細なビューを提供し、これらの制限に効果的に対処する。
この統合により、データ多様性と品質が向上し、従来のWUMで必要とされる前処理段階が不要になり、プロセス効率が向上する。
セッションデータとページビューデータを相互統合して作成した強化データセットは、複雑なパターンをキャプチャし、非線形関係をモデル化する効果で知られているGradient BoostingやRandom Forestといった先進的な機械学習モデルに適用された。
これらのモデルでは、ユーザの振る舞いを予測する精度が92%以上向上し、異常検出能力が大幅に向上した。
その結果,ユーザの行動やシステムパフォーマンスの指標を詳細に把握し,大規模Webポータルの効率性,信頼性,スケーラビリティを向上させるための信頼性の高いソリューションであることが示唆された。
関連論文リスト
- A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Data-Juicer Sandbox: A Comprehensive Suite for Multimodal Data-Model Co-development [67.55944651679864]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは包括的な実験プラットフォームを提供し、データとモデルの両方の迅速なイテレーションと洞察駆動による改善を可能にする。
また、徹底的なベンチマークから得られた実りある洞察を明らかにし、データ品質、多様性、モデル行動の間の重要な相互作用に光を当てています。
論文 参考訳(メタデータ) (2024-07-16T14:40:07Z) - AttributionScanner: A Visual Analytics System for Model Validation with Metadata-Free Slice Finding [29.07617945233152]
データスライス検索は、低パフォーマンスを示すデータセット内のサブグループを特定し解析することで、機械学習(ML)モデルを検証するための新興技術である。
このアプローチは、追加メタデータに対する退屈でコストのかかる要件を含む、重大な課題に直面します。
本稿では,メタデータを含まないデータスライス検索用に設計された,革新的なビジュアルアナリティクス(VA)システムであるAttributionScannerを紹介する。
本システムでは、一般的なモデル動作を含む解釈可能なデータスライスを特定し、属性モザイク設計によりこれらのパターンを可視化する。
論文 参考訳(メタデータ) (2024-01-12T09:17:32Z) - Surface EMG-Based Inter-Session/Inter-Subject Gesture Recognition by
Leveraging Lightweight All-ConvNet and Transfer Learning [17.535392299244066]
低解像度の瞬時HD-sEMG画像を用いたジェスチャー認識は、より流動的で自然な筋肉-コンピュータインターフェースを開発するための新たな道を開く。
セッション間とオブジェクト間シナリオ間のデータのばらつきは、大きな課題を示します。
既存のアプローチでは、非常に大きく複雑なConvNetまたは2SRNNベースのドメイン適応手法を使用して、これらのセッション間およびオブジェクト間データのばらつきに起因する分散シフトを近似した。
我々は、軽量なAll-ConvNetとTransfer Learning(TL)を利用した、セッション間およびオブジェクト間ジェスチャー認識の強化のための軽量All-ConvNet+TLモデルを提案する。
論文 参考訳(メタデータ) (2023-05-13T21:47:55Z) - A Graph-Enhanced Click Model for Web Search [67.27218481132185]
ウェブ検索のための新しいグラフ強調クリックモデル(GraphCM)を提案する。
セッション内情報とセッション間情報の両方を、スパーシリティ問題とコールドスタート問題に活用する。
論文 参考訳(メタデータ) (2022-06-17T08:32:43Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Preference Enhanced Social Influence Modeling for Network-Aware Cascade
Prediction [59.221668173521884]
本稿では,ユーザの嗜好モデルを強化することで,カスケードサイズ予測を促進する新しいフレームワークを提案する。
エンド・ツー・エンドの手法により,ユーザの情報拡散プロセスがより適応的で正確になる。
論文 参考訳(メタデータ) (2022-04-18T09:25:06Z) - A Visual Analytics Approach to Building Logistic Regression Models and
its Application to Health Records [0.0]
本研究では,高次元データセットにおける回帰モデルの生成,評価,適用のためのオープンな統一手法を提案する。
このアプローチは、属性に対する広い相関パノラマを公開することに基づいており、ユーザーは関連する属性を選択して予測モデルを構築して評価することができる。
我々は、コビッド19やその他の人工的および実際の健康記録データの解析に、我々のフレームワークを応用して、UCRegの有効性と効率を実証する。
論文 参考訳(メタデータ) (2022-01-20T19:53:41Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Improving the Performance of Fine-Grain Image Classifiers via Generative
Data Augmentation [0.5161531917413706]
我々は、ロバスト生成アドリアルネットワーク(DAPPER GAN)の熟練した事前学習からデータ拡張を開発する。
DAPPER GANは、トレーニングイメージの新しいビューを自動的に生成するML分析支援ツールである。
本手法をStanford Carsデータセット上で実験的に評価し,車体形状とモデル分類精度の向上を実証した。
論文 参考訳(メタデータ) (2020-08-12T15:29:11Z) - A Neural Architecture for Detecting Confusion in Eye-tracking Data [1.8655840060559168]
我々は、RNNとCNNのサブモデルを並列に使用して、データの時間的・空間的側面を活用するアーキテクチャを提案する。
本モデルでは,Random Forestsをベースとした既存モデルよりも22%の感度・特異性が向上した。
論文 参考訳(メタデータ) (2020-03-13T18:20:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。