論文の概要: Comparing Two Different Approaches in Big Data and Business Analysis for
Churn Prediction with the Focus on How Apache Spark Employed
- arxiv url: http://arxiv.org/abs/2105.15147v1
- Date: Fri, 28 May 2021 12:19:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-01 17:02:10.610680
- Title: Comparing Two Different Approaches in Big Data and Business Analysis for
Churn Prediction with the Focus on How Apache Spark Employed
- Title(参考訳): ビッグデータとビジネス分析における2つのアプローチの比較とApache Sparkの活用方法を中心に
- Authors: Mohammad Sina Kiarostami
- Abstract要約: ビッグデータにおけるビジネス分析のトピックに採用された2つの異なるアプローチを比較し、議論する。
企業にとって、チャーン予測は、顧客がサービスの使用をやめるか、または停止するつもりであることを認識するための、ビジネス分析において不可欠なトピックである。
ここでは、ここ数年で大量のデータを効率的に処理するためのソリューションがいくつか提供されて以来、Apache Sparkに重点を置いています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Due to the significant importance of Big Data analysis, especially in
business-related topics such as improving services, finding potential
customers, and selecting practical approaches to manage income and expenses,
many companies attempt to collaborate with scientists to find how, why, and
what they should analysis. In this work, we would like to compare and discuss
two different approaches that employed in business analysis topic in Big Data
with more consideration on how they utilized Spark. Both studies have
investigated Churn Prediction as their case study for their proposed approaches
since it is an essential topic in business analysis for companies to recognize
a customer intends to leave or stop using their services. Here, we focus on
Apache Spark since it has provided several solutions to handle a massive amount
of data in recent years efficiently. This feature in Spark makes it one of the
most robust candidate tools to upfront with a Big Data problem, particularly
time and resource are concerns.
- Abstract(参考訳): ビッグデータ分析の重要さ、特にサービスの改善、潜在的な顧客の発見、収益と費用を管理するための実践的なアプローチの選択など、ビジネス関連のトピックにおいて、多くの企業が科学者と協力し、分析の方法、理由、そして何を見つけ出そうと試みている。
本研究では、ビッグデータにおけるビジネス分析のトピックに採用されている2つの異なるアプローチを比較し、議論し、Sparkの利用方法についてより深く検討する。
どちらの研究もcharnの予測をケーススタディとして検討しており、ビジネス分析において顧客がサービスの利用をやめる意図を認識すべき重要なトピックであるためである。
近年,大量のデータを効率的に処理するためのソリューションがいくつか提供されているので,ここではApache Sparkに注目します。
sparkのこの機能により、ビッグデータ問題、特に時間とリソースの懸念に対処できる、最も堅牢な候補ツールの1つがsparkだ。
関連論文リスト
- InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation [79.09622602860703]
3つの重要な特徴を持つベンチマークデータセットであるInsightBenchを紹介します。
財務やインシデント管理といったさまざまなビジネスユースケースを表す100のデータセットで構成されている。
単一のクエリに回答することに焦点を当てた既存のベンチマークとは異なり、InsightBenchは、エンドツーエンドのデータ分析を実行する能力に基づいてエージェントを評価する。
論文 参考訳(メタデータ) (2024-07-08T22:06:09Z) - A Dataset for the Validation of Truth Inference Algorithms Suitable for Online Deployment [76.04306818209753]
実世界のクラウドソーシングプラットフォームから収集した,実質的なクラウドソーシングアノテーションデータセットを紹介する。
このデータセットは、約2万のワーカー、100万のタスク、600万のアノテーションで構成されている。
本データセットにおけるいくつかの代表的真理推論アルゴリズムの有効性を評価する。
論文 参考訳(メタデータ) (2024-03-10T16:00:41Z) - A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - Capture the Flag: Uncovering Data Insights with Large Language Models [90.47038584812925]
本研究では,Large Language Models (LLMs) を用いてデータの洞察の発見を自動化する可能性について検討する。
そこで本稿では,データセット内の意味的かつ関連する情報(フラグ)を識別する能力を測定するために,フラグを捕捉する原理に基づく新しい評価手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T14:20:06Z) - Collaborative business intelligence virtual assistant [1.9953434933575993]
本研究では、ユーザとCBI仮想アシスタントのインタラクションを通じて、分散仮想チームにおけるデータマイニングの応用に焦点を当てる。
CBIのための仮想アシスタントは、より広い範囲のユーザのためのデータ探索アクセシビリティを強化し、データ分析に必要な時間と労力を合理化するためのものである。
論文 参考訳(メタデータ) (2023-12-20T05:34:12Z) - Demonstration of InsightPilot: An LLM-Empowered Automated Data
Exploration System [48.62158108517576]
本稿では,データ探索プロセスの簡略化を目的とした自動データ探索システムであるInsightPilotを紹介する。
InsightPilotは、理解、要約、説明などの適切な分析意図を自動的に選択する。
簡単に言うと、IQueryはデータ分析操作の抽象化と自動化であり、データアナリストのアプローチを模倣しています。
論文 参考訳(メタデータ) (2023-04-02T07:27:49Z) - Benchmarking Apache Spark and Hadoop MapReduce on Big Data
Classification [3.42658286826597]
我々は、Apache SparkとHadoop MapReduceという2つの広く使われているビッグデータ分析ツールの共通データマイニングタスク、すなわち分類に関するベンチマークを提示する。
我々は、SparkがモデルのトレーニングにおいてMapReduceよりも5倍高速であることを示した。しかしながら、Sparkのパフォーマンスは、入力ワークロードが大きくなると低下する。
論文 参考訳(メタデータ) (2022-09-21T20:08:37Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - "If we didn't solve small data in the past, how can we solve Big Data
today?" [0.0]
私たちは、"小さい"データや"大きい"データといった用語を調査し、それらの属性を理解し、価値を付加する方法について検討することを目指しています。
この研究によると、どんなに小さなデータが使われたにせよ、企業は依然として正しい技術とビジネスビジョンでビッグデータを活用できる。
論文 参考訳(メタデータ) (2021-11-08T16:31:01Z) - Augmenting Decision Making via Interactive What-If Analysis [4.920817773181235]
現在、ビジネスユーザーは長期にわたる探索分析を行う必要がある。
データセットの複雑さの増大と人間の認知的限界が組み合わさって、複数の仮説を乗り越えることが困難になる。
ここでは、ビジネスユーザがデータ属性の集合間の関係(機能)について対話的に学び、推論できるために必要な4つの機能について論じます。
論文 参考訳(メタデータ) (2021-09-13T17:54:30Z) - Predictive analytics using Social Big Data and machine learning [6.142272540492935]
この章では、ソーシャルビッグデータ分析の基礎となる中核的な側面について光を当てている。
さまざまな予測分析アルゴリズムが,いくつかの重要なアプリケーションやトップレベルのツールやAPIで使用されている。
論文 参考訳(メタデータ) (2021-04-21T19:30:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。