論文の概要: Leveraging XP and CRISP-DM for Agile Data Science Projects
- arxiv url: http://arxiv.org/abs/2505.21603v1
- Date: Tue, 27 May 2025 17:16:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.205778
- Title: Leveraging XP and CRISP-DM for Agile Data Science Projects
- Title(参考訳): アジャイルデータサイエンスプロジェクトにおけるXPとCRISP-DMの活用
- Authors: Andre Massahiro Shimaoka, Renato Cordeiro Ferreira, Alfredo Goldman,
- Abstract要約: 本研究では、アジャイルデータサイエンスプロジェクトにおけるeXtreme Programming(XP)とCRISP-DM(Cross-Industry Standard Process for Data Mining)の統合について検討する。
データサイエンスプロジェクトにおいて、XPメソッドの俊敏性はCRISP-DMとどのように統合できるのか?
- 参考スコア(独自算出の注目度): 2.1984302611206537
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study explores the integration of eXtreme Programming (XP) and the Cross-Industry Standard Process for Data Mining (CRISP-DM) in agile Data Science projects. We conducted a case study at the e-commerce company Elo7 to answer the research question: How can the agility of the XP method be integrated with CRISP-DM in Data Science projects? Data was collected through interviews and questionnaires with a Data Science team consisting of data scientists, ML engineers, and data product managers. The results show that 86% of the team frequently or always applies CRISP-DM, while 71% adopt XP practices in their projects. Furthermore, the study demonstrates that it is possible to combine CRISP-DM with XP in Data Science projects, providing a structured and collaborative approach. Finally, the study generated improvement recommendations for the company.
- Abstract(参考訳): 本研究では、アジャイルデータサイエンスプロジェクトにおけるeXtreme Programming(XP)とCRISP-DM(Cross-Industry Standard Process for Data Mining)の統合について検討する。
データサイエンスプロジェクトにおいて、XPメソッドの俊敏性はCRISP-DMとどのように統合できるのか?
データサイエンティスト、MLエンジニア、データプロダクトマネージャで構成されるデータサイエンスチームとのインタビューやアンケートを通じて、データは収集された。
その結果、チームの86%が頻繁に、あるいは常にCRISP-DMを適用しており、71%がプロジェクトにおいてXPのプラクティスを採用しています。
さらに,データサイエンスプロジェクトにおいてCRISP-DMとXPを組み合わせることで,構造化された協調的なアプローチが可能であることを示す。
最後に、この研究は会社の改善勧告を生み出した。
関連論文リスト
- The Human Labour of Data Work: Capturing Cultural Diversity through World Wide Dishes [3.770155074442168]
本稿では、コミュニティメンバーが研究プロセスの設計を指導し、クラウドソースされたデータセットに貢献する参加型データセット作成の例を示す。
このアプローチは,コミュニティからの分散型コントリビューションを支援する,キュレートされた高品質なデータをもたらす可能性があることを示す。
我々は,参加型データセット構築に不可欠な参加型仲介者による労働の3次元を探索する。
論文 参考訳(メタデータ) (2025-02-09T17:09:46Z) - DSBench: How Far Are Data Science Agents from Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。
2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。
タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-06T00:40:53Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - Integration of Domain Expert-Centric Ontology Design into the CRISP-DM for Cyber-Physical Production Systems [45.05372822216111]
機械学習(ML)とデータマイニング(DM)の手法は、収集されたデータから複雑で隠れたパターンを抽出する上で有望であることが証明されている。
しかし、このようなデータ駆動プロジェクトは、通常、CRISPDM(Cross-Industry Standard Process for Data Mining)で実行され、データの理解と準備に要する時間の不均等さのために失敗することが多い。
このコントリビューションは、データサイエンティストがCPPSの課題に対してより迅速かつ確実に洞察を得ることができるように、統合されたアプローチを提供することを目的としている。
論文 参考訳(メタデータ) (2023-07-21T15:04:00Z) - TAPS Responsibility Matrix: A tool for responsible data science by
design [2.2973034509761816]
データサイエンスプロジェクトの社会的、法的、倫理的側面を探求する枠組みとして、透明性、説明責任、プライバシー、社会責任マトリックス(TAPS-RM)について述べる。
TAPS-RMの開発モデルと、オープンデータのためのよく知られたイニシアチブをマッピングする。
TAPS-RMはデータサイエンスプロジェクトレベルでの責任を反映するツールであり、設計による責任あるデータサイエンスの推進に利用することができると結論付けている。
論文 参考訳(メタデータ) (2023-02-02T12:09:14Z) - A survey study of success factors in data science projects [0.0]
アジャイルデータサイエンスのライフサイクルは最も広く使われているフレームワークであるが、調査参加者の25%だけがデータサイエンスプロジェクトの方法論に従うと答えている。
プロジェクト方法論に従うプロフェッショナルは、プロジェクトの潜在的なリスクと落とし穴に重点を置いています。
論文 参考訳(メタデータ) (2022-01-17T09:50:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。