論文の概要: Why Data Science Projects Fail
- arxiv url: http://arxiv.org/abs/2308.04896v1
- Date: Tue, 8 Aug 2023 06:45:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-10 13:52:08.869562
- Title: Why Data Science Projects Fail
- Title(参考訳): データサイエンスプロジェクトが失敗する理由
- Authors: Balaram Panda (The University of Auckland)
- Abstract要約: Data Scienceは多くのビジネスの中核であり、企業がより効率的にビジネスの課題に対処するスマートな戦略を構築するのを助ける。
データサイエンスの実践は、アルゴリズムを使ってビジネスプロセスを自動化するのにも役立ちます。
データサイエンスに関しては、主に3つの重要な要素がデータサイエンスプロジェクトの効果的な成果に影響を及ぼす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data Science is a modern Data Intelligence practice, which is the core of
many businesses and helps businesses build smart strategies around to deal with
businesses challenges more efficiently. Data Science practice also helps in
automating business processes using the algorithm, and it has several other
benefits, which also deliver in a non-profitable framework. In regards to data
science, three key components primarily influence the effective outcome of a
data science project. Those are 1.Availability of Data 2.Algorithm 3.Processing
power or infrastructure
- Abstract(参考訳): データサイエンスは現代のデータインテリジェンスの実践であり、多くのビジネスの中核であり、ビジネスの課題をより効率的に扱うためのスマートな戦略を構築するのに役立ちます。
データサイエンスの実践は、このアルゴリズムを使ってビジネスプロセスを自動化するのにも役立ちます。
データサイエンスに関しては、主に3つの重要な要素がデータサイエンスプロジェクトの効果的な成果に影響を及ぼす。
データの利用可能性 2.Algorithm 3.技術力やインフラ
関連論文リスト
- DSBench: How Far Are Data Science Agents to Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - Dataset Growth [59.68869191071907]
InfoGrowthは、データのクリーニングとセレクションのための効率的なオンラインアルゴリズムである。
シングルモーダルタスクとマルチモーダルタスクの両方において、データ品質/効率を改善することができる。
論文 参考訳(メタデータ) (2024-05-28T16:43:57Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - A Vision for Semantically Enriched Data Science [19.604667287258724]
ドメイン知識の活用やデータセマンティクスといった重要な分野は、ほとんど自動化されていない分野です。
データサイエンスの自動化のための新しいツールと組み合わせて、データに対する“セマンティック”な理解と推論を活用することが、一貫性と説明可能なデータ拡張と変換にどのように役立つか、私たちは考えています。
論文 参考訳(メタデータ) (2023-03-02T16:03:12Z) - Towards Robust Dataset Learning [90.2590325441068]
本稿では,頑健なデータセット学習問題を定式化するための三段階最適化法を提案する。
ロバストな特徴と非ロバストな特徴を特徴付ける抽象モデルの下で,提案手法はロバストなデータセットを確実に学習する。
論文 参考訳(メタデータ) (2022-11-19T17:06:10Z) - Kubric: A scalable dataset generator [73.78485189435729]
KubricはPythonフレームワークで、PyBulletやBlenderとインターフェースして写真リアリスティックなシーンを生成する。
本研究では,3次元NeRFモデルの研究から光フロー推定まで,13種類の異なるデータセットを提示することで,Kubricの有効性を実証する。
論文 参考訳(メタデータ) (2022-03-07T18:13:59Z) - A survey study of success factors in data science projects [0.0]
アジャイルデータサイエンスのライフサイクルは最も広く使われているフレームワークであるが、調査参加者の25%だけがデータサイエンスプロジェクトの方法論に従うと答えている。
プロジェクト方法論に従うプロフェッショナルは、プロジェクトの潜在的なリスクと落とし穴に重点を置いています。
論文 参考訳(メタデータ) (2022-01-17T09:50:46Z) - CateCom: a practical data-centric approach to categorization of
computational models [77.34726150561087]
本稿では,物理モデルとデータ駆動型計算モデルのランドスケープを整理する取り組みについて述べる。
オブジェクト指向設計の概念を適用し、オープンソース協調フレームワークの基礎を概説する。
論文 参考訳(メタデータ) (2021-09-28T02:59:40Z) - From Data to Knowledge to Action: A Global Enabler for the 21st Century [26.32590947516587]
コンピュータと数理科学の進歩が相まって、真の証拠に基づく意思決定を可能にする前例のない能力がもたらされた。
これらの機能は、データの大規模なキャプチャと、そのデータの洞察とレコメンデーションへの変換を可能にする。
商業、科学、教育、芸術、エンターテイメントのWebへの移行により、人間の活動に関する構造化された、非構造化されたデータベースが、これまで例のない量で利用可能になった。
論文 参考訳(メタデータ) (2020-07-31T19:19:42Z) - The Big Three: A Methodology to Increase Data Science ROI by Answering
the Questions Companies Care About [0.0]
企業は、業界アプリケーションでデータサイエンスから得られる価値の3分の1しか達成していないかもしれない。
我々は,データサイエンスを用いて,「ビッグスリー」の質問(何が起きているのか,何を引き起こしているのか,どのような行動を取ればよいのか)を分類し,回答するための方法論を提案する。
論文 参考訳(メタデータ) (2020-02-12T21:25:56Z) - Supervised Learning on Relational Databases with Graph Neural Networks [10.279748604797911]
リレーショナルデータベースに格納されたデータに対する機械学習モデルのトレーニングには、重要なデータ抽出と機能エンジニアリングの努力が必要である。
グラフニューラルネットワークを用いてこれらの課題を克服する手法を提案する。
提案手法は,3つのデータセットのうち2つに対して,最先端の機能工学手法より優れている。
論文 参考訳(メタデータ) (2020-02-06T00:57:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。