論文の概要: Data Science: Nature and Pitfalls
- arxiv url: http://arxiv.org/abs/2006.16964v1
- Date: Sun, 28 Jun 2020 02:06:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-12 05:34:12.069402
- Title: Data Science: Nature and Pitfalls
- Title(参考訳): データサイエンス:自然と落とし穴
- Authors: Longbing Cao
- Abstract要約: 初期のデータサイエンスの健全な発展にとって重要なことは、データ科学とデータ科学の性質を深く理解することである。
これらの重要な問題は、この記事の議論を動機付けている。
- 参考スコア(独自算出の注目度): 42.98602883069444
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data science is creating very exciting trends as well as significant
controversy. A critical matter for the healthy development of data science in
its early stages is to deeply understand the nature of data and data science,
and to discuss the various pitfalls. These important issues motivate the
discussions in this article.
- Abstract(参考訳): データサイエンスは、非常にエキサイティングなトレンドと重要な論争を生み出している。
データサイエンスの初期段階における健全な発展のための重要な課題は、データ科学とデータ科学の性質を深く理解し、様々な落とし穴について議論することである。
これらの重要な問題は、この記事の議論を動機付けている。
関連論文リスト
- Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - Opinionated practices for teaching reproducibility: motivation, guided
instruction and practice [0.0]
予測モデリングは、しばしばデータサイエンスの初心者にとって最も興味深いトピックの1つである。
学生は本質的にこのトピックを学ぶ動機がなく、学ぶのは容易ではない。
余分なモチベーション、指導、多くのプラクティスを提供することが、このトピックを効果的に教える鍵となります。
論文 参考訳(メタデータ) (2021-09-17T19:15:41Z) - Biases in Data Science Lifecycle [0.0]
本研究の目的は,データ科学者の実践的ガイドラインを提供し,その意識を高めることである。
この研究では、さまざまなバイアス源をレビューし、データサイエンスライフサイクルの異なる段階の下でグループ化しました。
論文 参考訳(メタデータ) (2020-09-10T13:41:48Z) - A Survey on Data Pricing: from Economics to Data Science [61.72030615854597]
データ価格の背景にある様々なモチベーションを調べ、データ価格の経済性を理解する。
デジタル製品とデータ製品の両方について論じる。
我々は、今後の仕事の一連の課題と方向性を考えます。
論文 参考訳(メタデータ) (2020-09-09T19:31:38Z) - Data Science: A Comprehensive Overview [42.98602883069444]
21世紀はビッグデータとデータ経済の時代に始まり、データDNAはすべてのデータに基づく有機体の本質的な構成要素となっている。
データDNAとその生物の適切な理解は、新しいデータ科学の分野と分析のキーストーンに依存している。
この記事では、データサイエンスと分析に関する豊富な観察、教訓、考察に加えて、総合的な全体像を描いている分野としては、初めてである。
論文 参考訳(メタデータ) (2020-07-01T02:33:58Z) - Data Science: Challenges and Directions [42.98602883069444]
データサイエンスのタイトルを含む何百もの文献をレビューする。
議論の大部分は、統計、データマイニング、機械学習、ビッグデータ、あるいは広範なデータ分析に関するものだと考えています。
我々は、複雑なシステムとしてのデータサイエンス問題の性質にインスパイアされた研究とイノベーションの課題に焦点を当てる。
論文 参考訳(メタデータ) (2020-06-28T01:49:00Z) - A Data Scientist's Guide to Streamflow Prediction [55.22219308265945]
我々は,水文降雨要素と流出モデルに着目し,洪水の予測と流れの予測に応用する。
このガイドは、データサイエンティストが問題や水文学的な概念、そしてその過程で現れる詳細を理解するのを助けることを目的としています。
論文 参考訳(メタデータ) (2020-06-05T08:04:37Z) - Ten Research Challenge Areas in Data Science [4.670305538969914]
データサイエンスは、コンピュータ科学、数学、統計学、その他の分野の知識に基づいている。
この記事では、データサイエンスの専門分野としてのメタクエストから始め、データサイエンスの研究課題の基礎となる10のアイデアについて詳述する。
論文 参考訳(メタデータ) (2020-01-27T21:39:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。