論文の概要: The Future of Data Science Education
- arxiv url: http://arxiv.org/abs/2407.11824v1
- Date: Tue, 16 Jul 2024 15:11:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 14:13:22.170412
- Title: The Future of Data Science Education
- Title(参考訳): データサイエンス教育の将来
- Authors: Brian Wright, Peter Alonzi, Ali Riveria,
- Abstract要約: バージニア大学のデータサイエンススクールは、データサイエンスの定義のための新しいモデルを開発した。
本稿では、モデルの中核となる特徴を説明し、AIの分析コンポーネントを超えて、さまざまな概念を統合する方法について説明する。
- 参考スコア(独自算出の注目度): 0.11566458078238004
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The definition of Data Science is a hotly debated topic. For many, the definition is a simple shortcut to Artificial Intelligence or Machine Learning. However, there is far more depth and nuance to the field of Data Science than a simple shortcut can provide. The School of Data Science at the University of Virginia has developed a novel model for the definition of Data Science. This model is based on identifying a unified understanding of the data work done across all areas of Data Science. It represents a generational leap forward in how we understand and teach Data Science. In this paper we will present the core features of the model and explain how it unifies various concepts going far beyond the analytics component of AI. From this foundation we will present our Undergraduate Major curriculum in Data Science and demonstrate how it prepares students to be well-rounded Data Science team members and leaders. The paper will conclude with an in-depth overview of the Foundations of Data Science course designed to introduce students to the field while also implementing proven STEM oriented pedagogical methods. These include, for example, specifications grading, active learning lectures, guest lectures from industry experts and weekly gamification labs.
- Abstract(参考訳): データサイエンスの定義は熱い議論の的になっている。
多くの人にとって、この定義は人工知能や機械学習の単純なショートカットである。
しかし、単純なショートカットが提供できるものよりも、データサイエンスの分野には、はるかに深い深さとニュアンスがある。
バージニア大学のデータサイエンススクールは、データサイエンスの定義のための新しいモデルを開発した。
このモデルは、データサイエンスのすべての領域でなされたデータ作業の統一的な理解を識別することに基づいている。
それは、私たちがデータサイエンスを理解し、教える方法における、世代ごとの飛躍を表している。
本稿では、モデルの中核となる機能を紹介し、AIの分析コンポーネントを超えて、さまざまな概念を統合する方法について説明する。
この財団から、データサイエンスの大学院専攻カリキュラムを提示し、学生がデータサイエンスのチームメンバーやリーダーとして十分に取り組まれていることをいかに準備するかを実演します。
本論文は、STEM指向の教育手法を実践しながら、学生を現場に紹介することを目的としたデータサイエンス基礎講座の詳細な概要を述べる。
例えば、仕様のグラデーション、アクティブラーニングの講義、業界の専門家によるゲスト講演、週刊ギャミフィケーションラボなどがある。
関連論文リスト
- DSBench: How Far Are Data Science Agents to Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - SciInstruct: a Self-Reflective Instruction Annotated Dataset for Training Scientific Language Models [57.96527452844273]
我々はSciInstructを紹介した。SciInstructは、大学レベルの科学的推論が可能な科学言語モデルを訓練するための科学指導スイートである。
我々は、物理学、化学、数学、公式な証明を含む多種多様な高品質なデータセットをキュレートした。
SciInstructの有効性を検証するため、SciInstruct、すなわちChatGLM3(6Bと32B)、Llama3-8B-Instruct、Mistral-7B: MetaMathを用いて言語モデルを微調整した。
論文 参考訳(メタデータ) (2024-01-15T20:22:21Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - Privacy-Preserving Graph Machine Learning from Data to Computation: A
Survey [67.7834898542701]
我々は,グラフ機械学習のプライバシ保護手法の見直しに重点を置いている。
まずプライバシ保護グラフデータを生成する方法を検討する。
次に,プライバシ保護情報を送信する方法について述べる。
論文 参考訳(メタデータ) (2023-07-10T04:30:23Z) - Defining data science: a new field of inquiry [0.0]
現代のデータサイエンスは生まれたばかりで、1962年から徐々に発展し、2000年から急速に発展し、21世紀の最も活発で強力で急速に進化しているイノベーションの1つです。
その価値、パワー、適用性のために、40以上の分野、何百もの研究領域、何千ものアプリケーションで登場しています。
本研究は、データサイエンス参照フレームワークに基づく一貫性のある統一された定義の開発を提案することにより、このデータサイエンスの多重定義問題に対処する。
論文 参考訳(メタデータ) (2023-06-28T12:58:42Z) - Position Paper on Dataset Engineering to Accelerate Science [1.952708415083428]
この作業では、トークン ittextdataset を使用して、明確に定義されたタスクを実行するために構築されたデータの構造化セットを指定する。
具体的には、科学において、各領域にはデータセットを整理、収集、処理するためのユニークな形態がある。
科学と工学の発見プロセスは、データセット上のそのような組織の必要性の極端な例である、と我々は主張する。
論文 参考訳(メタデータ) (2023-03-09T19:07:40Z) - Opinionated practices for teaching reproducibility: motivation, guided
instruction and practice [0.0]
予測モデリングは、しばしばデータサイエンスの初心者にとって最も興味深いトピックの1つである。
学生は本質的にこのトピックを学ぶ動機がなく、学ぶのは容易ではない。
余分なモチベーション、指導、多くのプラクティスを提供することが、このトピックを効果的に教える鍵となります。
論文 参考訳(メタデータ) (2021-09-17T19:15:41Z) - REGRAD: A Large-Scale Relational Grasp Dataset for Safe and
Object-Specific Robotic Grasping in Clutter [52.117388513480435]
本稿では,オブジェクト間の関係のモデル化を継続するregradという新しいデータセットを提案する。
データセットは2D画像と3Dポイントクラウドの両方で収集されます。
ユーザは、好きなだけ多くのデータを生成するために、自由に独自のオブジェクトモデルをインポートできる。
論文 参考訳(メタデータ) (2021-04-29T05:31:21Z) - Computational Skills by Stealth in Secondary School Data Science [16.960800464621993]
本稿では,学生によるデータサイエンスへの最初の露出における計算スキルのステルス開発について論じる。
このアプローチの目的は、データ駆動学習者になる際に、興味やコーディングの自己効力によらず、学生を支援することである。
論文 参考訳(メタデータ) (2020-10-08T09:11:51Z) - Data Science: A Comprehensive Overview [42.98602883069444]
21世紀はビッグデータとデータ経済の時代に始まり、データDNAはすべてのデータに基づく有機体の本質的な構成要素となっている。
データDNAとその生物の適切な理解は、新しいデータ科学の分野と分析のキーストーンに依存している。
この記事では、データサイエンスと分析に関する豊富な観察、教訓、考察に加えて、総合的な全体像を描いている分野としては、初めてである。
論文 参考訳(メタデータ) (2020-07-01T02:33:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。