Fugu-MT 論文翻訳(概要): The Future of Data Science Education

論文の概要: The Future of Data Science Education

arxiv url: http://arxiv.org/abs/2407.11824v1
Date: Tue, 16 Jul 2024 15:11:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-17 14:13:22.170412
Title: The Future of Data Science Education
Title（参考訳）: データサイエンス教育の将来
Authors: Brian Wright, Peter Alonzi, Ali Riveria,
Abstract要約: バージニア大学のデータサイエンススクールは、データサイエンスの定義のための新しいモデルを開発した。本稿では、モデルの中核となる特徴を説明し、AIの分析コンポーネントを超えて、さまざまな概念を統合する方法について説明する。
参考スコア（独自算出の注目度）: 0.11566458078238004
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The definition of Data Science is a hotly debated topic. For many, the definition is a simple shortcut to Artificial Intelligence or Machine Learning. However, there is far more depth and nuance to the field of Data Science than a simple shortcut can provide. The School of Data Science at the University of Virginia has developed a novel model for the definition of Data Science. This model is based on identifying a unified understanding of the data work done across all areas of Data Science. It represents a generational leap forward in how we understand and teach Data Science. In this paper we will present the core features of the model and explain how it unifies various concepts going far beyond the analytics component of AI. From this foundation we will present our Undergraduate Major curriculum in Data Science and demonstrate how it prepares students to be well-rounded Data Science team members and leaders. The paper will conclude with an in-depth overview of the Foundations of Data Science course designed to introduce students to the field while also implementing proven STEM oriented pedagogical methods. These include, for example, specifications grading, active learning lectures, guest lectures from industry experts and weekly gamification labs.
Abstract（参考訳）: データサイエンスの定義は熱い議論の的になっている。多くの人にとって、この定義は人工知能や機械学習の単純なショートカットである。しかし、単純なショートカットが提供できるものよりも、データサイエンスの分野には、はるかに深い深さとニュアンスがある。バージニア大学のデータサイエンススクールは、データサイエンスの定義のための新しいモデルを開発した。このモデルは、データサイエンスのすべての領域でなされたデータ作業の統一的な理解を識別することに基づいている。それは、私たちがデータサイエンスを理解し、教える方法における、世代ごとの飛躍を表している。本稿では、モデルの中核となる機能を紹介し、AIの分析コンポーネントを超えて、さまざまな概念を統合する方法について説明する。この財団から、データサイエンスの大学院専攻カリキュラムを提示し、学生がデータサイエンスのチームメンバーやリーダーとして十分に取り組まれていることをいかに準備するかを実演します。本論文は、STEM指向の教育手法を実践しながら、学生を現場に紹介することを目的としたデータサイエンス基礎講座の詳細な概要を述べる。例えば、仕様のグラデーション、アクティブラーニングの講義、業界の専門家によるゲスト講演、週刊ギャミフィケーションラボなどがある。

関連論文リスト

WildSci: Advancing Scientific Reasoning from In-the-Wild Literature [50.16160754134139]
我々は、ピアレビューされた文献から自動的に合成されるドメイン固有の科学質問の新しいデータセットWildSciを紹介する。複雑な科学的推論タスクを複数選択形式でフレーミングすることにより、明確に定義された報酬信号によるスケーラブルなトレーニングを可能にする。一連の科学的ベンチマークの実験は、我々のデータセットとアプローチの有効性を実証している。
論文参考訳（メタデータ） (2026-01-09T06:35:23Z)
A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文参考訳（メタデータ） (2025-08-28T18:30:52Z)
Data Science: a Natural Ecosystem [8.870389904165705]
この原稿は、私たちが本質的なデータ科学と呼ぶものの全体像(データ中心)を提供する。データサイエンティストは、ミッションに従って定義された課題に直面します。我々は本質的なデータ科学を計算と基礎に意味的に分割した。
論文参考訳（メタデータ） (2025-04-25T08:43:27Z)
Foundation Models for Spatio-Temporal Data Science: A Tutorial and Survey [69.0648659029394]
時空間(ST)データサイエンスは、都市コンピューティング、気候科学、インテリジェントトランスポートといった領域における複雑なシステムを理解するのに不可欠である。研究者は、様々なSTタスクに対する適応性と一般化を高めるために、時空間モデル(STFM)の概念を探求し始めている。 STFMは、データセンシング、管理、マイニングなど、STデータサイエンスのワークフロー全体を強化し、より包括的でスケーラブルなアプローチを提供する。
論文参考訳（メタデータ） (2025-03-12T09:42:18Z)
DSBench: How Far Are Data Science Agents to Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文参考訳（メタデータ） (2024-09-12T02:08:00Z)
MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。 2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文参考訳（メタデータ） (2024-07-06T00:40:53Z)
SciInstruct: a Self-Reflective Instruction Annotated Dataset for Training Scientific Language Models [57.96527452844273]
我々はSciInstructを紹介した。SciInstructは、大学レベルの科学的推論が可能な科学言語モデルを訓練するための科学指導スイートである。我々は、物理学、化学、数学、公式な証明を含む多種多様な高品質なデータセットをキュレートした。 SciInstructの有効性を検証するため、SciInstruct、すなわちChatGLM3(6Bと32B)、Llama3-8B-Instruct、Mistral-7B: MetaMathを用いて言語モデルを微調整した。
論文参考訳（メタデータ） (2024-01-15T20:22:21Z)
On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文参考訳（メタデータ） (2023-10-24T14:01:53Z)
Privacy-Preserving Graph Machine Learning from Data to Computation: A Survey [67.7834898542701]
我々は,グラフ機械学習のプライバシ保護手法の見直しに重点を置いている。まずプライバシ保護グラフデータを生成する方法を検討する。次に,プライバシ保護情報を送信する方法について述べる。
論文参考訳（メタデータ） (2023-07-10T04:30:23Z)
Defining data science: a new field of inquiry [0.0]
現代のデータサイエンスは生まれたばかりで、1962年から徐々に発展し、2000年から急速に発展し、21世紀の最も活発で強力で急速に進化しているイノベーションの1つです。その価値、パワー、適用性のために、40以上の分野、何百もの研究領域、何千ものアプリケーションで登場しています。本研究は、データサイエンス参照フレームワークに基づく一貫性のある統一された定義の開発を提案することにより、このデータサイエンスの多重定義問題に対処する。
論文参考訳（メタデータ） (2023-06-28T12:58:42Z)
Position Paper on Dataset Engineering to Accelerate Science [1.952708415083428]
この作業では、トークン ittextdataset を使用して、明確に定義されたタスクを実行するために構築されたデータの構造化セットを指定する。具体的には、科学において、各領域にはデータセットを整理、収集、処理するためのユニークな形態がある。科学と工学の発見プロセスは、データセット上のそのような組織の必要性の極端な例である、と我々は主張する。
論文参考訳（メタデータ） (2023-03-09T19:07:40Z)
Opinionated practices for teaching reproducibility: motivation, guided instruction and practice [0.0]
予測モデリングは、しばしばデータサイエンスの初心者にとって最も興味深いトピックの1つである。学生は本質的にこのトピックを学ぶ動機がなく、学ぶのは容易ではない。余分なモチベーション、指導、多くのプラクティスを提供することが、このトピックを効果的に教える鍵となります。
論文参考訳（メタデータ） (2021-09-17T19:15:41Z)
REGRAD: A Large-Scale Relational Grasp Dataset for Safe and Object-Specific Robotic Grasping in Clutter [52.117388513480435]
本稿では,オブジェクト間の関係のモデル化を継続するregradという新しいデータセットを提案する。データセットは2D画像と3Dポイントクラウドの両方で収集されます。ユーザは、好きなだけ多くのデータを生成するために、自由に独自のオブジェクトモデルをインポートできる。
論文参考訳（メタデータ） (2021-04-29T05:31:21Z)
Computational Skills by Stealth in Secondary School Data Science [16.960800464621993]
本稿では,学生によるデータサイエンスへの最初の露出における計算スキルのステルス開発について論じる。このアプローチの目的は、データ駆動学習者になる際に、興味やコーディングの自己効力によらず、学生を支援することである。
論文参考訳（メタデータ） (2020-10-08T09:11:51Z)
Data Science: A Comprehensive Overview [42.98602883069444]
21世紀はビッグデータとデータ経済の時代に始まり、データDNAはすべてのデータに基づく有機体の本質的な構成要素となっている。データDNAとその生物の適切な理解は、新しいデータ科学の分野と分析のキーストーンに依存している。この記事では、データサイエンスと分析に関する豊富な観察、教訓、考察に加えて、総合的な全体像を描いている分野としては、初めてである。
論文参考訳（メタデータ） (2020-07-01T02:33:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。