論文の概要: Generative AI Spotlights the Human Core of Data Science: Implications for Education
- arxiv url: http://arxiv.org/abs/2604.02238v1
- Date: Thu, 02 Apr 2026 16:31:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.919323
- Title: Generative AI Spotlights the Human Core of Data Science: Implications for Education
- Title(参考訳): ジェネレーティブAIがデータサイエンスの人間的コアを浮かび上がらせる:教育における意味
- Authors: Nathan Taback,
- Abstract要約: 生成AI(GAI)は、データサイエンスの中心にある、既約の人間コアを明らかにする。
データサイエンスカリキュラムは、学生に効果的に貢献する方法を教えながら、この人間のコアに焦点を当てるべきである。
- 参考スコア(独自算出の注目度): 0.5801621787540268
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Generative AI (GAI) reveals an irreducible human core at the center of data science: advances in GAI should sharpen, rather than diminish, the focus on human reasoning in data science education. GAI can now execute many routine data science workflows, including cleaning, summarizing, visualizing, modeling, and drafting reports. Yet the competencies that matter most remain irreducibly human: problem formulation, measurement and design, causal identification, statistical and computational reasoning, ethics and accountability, and sensemaking. Drawing on Donoho's Greater Data Science framework, Nolan and Temple Lang's vision of computational literacy, and the McLuhan-Culkin insight that we shape our tools and thereafter our tools shape us, this paper traces the emergence of data science through three converging lineages: Tukey's intellectual vision of data analysis as a science, the commercial logic of surveillance capitalism that created industrial demand for data scientists, and the academic programs that followed. Mapping GAI's impact onto Donoho's six divisions of Greater Data Science shows that computing with data (GDS3) has been substantially automated, while data gathering, preparation, and exploration (GDS1) and science about data science (GDS6) still require essential human input. The educational implication is that data science curricula should focus on this human core while teaching students how to contribute effectively within iterative prompt-output-prompt cycles using retrieval-augmented generation, and that learning outcomes and assessments should explicitly evaluate reasoning and judgment.
- Abstract(参考訳): ジェネレーティブAI(GAI)は、データサイエンスの中心にある、既約の人間コアを明らかにしている。
GAIは、クリーニング、要約、可視化、モデリング、ドラフトレポートなど、多くの日常的なデータサイエンスワークフローを実行することができる。
問題の定式化、測定と設計、因果同定、統計的および計算的推論、倫理と説明責任、センスメイキングである。
ドノホの偉大なデータサイエンスフレームワーク、Nolan氏とTemple Lang氏の計算リテラシーに関するビジョン、そして私たちのツールを形作り、その後ツールを形作り、私たちを形作るというMcLuhan-Culkin氏の洞察に基づいて、本論文は、データ分析を科学とするTukeyの知的ビジョン、データ科学者の産業的な需要を生み出す監視資本主義の商業論理、そしてそれに続く学術プログラムの3つの系統を通じて、データサイエンスの出現を辿る。
ドノホの6つの大データサイエンス部門に対するGAIの影響をマッピングすると、データを用いたコンピューティング(GDS3)は実質的に自動化されている一方で、データ収集、準備、探索(GDS1)とデータサイエンスに関する科学(GDS6)は依然として必須の人間の入力を必要としている。
教育的な意味は、データサイエンスカリキュラムは、検索強化世代を用いた反復的な即時実行サイクル内で効果的に貢献する方法を学生に教えながら、この人間のコアに焦点を当てるべきであり、学習結果と評価は、推論と判断を明確に評価すべきであるということである。
関連論文リスト
- A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - AI, Humans, and Data Science: Optimizing Roles Across Workflows and the Workforce [0.0]
我々は、分析、生成、エージェントAIの可能性と限界を考慮し、データサイエンティストを増強したり、伝統的に人間のアナリストや研究者によってなされたタスクを引き受ける。
従来の調査分析が問題になったのは、統計ソフトウェアの使用が簡単になったことで、研究者が完全に理解できなかった分析を行えなくなった時だった。
論文 参考訳(メタデータ) (2025-07-15T17:59:06Z) - DSBench: How Far Are Data Science Agents from Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - The Future of Data Science Education [0.11566458078238004]
バージニア大学のデータサイエンススクールは、データサイエンスの定義のための新しいモデルを開発した。
本稿では、モデルの中核となる特徴を説明し、AIの分析コンポーネントを超えて、さまざまな概念を統合する方法について説明する。
論文 参考訳(メタデータ) (2024-07-16T15:11:54Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Computational Skills by Stealth in Secondary School Data Science [16.960800464621993]
本稿では,学生によるデータサイエンスへの最初の露出における計算スキルのステルス開発について論じる。
このアプローチの目的は、データ駆動学習者になる際に、興味やコーディングの自己効力によらず、学生を支援することである。
論文 参考訳(メタデータ) (2020-10-08T09:11:51Z) - Data Science: A Comprehensive Overview [42.98602883069444]
21世紀はビッグデータとデータ経済の時代に始まり、データDNAはすべてのデータに基づく有機体の本質的な構成要素となっている。
データDNAとその生物の適切な理解は、新しいデータ科学の分野と分析のキーストーンに依存している。
この記事では、データサイエンスと分析に関する豊富な観察、教訓、考察に加えて、総合的な全体像を描いている分野としては、初めてである。
論文 参考訳(メタデータ) (2020-07-01T02:33:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。