論文の概要: What makes an Expert? Comparing Problem-solving Practices in Data Science Notebooks
- arxiv url: http://arxiv.org/abs/2602.15428v1
- Date: Tue, 17 Feb 2026 08:45:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-18 16:03:18.015039
- Title: What makes an Expert? Comparing Problem-solving Practices in Data Science Notebooks
- Title(参考訳): 専門家とは何か? データサイエンスノートにおける問題解決実践の比較
- Authors: Manuel Valle Torre, Marcus Specht, Catharine Oertel,
- Abstract要約: データサイエンスの専門知識の開発には、直接教えることの難しい暗黙のプロセス指向のスキルが必要です。
本研究では,専門家と初心者の問題解決プロセスの違いを実証的に理解する上での課題について考察する。
- 参考スコア(独自算出の注目度): 0.6308539010172308
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The development of data science expertise requires tacit, process-oriented skills that are difficult to teach directly. This study addresses the resulting challenge of empirically understanding how the problem-solving processes of experts and novices differ. We apply a multi-level sequence analysis to 440 Jupyter notebooks from a public dataset, mapping low-level coding actions to higher-level problem-solving practices. Our findings reveal that experts do not follow fundamentally different transitions between data science phases than novices (e.g., Data Import, EDA, Model Training, Visualization). Instead, expertise is distinguished by the overall workflow structure from a problem-solving perspective and cell-level, fine-grained action patterns. Novices tend to follow long, linear processes, whereas experts employ shorter, more iterative strategies enacted through efficient, context-specific action sequences. These results provide data science educators with empirical insights for curriculum design and assessment, shifting the focus from final products toward the development of the flexible, iterative thinking that defines expertise-a priority in a field increasingly shaped by AI tools.
- Abstract(参考訳): データサイエンスの専門知識の開発には、直接教えることの難しい暗黙のプロセス指向のスキルが必要です。
本研究では,専門家と初心者の問題解決プロセスの違いを実証的に理解する上での課題について考察する。
公開データセットから440個のJupyterノートにマルチレベルシーケンス解析を適用し、低レベルコーディングアクションを高レベルな問題解決プラクティスにマッピングする。
我々の研究結果によると、専門家は初心者(データインポート、EDA、モデルトレーニング、可視化など)とデータサイエンスのフェーズ間の根本的に異なる遷移をたどっていない。
代わりに、専門知識は、全体的なワークフロー構造と問題解決の観点から、セルレベル、きめ細かいアクションパターンから区別される。
初心者は長い線形プロセスに従う傾向があるが、専門家はより短く、より反復的な戦略を、より効率的で文脈固有のアクションシーケンスを通じて実行している。
これらの結果は、カリキュラムの設計と評価に関する実証的な洞察をデータサイエンス教育者に与え、AIツールによってますます形作られる分野における専門性を定義する柔軟な反復的思考の開発に焦点を移す。
関連論文リスト
- Embedding Domain Knowledge for Large Language Models via Reinforcement Learning from Augmented Generation [18.99847259801634]
本稿では,RLAG(Reinforcement Learning from Augmented Generation)を提案し,ドメイン知識を大規模言語モデルに組み込む。
提案手法は, サンプリング世代間を反復的に循環し, 計算した報酬によってモデルを最適化する。
医学、法学、天文学、および現在のイベントデータセットにわたる実験結果から、提案手法がベースラインアプローチを著しく上回ることを示す。
論文 参考訳(メタデータ) (2025-09-24T14:30:16Z) - Pre-training Multi-task Contrastive Learning Models for Scientific
Literature Understanding [52.723297744257536]
事前学習言語モデル(LM)は、科学文献理解タスクにおいて有効であることを示す。
文献理解タスク間の共通知識共有を容易にするために,マルチタスクのコントラスト学習フレームワークであるSciMultを提案する。
論文 参考訳(メタデータ) (2023-05-23T16:47:22Z) - Experts in the Loop: Conditional Variable Selection for Accelerating
Post-Silicon Analysis Based on Deep Learning [6.6357750579293935]
シリコン後検証は半導体製造において最も重要なプロセスの1つである。
この研究は、専門家をループに留めつつ、新しい条件変数選択アプローチを設計することを目的としている。
論文 参考訳(メタデータ) (2022-09-30T06:12:12Z) - Decision Rule Elicitation for Domain Adaptation [93.02675868486932]
ヒトインザループ機械学習は、専門家からラベルを引き出すために人工知能(AI)で広く使用されています。
この作業では、専門家が意思決定を説明する決定ルールを作成できるようにします。
決定規則の適用はアルゴリズムのドメイン適応を改善し、専門家の知識をAIモデルに広めるのに役立つことを示す。
論文 参考訳(メタデータ) (2021-02-23T08:07:22Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z) - Principles and Practice of Explainable Machine Learning [12.47276164048813]
本稿では、特に機械学習(ML)とパターン認識モデルに関するデータ駆動手法に焦点を当てる。
メソッドの頻度と複雑さが増すにつれて、少なくともビジネスの利害関係者はモデルの欠点に懸念を抱いている。
我々は、業界実践者が説明可能な機械学習の分野をよりよく理解するための調査を実施した。
論文 参考訳(メタデータ) (2020-09-18T14:50:27Z) - A Review of Meta-level Learning in the Context of Multi-component,
Multi-level Evolving Prediction Systems [6.810856082577402]
データから有用なパターンを抽出する自動的あるいは半自動的な方法の調査の必要性が高まっている。
与えられた問題に対する学習方法の最も適切なマッピングを見つけるには、深い専門家の知識と広範な計算資源が必要である。
データセットに最適な学習アルゴリズムをアドバイスできるインテリジェントなレコメンデーションエンジンが必要だ。
論文 参考訳(メタデータ) (2020-07-17T14:14:37Z) - Expertise Style Transfer: A New Task Towards Better Communication
between Experts and Laymen [88.30492014778943]
そこで我々は,手動で注釈付きデータセットを手動で提供し,専門的なスタイルの転送を行う新しいタスクを提案する。
このタスクの解決は、プロの言語を単純化するだけでなく、レイメンの記述の正確さと専門性の向上にも寄与する。
スタイル転送とテキスト単純化のための5つの最先端モデルのベンチマーク性能を確立する。
論文 参考訳(メタデータ) (2020-05-02T04:50:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。