論文の概要: How Do Code Smells Affect Skill Growth in Scratch Novice Programmers?
- arxiv url: http://arxiv.org/abs/2507.17314v1
- Date: Wed, 23 Jul 2025 08:30:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-24 22:33:14.919297
- Title: How Do Code Smells Affect Skill Growth in Scratch Novice Programmers?
- Title(参考訳): スクラッチ初心者プログラマのスキル成長にコードスムーズはどのように影響するか?
- Authors: Ricardo Hidalgo Aragón, Jesús M. González-Barahona, Gregorio Robles,
- Abstract要約: この研究は、特定のCT能力と具体的な設計上の欠陥とアンチパターンを結びつける、初めて、大規模できめ細かな地図を提供する。
プログラミングの習慣が早期のスキル獲得にどのように影響するかを明らかにすることで、持続可能なソフトウェアメンテナンスと進化のためのコンピューティング教育理論と実用的なツールの両方を前進させる。
- 参考スコア(独自算出の注目度): 3.8506666685467343
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Context. Code smells, which are recurring anomalies in design or style, have been extensively researched in professional code. However, their significance in block-based projects created by novices is still largely unknown. Block-based environments such as Scratch offer a unique, data-rich setting to examine how emergent design problems intersect with the cultivation of computational-thinking (CT) skills. Objective. This research explores the connection between CT proficiency and design-level code smells--issues that may hinder software maintenance and evolution--in programs created by Scratch developers. We seek to identify which CT dimensions align most strongly with which code smells and whether task context moderates those associations. Method. A random sample of aprox. 2 million public Scratch projects is mined. Using open-source linters, we extract nine CT scores and 40 code smell indicators from these projects. After rigorous pre-processing, we apply descriptive analytics, robust correlation tests, stratified cross-validation, and exploratory machine-learning models; qualitative spot-checks contextualize quantitative patterns. Impact. The study will deliver the first large-scale, fine-grained map linking specific CT competencies to concrete design flaws and antipatterns. Results are poised to (i) inform evidence-based curricula and automated feedback systems, (ii) provide effect-size benchmarks for future educational interventions, and (iii) supply an open, pseudonymized dataset and reproducible analysis pipeline for the research community. By clarifying how programming habits influence early skill acquisition, the work advances both computing-education theory and practical tooling for sustainable software maintenance and evolution.
- Abstract(参考訳): コンテキスト。
デザインやスタイルの異常を繰り返しているコードの臭いは、プロのコードで広く研究されている。
しかしながら、初心者によって作成されたブロックベースのプロジェクトにおける彼らの重要性は、いまだに不明である。
Scratchのようなブロックベースの環境は、創発的設計問題とCT(Computer-thinking)スキルの育成がいかに交わるかを調べるために、ユニークなデータリッチな設定を提供する。
目的。
本研究は,Scratch 開発者が開発したプログラムにおいて,CT の習熟度と設計レベルのコードの臭いの関連性について検討する。
我々は,どのCT次元がどのコードの匂いと最も強く一致しているか,タスクコンテキストがそれらの関連を中和するかどうかを見極める。
方法。
aproxのランダムなサンプル。
200万のパブリックScratchプロジェクトが採掘されている。
オープンソースのlinterを用いて、これらのプロジェクトから9つのCTスコアと40個のコード臭い指標を抽出する。
厳密な事前処理の後、説明分析、頑健な相関テスト、階層化されたクロスバリデーション、探索的機械学習モデルを適用し、質的スポットチェックは定量的パターンを文脈的に検証する。
衝撃。
この研究は、特定のCT能力と具体的な設計上の欠陥とアンチパターンを結びつける、初めて、大規模できめ細かな地図を提供する。
results (複数形 results)
一 証拠に基づくカリキュラム及び自動フィードバックシステムに通知すること。
二 将来の教育介入のための効果規模ベンチマークの提供、及び
三 研究コミュニティに対し、オープンで擬名化されたデータセット及び再現可能な分析パイプラインを提供する。
プログラミングの習慣が早期のスキル獲得にどのように影響するかを明らかにすることで、持続可能なソフトウェアメンテナンスと進化のためのコンピューティング教育理論と実用的なツールの両方を前進させる。
関連論文リスト
- Is Compression Really Linear with Code Intelligence? [60.123628177110206]
textitFormat Annealingは、事前訓練されたモデルの本質的な能力を同等に評価するために設計された、軽量で透明なトレーニング手法である。
我々の経験的結果は、測定されたコードインテリジェンスとビット・パー・キャラクタ(BPC)の基本的な対数関係を明らかにする。
私たちの研究は、コードインテリジェンスの開発における圧縮の役割をより微妙に理解し、コードドメインにおける堅牢な評価フレームワークに貢献します。
論文 参考訳(メタデータ) (2025-05-16T16:59:14Z) - Bridging LLM-Generated Code and Requirements: Reverse Generation technique and SBC Metric for Developer Insights [0.0]
本稿では,SBCスコアと呼ばれる新しいスコアリング機構を提案する。
これは、大規模言語モデルの自然言語生成能力を活用するリバースジェネレーション技術に基づいている。
直接コード解析とは異なり、我々のアプローチはAI生成コードからシステム要求を再構築し、元の仕様と比較する。
論文 参考訳(メタデータ) (2025-02-11T01:12:11Z) - SnipGen: A Mining Repository Framework for Evaluating LLMs for Code [51.07471575337676]
言語モデル(LLM)は、コードリポジトリを含む広範なデータセットに基づいてトレーニングされる。
それらの有効性を評価することは、トレーニングに使用されるデータセットと評価に使用されるデータセットとが重複する可能性があるため、大きな課題となる。
SnipGenは、コード生成のために、様々な下流タスクをまたいだ迅速なエンジニアリングを活用するように設計された包括的なリポジトリマイニングフレームワークである。
論文 参考訳(メタデータ) (2025-02-10T21:28:15Z) - EnseSmells: Deep ensemble and programming language models for automated code smells detection [3.974095344344234]
ソフトウェアソースコードの匂いは、最適な設計と実装上の決定を示す。
本稿では,構造的特徴と統計的意味論の融合に重きを置く深層学習アーキテクチャを構築するための新しい手法を提案する。
論文 参考訳(メタデータ) (2025-02-07T15:35:19Z) - Should Code Models Learn Pedagogically? A Preliminary Evaluation of Curriculum Learning for Real-World Software Engineering Tasks [2.0072624123275533]
近年の研究では、合成コードの難易度に基づく漸進的な学習により、カリキュラム学習がコード関連タスクのパフォーマンスを向上させることが示されている。
本稿では,コードクローン検出とコード要約のタスクを通じて,事前学習されたコードモデル(CodeT5)がCLの下でどのように学習されるかを検討する。
CodeXGLUEベンチマークに関する実証研究は、これまでの研究と対照的な結果を示し、そのモデルでは破滅的な忘れ込みとショートカット学習の兆候が見られた。
論文 参考訳(メタデータ) (2025-02-06T06:33:08Z) - A Computational Method for Measuring "Open Codes" in Qualitative Analysis [47.358809793796624]
オープンコーディングは、データセットから"オープンコード"を特定し解釈する、帰納的定性的なプロセスである。
本稿では,「オープンコード」から潜在的なバイアスを系統的に計測し,同定する計算手法を提案する。
論文 参考訳(メタデータ) (2024-11-19T00:44:56Z) - Creating a Trajectory for Code Writing: Algorithmic Reasoning Tasks [0.923607423080658]
本稿では,楽器とその検証に用いる機械学習モデルについて述べる。
我々は,学期最後の週に導入プログラミングコースで収集したデータを用いてきた。
先行研究は、ARTタイプの楽器を特定の機械学習モデルと組み合わせて効果的な学習軌道として機能させることができることを示唆している。
論文 参考訳(メタデータ) (2024-04-03T05:07:01Z) - Using Machine Learning To Identify Software Weaknesses From Software
Requirement Specifications [49.1574468325115]
本研究は、要求仕様からソフトウェア弱点を特定するための効率的な機械学習アルゴリズムを見つけることに焦点を当てる。
ProMISE_exp. Naive Bayes、サポートベクターマシン(SVM)、決定木、ニューラルネットワーク、畳み込みニューラルネットワーク(CNN)アルゴリズムをテストした。
論文 参考訳(メタデータ) (2023-08-10T13:19:10Z) - PEOPL: Characterizing Privately Encoded Open Datasets with Public Labels [59.66777287810985]
プライバシとユーティリティのための情報理論スコアを導入し、不誠実なユーザの平均パフォーマンスを定量化する。
次に、ランダムなディープニューラルネットワークの使用を動機付ける符号化スキームのファミリーを構築する際のプリミティブを理論的に特徴づける。
論文 参考訳(メタデータ) (2023-03-31T18:03:53Z) - NEVIS'22: A Stream of 100 Tasks Sampled from 30 Years of Computer Vision
Research [96.53307645791179]
我々は,100以上の視覚的分類タスクのストリームからなるベンチマークであるNever-Ending VIsual-classification Stream (NEVIS'22)を紹介する。
分類に制限されているにもかかわらず、OCR、テクスチャ分析、シーン認識など、様々なタスクが生成される。
NEVIS'22は、タスクの規模と多様性のために、現在のシーケンシャルな学習アプローチに対して前例のない課題を提起している。
論文 参考訳(メタデータ) (2022-11-15T18:57:46Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - An Empirical Study on Predictability of Software Code Smell Using Deep
Learning Models [3.2973778921083357]
コードの臭いは、汚染されたものの表面的な兆候ですが、ソフトウェア記述のプラクティスという意味では違います。
近年の研究では、コードの臭いを伴うコードは、ソフトウェア開発サイクルの変化の確率が高くなることが多いことが観察されている。
我々は、8種類のコードの臭いを予測するために、ソースコードから抽出した機能の助けを借りて、コードの臭い予測モデルを開発した。
論文 参考訳(メタデータ) (2021-08-08T12:36:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。