論文の概要: Parse Tree Tracking Through Time for Programming Process Analysis at Scale
- arxiv url: http://arxiv.org/abs/2509.03668v1
- Date: Wed, 03 Sep 2025 19:32:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:09.95557
- Title: Parse Tree Tracking Through Time for Programming Process Analysis at Scale
- Title(参考訳): Parse Tree Tracking through Time for Programming Process Analysis at Scale
- Authors: Matt Rau, Chris Brown, John Edwards,
- Abstract要約: 2つのアルゴリズムを用いて、時間を通して解析木ノードを追跡し、解析不能なコード状態に対するツリー表現を構築します。
2021 CS1 コースの学生コースから得られた公開キーストロークデータにこれらのアルゴリズムを適用し,解析を行った。
- 参考スコア(独自算出の注目度): 1.8428580623654864
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Background and Context: Programming process data can be utilized to understand the processes students use to write computer programming assignments. Keystroke- and line-level event logs have been used in the past in various ways, primarily in high-level descriptive statistics (e.g., timings, character deletion rate, etc). Analysis of behavior in context (e.g., how much time students spend working on loops) has been cumbersome because of our inability to automatically track high-level code representations, such as abstract syntax trees, through time and unparseable states. Objective: Our study has two goals. The first is to design the first algorithm that tracks parse tree nodes through time. Second, we utilize this algorithm to perform a partial replication study of prior work that used manual tracking of code representations, as well as other novel analyses of student programming behavior that can now be done at scale. Method: We use two algorithms presented in this paper to track parse tree nodes through time and construct tree representations for unparseable code states. We apply these algorithms to a public keystroke data from student coursework in a 2021 CS1 course and conduct analysis on the resulting parse trees. Findings: We discover newly observable statistics at scale, including that code is deleted at similar rates inside and outside of conditionals and loops, a third of commented out code is eventually restored, and that frequency with which students jump around in their code may not be indicative of struggle. Implications: The ability to track parse trees through time opens the door to understanding new dimensions of student programming, such as best practices of structural development of code over time, quantitative measurement of what syntactic constructs students struggle most with, refactoring behavior, and attention shifting within the code.
- Abstract(参考訳): 背景と背景: プログラミングプロセスデータは、学生がコンピュータプログラミングの課題を書くのに使用するプロセスを理解するために利用することができる。
キーストロークとラインレベルのイベントログは、さまざまな方法で、主にハイレベルな記述統計(例えば、タイミング、文字削除率など)で使用されている。
抽象構文木のような高レベルのコード表現を自動的に追跡できないため、時間や不可分な状態を通じて、コンテキストにおける振る舞いの分析(例えば、学生がループに費やす時間など)は困難です。
目的: 私たちの研究には2つの目標があります。
1つ目は、時間を通して解析された木のノードを追跡する最初のアルゴリズムを設計することである。
第2に,このアルゴリズムを用いて,手作業によるコード表現の追跡と,現在大規模に実施可能な新たなプログラミング行動の解析を行う。
方法:本論文では,木ノードの時間的追跡と,解析不能なコード状態に対するツリー表現の構築に,2つのアルゴリズムを用いた。
2021 CS1 コースの学生コースから得られた公開キーストロークデータにこれらのアルゴリズムを適用し,解析を行った。
発見: 新たに観測可能な統計として,条件やループの内外と同じような速度でコードが削除されたこと,コメントアウトされたコードの3分の1が最終的に復元されたこと,学生がコードの中を飛び回る頻度が,苦労の現れではないこと,などが挙げられます。
意味: 時間を通して解析木を追跡する能力は、学生プログラミングの新たな次元を理解するための扉を開く。例えば、時間の経過とともにコードの構造的発達のベストプラクティス、学生が最も苦労する構文構築物の定量的測定、リファクタリング行動、コード内の注意移動などである。
関連論文リスト
- Counting the Trees in the Forest: Evaluating Prompt Segmentation for Classifying Code Comprehension Level [2.250363093539224]
本稿では,平易な英語の質問に対する説明文に対する理解度を自動的に評価する新しい手法を提案する。
本研究では,Large Language Model (LLM) を用いて,学生の記述とコードの両方を分割し,各行を個別に記述するか否か(多くのセグメント),あるいはコード全体を決定することを目的とする。
論文 参考訳(メタデータ) (2025-03-15T17:57:38Z) - CASET: Complexity Analysis using Simple Execution Traces for CS* submissions [0.0]
CS1 や CS2 コースで学生の提出を自動アップグレードする最も一般的な方法は、事前に定義されたテストスイートに対して実行し、結果と参照結果を比較することである。
この手法は、解の正しさが、結果を得るために使われるアルゴリズムのような単純な出力を超えると利用できない。
動的トレースと教師なし機械学習を用いてアルゴリズムの時間的複雑さを解析する新しいツールCASETを提案する。
論文 参考訳(メタデータ) (2024-10-20T15:29:50Z) - From Decoding to Meta-Generation: Inference-time Algorithms for Large Language Models [63.188607839223046]
この調査は、推論中に計算をスケールするメリットに焦点を当てている。
我々はトークンレベルの生成アルゴリズム、メタジェネレーションアルゴリズム、効率的な生成という3つの領域を統一的な数学的定式化の下で探索する。
論文 参考訳(メタデータ) (2024-06-24T17:45:59Z) - Sparse Attention-Based Neural Networks for Code Classification [15.296053323327312]
コード分類のためのスパース注意型ニューラルネットワーク(SACC)を提案する。
最初のステップでは、ソースコードは構文解析と前処理を行う。
サブツリーの符号化されたシーケンスは、分類のためにスパースアテンション機構を組み込んだTransformerモデルに入力される。
論文 参考訳(メタデータ) (2023-11-11T14:07:12Z) - Leveraging Generative AI: Improving Software Metadata Classification
with Generated Code-Comment Pairs [0.0]
ソフトウェア開発では、コードの理解とコラボレーションを強化する上で、コードコメントが重要な役割を果たす。
本研究では,コードコメントを「有用」あるいは「有用でない」と客観的に分類する課題について論じる。
本稿では,この分類プロセスを自動化するために,コンテキスト化された埋め込み,特にBERTを利用する新しいソリューションを提案する。
論文 参考訳(メタデータ) (2023-10-14T12:09:43Z) - Searching for More Efficient Dynamic Programs [61.79535031840558]
本稿では,プログラム変換の集合,変換プログラムの効率を評価するための単純な指標,およびこの指標を改善するための探索手順について述べる。
実際に、自動検索は初期プログラムの大幅な改善を見出すことができることを示す。
論文 参考訳(メタデータ) (2021-09-14T20:52:55Z) - Strongly Incremental Constituency Parsing with Graph Neural Networks [70.16880251349093]
文を構文木にパースすることは、NLPの下流アプリケーションに恩恵をもたらす。
トランジッションベースは、状態遷移システムでアクションを実行することでツリーを構築する。
既存のトランジションベースは主にシフト・リデュース・トランジション・システムに基づいている。
論文 参考訳(メタデータ) (2020-10-27T19:19:38Z) - GraphCodeBERT: Pre-training Code Representations with Data Flow [97.00641522327699]
本稿では,コード固有の構造を考慮したプログラミング言語の事前学習モデルであるGraphCodeBERTを提案する。
これは変数間の"where-the-value-comes-from"の関係をエンコードするコードのセマンティックレベルの構造です。
コード検索,クローン検出,コード翻訳,コード改良の4つのタスクにおいて,本モデルを評価する。
論文 参考訳(メタデータ) (2020-09-17T15:25:56Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。