論文の概要: InvAASTCluster: On Applying Invariant-Based Program Clustering to
Introductory Programming Assignments
- arxiv url: http://arxiv.org/abs/2206.14175v2
- Date: Wed, 29 Jun 2022 13:44:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-30 21:02:36.564367
- Title: InvAASTCluster: On Applying Invariant-Based Program Clustering to
Introductory Programming Assignments
- Title(参考訳): invaastcluster: 初期プログラミング課題への不変ベースのプログラムクラスタリングの適用について
- Authors: Pedro Orvalho and Mikol\'a\v{s} Janota and Vasco Manquinho
- Abstract要約: InvAASTClusterは、プログラムクラスタリングの新しいアプローチである。
複数のプログラム実行で観察される動的に生成されたプログラム不変量を利用して、意味論的に等価なIPAをクラスタ化する。
以上の結果から,InvAASTClusterはクラスタリングベースのプログラム修復ツールで使用されている場合,現在の最先端技術に進歩することが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Due to the vast number of students enrolled in Massive Open Online Courses
(MOOCs), there has been an increasing number of automated program repair
techniques focused on introductory programming assignments (IPAs). Such
state-of-the-art techniques use program clustering to take advantage of
previous correct student implementations to repair a given new incorrect
submission. Usually, these repair techniques use clustering methods since
analyzing all available correct student submissions to repair a program is not
feasible. The clustering methods use program representations based on several
features such as abstract syntax tree (AST), syntax, control flow, and data
flow. However, these features are sometimes brittle when representing
semantically similar programs.
This paper proposes InvAASTCluster, a novel approach for program clustering
that takes advantage of dynamically generated program invariants observed over
several program executions to cluster semantically equivalent IPAs. Our main
objective is to find a more suitable representation of programs using a
combination of the program's semantics, through its invariants, and its
structure, through its anonymized abstract syntax tree. The evaluation of
InvAASTCluster shows that the proposed program representation outperforms
syntax-based representations when clustering a set of different correct IPAs.
Furthermore, we integrate InvAASTCluster into a state-of-the-art
clustering-based program repair tool and evaluate it on a set of IPAs. Our
results show that InvAASTCluster advances the current state-of-the-art when
used by clustering-based program repair tools by repairing a larger number of
students' programs in a shorter amount of time.
- Abstract(参考訳): 大規模なオープン・オンライン・コース(moocs)に参加する学生の数が膨大であるため、導入型プログラミング課題(ipas)に焦点を当てた自動プログラム修復技術が増えている。
このような最先端技術は、プログラムクラスタリングを使用して、以前の正しい学生実装を利用して、与えられた新しい不正な提出を修復する。
通常、これらの修復手法はクラスタリング手法を用いるが、これはプログラムを修復するために利用可能な全ての正しい学生の応募を解析することは不可能である。
クラスタリング手法は、抽象構文木(ast)、構文、制御フロー、データフローなど、いくつかの特徴に基づくプログラム表現を使用する。
しかし、これらの特徴は、意味的に類似したプログラムを表現する際には壊れることがある。
本稿では,複数のプログラム実行で観測される動的生成プログラム不変量を利用して,意味的に等価なipaをクラスタ化する,プログラムクラスタリングのための新しい手法であるinvaastclusterを提案する。
我々の主な目的は、プログラムのセマンティクス、不変量、構造、および匿名化された抽象構文木を組み合わせることで、プログラムのより適切な表現を見つけることである。
InvAASTClusterの評価は、異なる正しいIPAの集合をクラスタリングする際に、提案プログラム表現が構文ベースの表現より優れていることを示している。
さらに、InvAASTClusterを最先端のクラスタリングベースのプログラム修復ツールに統合し、一連のIPAで評価する。
以上の結果から,InvAASTClusterは,多数の学生プログラムを短時間で修復し,クラスタリングベースのプログラム修復ツールで使用する場合の最先端化を図っている。
関連論文リスト
- Semantic Equitable Clustering: A Simple and Effective Strategy for Clustering Vision Tokens [57.37893387775829]
textbfSemantic textbfEquitable textbfClustering (SEC) という,高速かつバランスの取れたクラスタリング手法を導入する。
SECは、グローバルなセマンティックな関連性に基づいてトークンを効率的かつ直接的な方法でクラスタ化する。
視覚言語コネクタとして機能する汎用視覚バックボーンであるSECViTを提案する。
論文 参考訳(メタデータ) (2024-05-22T04:49:00Z) - Peer-aided Repairer: Empowering Large Language Models to Repair Advanced Student Assignments [26.236420215606238]
我々は,大規模言語モデルを利用したPaRというフレームワークを開発した。
PaRは、ピアソリューション選択、マルチソースプロンプト生成、プログラム修復の3段階で動作する。
Defects4DSと他のよく検証されたTHEPデータセットの評価は、PaRが新しい最先端のパフォーマンスを達成することを明らかにしている。
論文 参考訳(メタデータ) (2024-04-02T09:12:21Z) - Weakly Supervised Semantic Parsing with Execution-based Spurious Program
Filtering [19.96076749160955]
本稿では,プログラムの実行結果に基づくドメインに依存しないフィルタリング機構を提案する。
私たちはこれらの表現に対して多数決を行い、他のプログラムと大きく異なる意味を持つプログラムを特定し、フィルタリングします。
論文 参考訳(メタデータ) (2023-11-02T11:45:40Z) - Towards Realistic Zero-Shot Classification via Self Structural Semantic
Alignment [53.2701026843921]
大規模事前訓練型視覚言語モデル(VLM)はゼロショット分類に有効であることが証明されている。
本稿では,アノテーションではなく,より広い語彙を前提とした,より難易度の高いゼロショット分類(Realistic Zero-Shot Classification)を提案する。
本稿では,ラベルのないデータから構造意味情報を抽出し,同時に自己学習を行う自己構造意味アライメント(S3A)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-24T17:56:46Z) - CEIL: A General Classification-Enhanced Iterative Learning Framework for
Text Clustering [16.08402937918212]
短文クラスタリングのための新しい分類強化反復学習フレームワークを提案する。
各イテレーションにおいて、まず最初に言語モデルを採用して、初期テキスト表現を検索する。
厳密なデータフィルタリングと集約プロセスの後、クリーンなカテゴリラベルを持つサンプルが検索され、監督情報として機能する。
最後に、表現能力が改善された更新言語モデルを使用して、次のイテレーションでクラスタリングを強化する。
論文 参考訳(メタデータ) (2023-04-20T14:04:31Z) - Hierarchical Programmatic Reinforcement Learning via Learning to Compose
Programs [58.94569213396991]
プログラムポリシーを作成するための階層型プログラム強化学習フレームワークを提案する。
提案するフレームワークは,プログラム作成の学習を通じて,アウト・オブ・ディストリビュータの複雑な動作を記述するプログラムポリシーを作成することができる。
Karel ドメインの実験結果から,提案するフレームワークがベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2023-01-30T14:50:46Z) - Learning from Self-Sampled Correct and Partially-Correct Programs [96.66452896657991]
そこで本研究では,モデルが学習中にサンプリングを行い,自己サンプリングされた完全正当プログラムと部分正当プログラムの両方から学習することを提案する。
自己サンプリング型プログラムと部分修正型プログラムを併用することで,学習とサンプリングプロセスのガイドに役立てることができることを示す。
提案手法は,MLEを用いた単一の参照プログラムからの学習と比較して,パス@kの性能を3.1%から12.3%向上させる。
論文 参考訳(メタデータ) (2022-05-28T03:31:07Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Graph Contrastive Clustering [131.67881457114316]
本稿では,クラスタリングタスクに適用可能な新しいグラフコントラスト学習フレームワークを提案し,gcc(graph constrastive clustering)法を考案した。
特に、グラフラプラシアンに基づくコントラスト損失は、より識別的かつクラスタリングフレンドリーな特徴を学ぶために提案されている。
一方で、よりコンパクトなクラスタリング割り当てを学ぶために、グラフベースのコントラスト学習戦略が提案されている。
論文 参考訳(メタデータ) (2021-04-03T15:32:49Z) - Learning Differentiable Programs with Admissible Neural Heuristics [43.54820901841979]
ドメイン固有言語におけるプログラムとして表現される微分可能関数の学習問題について検討する。
我々は、この最適化問題を、プログラム構文のトップダウン導出を符号化した重み付きグラフの探索として構成する。
私たちの重要なイノベーションは、さまざまなニューラルネットワークのクラスを、プログラムの空間上の連続的な緩和と見なすことです。
論文 参考訳(メタデータ) (2020-07-23T16:07:39Z) - ProGraML: Graph-based Deep Learning for Program Optimization and
Analysis [16.520971531754018]
本稿では,機械学習のためのグラフベースのプログラム表現であるProGraMLを紹介する。
ProGraMLは平均94.0F1スコアを獲得し、最先端のアプローチを著しく上回っている。
そして、我々のアプローチを2つのハイレベルなタスク - 不均一なデバイスマッピングとプログラム分類 - に適用し、その両方で新しい最先端のパフォーマンスを設定します。
論文 参考訳(メタデータ) (2020-03-23T20:27:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。