Fugu-MT 論文翻訳(概要): One-off Events? An Empirical Study of Hackathon Code Creation and Reuse

論文の概要: One-off Events? An Empirical Study of Hackathon Code Creation and Reuse

arxiv url: http://arxiv.org/abs/2207.01015v1
Date: Sun, 3 Jul 2022 11:49:52 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-19 09:35:32.144716
Title: One-off Events? An Empirical Study of Hackathon Code Creation and Reuse
Title（参考訳）: ワンオフイベント? ハッカソンコードの作成と再利用に関する実証的研究
Authors: Ahmed Samir Imam Mahmoud, Tapajit Dey, Alexander Nolte, Audris Mockus, James D. Herbsleb
Abstract要約: ハッカソンイベントで使用されたり作成されたりするコードの進化を理解することを目的としています。 DevPostから22,183のハッカソンプロジェクトに関する情報を収集しました。
参考スコア（独自算出の注目度）: 69.98625403567553
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Background: Hackathons have become popular events for teams to collaborate on projects and develop software prototypes. Most existing research focuses on activities during an event with limited attention to the evolution of the hackathon code. Aim: We aim to understand the evolution of code used in and created during hackathon events, with a particular focus on the code blobs, specifically, how frequently hackathon teams reuse pre-existing code, how much new code they develop, if that code gets reused afterward, and what factors affect reuse. Method: We collected information about 22,183 hackathon projects from DevPost and obtained related code blobs, authors, project characteristics, original author, code creation time, language, and size information from World of Code. We tracked the reuse of code blobs by identifying all commits containing blobs created during hackathons and identifying all projects that contain those commits. We also conducted a series of surveys in order to gain a deeper understanding of hackathon code evolution that we sent out to hackathon participants whose code was reused, whose code was not reused, and developers who reused some hackathon code. Result: 9.14% of the code blobs in hackathon repositories and 8% of the lines of code (LOC) are created during hackathons and around a third of the hackathon code gets reused in other projects by both blob count and LOC. The number of associated technologies and the number of participants in hackathons increase the reuse probability. Conclusion: The results of our study demonstrate hackathons are not always "one-off" events as common knowledge dictates and they can serve as a starting point for further studies in this area.
Abstract（参考訳）: 背景:ハッカソンは、チームがプロジェクトとコラボレーションし、ソフトウェアプロトタイプを開発するための人気のあるイベントになっています。既存の研究のほとんどは、ハッカソンコードの進化に限定したイベント中のアクティビティに焦点を当てている。具体的には、ハッカソンチームがどの程度の頻度で既存のコードを再利用しているか、どの程度の新しいコードが開発されているか、そのコードがその後再利用されたか、そして再利用に影響する要因についてです。方法:devpostから22,183件のハッカソンプロジェクトに関する情報を収集し,関連するコードブロブ,著者,プロジェクト特性,オリジナル作者,コード作成時間,言語,コードの世界からサイズ情報を得た。私たちは、ハッカソン中に作成されたblobを含むすべてのコミットを特定し、それらのコミットを含むすべてのプロジェクトを特定して、コードblobの再利用を追跡しました。また、ハッカソンのコードの進化をより深く理解するために、コードの再利用、再利用されていないハッカソンの参加者、ハッカソンのコードを再利用した開発者に対して、一連の調査を実施しました。結果:ハッカソンリポジトリのコードブロブの9.14%、ハッカソンのコードライン(LOC)の8%が作成され、ハッカソンコードの約3分の1がブロブカウントとLOCによって他のプロジェクトで再利用される。ハッカソンにおける関連技術の数と参加者数は再利用確率を増加させる。結論: 私たちの研究の結果は,ハッカソンが共通知識が指示する「ワンオフ」イベントであるとは限らないことを示し,この領域におけるさらなる研究の出発点として機能することを示した。

関連論文リスト

SACL: Understanding and Combating Textual Bias in Code Retrieval with Semantic-Augmented Reranking and Localization [7.4705664339075115]
Retrieval-Augmented Code Generation (RACG)は、関連情報を検索することでコード生成を向上させる重要な技術である。本研究では,コード機能を維持しながら,特定の特徴を体系的にマスキングすることで,コード検索の詳細な分析を行う。テキスト情報を強化し,コードや構造的知識を意味情報で強化することでバイアスを低減するフレームワークであるSACLを提案する。
論文参考訳（メタデータ） (2025-06-25T01:44:28Z)
Code Researcher: Deep Research Agent for Large Systems Code and Commit History [6.13070170140402]
LLM(Large Language Model)ベースのコーディングエージェントは、コーディングベンチマークにおいて有望な結果を示しているが、システムコードに対するその効果は未調査である。 Code Researcherと呼ばれるコードのための最初のディープリサーチエージェントを設計し、システムコードに報告されたクラッシュを緩和するためのパッチを生成する問題に適用する。 Code Researcherは、セマンティクス、パターン、そして十分なコンテキストを集めるためにコードのコミット履歴に関する多段階の推論を実行する。
論文参考訳（メタデータ） (2025-05-27T04:57:00Z)
Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文参考訳（メタデータ） (2024-10-29T12:21:23Z)
CodePurify: Defend Backdoor Attacks on Neural Code Models via Entropy-based Purification [19.570958294967536]
バックドアアタックは、多くのソフトウェアエンジニアリングタスクにおいて、100%近いアタック成功率を達成することができます。エントロピーに基づく浄化を通じて,コードモデルに対するバックドア攻撃に対する新たな防御法であるCodePurifyを提案する。我々は、CodePurifyを3つの代表的なタスクと2つの人気のあるコードモデルにわたる4つの高度なバックドア攻撃に対して広範囲に評価した。
論文参考訳（メタデータ） (2024-10-26T10:17:50Z)
Does Your Neural Code Completion Model Use My Code? A Membership Inference Approach [66.51005288743153]
本稿では,現在のニューラルコード補完モデルの法的および倫理的問題について考察する。私たちは、もともと分類タスクのために作られたメンバシップ推論アプローチ(CodeMIと呼ばれる)を調整します。我々は,この適応型アプローチの有効性を,多種多様なニューラルコード補完モデルで評価した。
論文参考訳（メタデータ） (2024-04-22T15:54:53Z)
Gotcha! This Model Uses My Code! Evaluating Membership Leakage Risks in Code Models [12.214474083372389]
コードモデルに特化した新しいメンバシップ推論手法であるGotchaを提案する。我々は,Gotchaが真正率0.95,偽正率0.10でデータメンバーシップを予測できることを示した。この研究は、コードモデルのプライバシを理解することにより多くの注意を払っている。
論文参考訳（メタデータ） (2023-10-02T12:50:43Z)
CONCORD: Clone-aware Contrastive Learning for Source Code [64.51161487524436]
セルフ教師付き事前トレーニングは、多くのダウンストリームSEタスクに価値のあるジェネリックコード表現を学ぶための牽引役になった。汎用的な表現学習のために、開発者が日々どのようにコードをコーディングするかは、要因としても不可欠である、と私たちは主張する。特に,表現空間に良性クローンを近づける自己教師型コントラスト学習戦略であるCONCORDを提案する。
論文参考訳（メタデータ） (2023-06-05T20:39:08Z)
ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2022-03-15T08:25:08Z)
COSEA: Convolutional Code Search with Layer-wise Attention [90.35777733464354]
我々は、畳み込みニューラルネットワークを階層的注意で活用し、コード固有の構造論理をキャプチャする新しいディープラーニングアーキテクチャ、COSEAを提案する。 COSEAは、コード検索タスクの最先端メソッドよりも大幅に改善できる。
論文参考訳（メタデータ） (2020-10-19T13:53:38Z)
Predicting Vulnerability In Large Codebases With Deep Code Representation [6.357681017646283]
ソフトウェアエンジニアは様々なモジュールのコードを書きます。過去に(異なるモジュールで)修正された同様の問題やバグも、本番コードで再び導入される傾向にある。ソースコードから生成した抽象構文木(AST)の深部表現とアクティブフィードバックループを用いた,AIに基づく新しいシステムを開発した。
論文参考訳（メタデータ） (2020-04-24T13:18:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。