論文の概要: Beyond Dependencies: The Role of Copy-Based Reuse in Open Source Software Development
- arxiv url: http://arxiv.org/abs/2409.04830v1
- Date: Sat, 7 Sep 2024 13:50:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 20:31:31.262145
- Title: Beyond Dependencies: The Role of Copy-Based Reuse in Open Source Software Development
- Title(参考訳): 依存性を超えて - オープンソースソフトウェア開発におけるコピーベースの再利用の役割
- Authors: Mahmoud Jahanshahi, David Reid, Audris Mockus,
- Abstract要約: オープンソースソフトウェアでは、依存関係を導入したり、リソース自体をコピーすることで、プロジェクトのリソースは再利用できる。
我々の目標は、将来の研究とツール開発が効率を高め、コピーベースの再利用のリスクを低減することである。
- 参考スコア(独自算出の注目度): 5.412781090113212
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In Open Source Software, resources of any project are open for reuse by introducing dependencies or copying the resource itself. In contrast to dependency-based reuse, the infrastructure to systematically support copy-based reuse appears to be entirely missing. Our aim is to enable future research and tool development to increase efficiency and reduce the risks of copy-based reuse. We seek a better understanding of such reuse by measuring its prevalence and identifying factors affecting the propensity to reuse. To identify reused artifacts and trace their origins, our method exploits World of Code infrastructure. We begin with a set of theory-derived factors related to the propensity to reuse, sample instances of different reuse types, and survey developers to better understand their intentions. Our results indicate that copy-based reuse is common, with many developers being aware of it when writing code. The propensity for a file to be reused varies greatly among languages and between source code and binary files, consistently decreasing over time. Files introduced by popular projects are more likely to be reused, but at least half of reused resources originate from ``small'' and ``medium'' projects. Developers had various reasons for reuse but were generally positive about using a package manager.
- Abstract(参考訳): オープンソースソフトウェアでは、依存関係を導入したり、リソース自体をコピーすることで、プロジェクトのリソースは再利用できる。
依存性ベースの再利用とは対照的に、コピーベースの再利用を体系的にサポートするインフラストラクチャは完全に欠落しているようだ。
我々の目標は、将来の研究とツール開発が効率を高め、コピーベースの再利用のリスクを低減することである。
我々は、その頻度を測定し、再利用の妥当性に影響を与える要因を特定することにより、そのような再利用をよりよく理解することを模索する。
再利用されたアーティファクトを識別し、その起源を辿るために、我々の手法はWorld of Codeのインフラを利用する。
まず、再利用の正当性に関する理論に基づく要因のセット、異なる再利用タイプのサンプルサンプル、開発者がその意図をよりよく理解するために調査することから始めます。
我々の結果は、コピーベースの再利用が一般的であることを示し、多くの開発者がコードを書いているときにそれを認識している。
再利用されるファイルの妥当性は言語やソースコードとバイナリファイルの間で大きく異なり、時間とともに一貫して低下している。
人気のあるプロジェクトで導入されたファイルは再利用される可能性が高いが、再利用されたリソースの少なくとも半分は ``small'' と ``medium'' プロジェクトに由来する。
再利用にはさまざまな理由があったが、パッケージマネージャの使用には概して肯定的だった。
関連論文リスト
- In Search of Metrics to Guide Developer-Based Refactoring Recommendations [13.063733696956678]
モチベーションは、外部の振る舞いを損なうことなく、ソースコードの品質を改善するための確立されたアプローチである。
本研究では,開発者の運用意欲を調査する指標に関する実証的研究を提案する。
実行すべき開発者のモチベーションを把握する上で、製品とプロセスのメトリクスの価値を定量化します。
論文 参考訳(メタデータ) (2024-07-25T16:32:35Z) - Investigating the Transferability of Code Repair for Low-Resource Programming Languages [57.62712191540067]
大規模言語モデル(LLM)は、コード生成タスクにおいて顕著なパフォーマンスを示している。
近年の作業は、連鎖推論や蒸留といった現代的な技術を統合することで、コード修復のプロセスを強化している。
高低資源言語と低低資源言語の両方でコード修復を蒸留する利点について検討する。
論文 参考訳(メタデータ) (2024-06-21T05:05:39Z) - A Knowledge Plug-and-Play Test Bed for Open-domain Dialogue Generation [51.31429493814664]
マルチソース対話知識の選択と応答生成を評価するために,ウィキペディアのマルチソースウィザードというベンチマークを示す。
本稿では,すでに訓練済みの対話モデルを用いて,未確認の情報源からの新たなサポート知識を利用するための新たな課題である対話知識プラグイン・アンド・プレイを提案する。
論文 参考訳(メタデータ) (2024-03-06T06:54:02Z) - ReGAL: Refactoring Programs to Discover Generalizable Abstractions [59.05769810380928]
Generalizable Abstraction Learning (ReGAL)は、再利用可能な関数のライブラリをコード化して学習する手法である。
ReGALによって発見された共有関数ライブラリは、プログラムが様々な領域で容易に予測できることを示している。
CodeLlama-13Bでは、ReGALはLOGOで11.5%、日付理解で26.1%、TextCraftで8.1%という絶対精度が向上し、3つのドメインのうち2つでGPT-3.5を上回った。
論文 参考訳(メタデータ) (2024-01-29T18:45:30Z) - Dataset: Copy-based Reuse in Open Source Software [5.917654223291073]
オープンソースソフトウェアでは、ソースコードやその他のプロジェクトで利用可能なリソースは、しばしば寛容なライセンス制限を受ける人なら誰でも閲覧または再利用することができる。
このデータセットは、OSS全体の再利用をほぼすべてのOSSでキャプチャするコピーアクティビティデータを提供することで、OSS全体のコピーベースの再利用の研究を促進することを目指している。
論文 参考訳(メタデータ) (2023-12-14T22:08:09Z) - How is Software Reuse Discussed in Stack Overflow? [12.586676749644342]
我々は、コード再利用時に開発者が直面する課題をより深く理解するために、1,409件の投稿について実証的研究を行った。
この結果から, 「視覚スタジオ」 が質問投稿における最重要課題であり, 再利用を目的として, 開発者が頻繁に利用するデザインパターンが存在することがわかった。
論文 参考訳(メタデータ) (2023-11-01T03:13:36Z) - Pluvio: Assembly Clone Search for Out-of-domain Architectures and
Libraries through Transfer Learning and Conditional Variational Information
Bottleneck [6.230859543111394]
アセンブリクローン検索は、リリースされた実行ファイルの再利用によって生じる脆弱性のあるコードを特定するのに有効である。
組立クローン探索に関する最近の研究は、組立コードの変種に合わせて機械学習に基づく手法を用いる傾向を示している。
本稿では,大規模な事前学習型自然言語モデルによる人間の共通知識を,移動学習の形で,組立クローン探索のための現在の学習に基づくアプローチに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-07-20T06:55:37Z) - Predicting the Impact of Batch Refactoring Code Smells on Application
Resource Consumption [3.5557219875516646]
本稿では,ソフトウェアコードの臭いのバッチと資源消費の関係について検討する。
次に、コードの臭いがリソース消費に与える影響を予測するアルゴリズムを設計することを目的とする。
論文 参考訳(メタデータ) (2023-06-27T19:28:05Z) - CONCORD: Clone-aware Contrastive Learning for Source Code [64.51161487524436]
セルフ教師付き事前トレーニングは、多くのダウンストリームSEタスクに価値のあるジェネリックコード表現を学ぶための牽引役になった。
汎用的な表現学習のために、開発者が日々どのようにコードをコーディングするかは、要因としても不可欠である、と私たちは主張する。
特に,表現空間に良性クローンを近づける自己教師型コントラスト学習戦略であるCONCORDを提案する。
論文 参考訳(メタデータ) (2023-06-05T20:39:08Z) - Synergistic Interplay between Search and Large Language Models for
Information Retrieval [141.18083677333848]
InteRにより、RMはLLM生成した知識コレクションを使用してクエリの知識を拡張することができる。
InteRは、最先端手法と比較して総合的に優れたゼロショット検索性能を実現する。
論文 参考訳(メタデータ) (2023-05-12T11:58:15Z) - Do code refactorings influence the merge effort? [80.1936417993664]
複数のコントリビュータがソースコードを並行して変更して,新機能の実装やバグの修正,既存のコードの変更などを行っている。
これらの同時変更は、ソースコードの同じバージョンにマージする必要がある。
研究によると、すべてのマージの試みの10~20%が衝突を起こしており、これはプロセスを完了するために手動開発者の介入を必要とする。
論文 参考訳(メタデータ) (2023-05-10T13:24:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。