論文の概要: LAGOON: An Analysis Tool for Open Source Communities
- arxiv url: http://arxiv.org/abs/2201.11657v1
- Date: Wed, 26 Jan 2022 18:52:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-29 05:24:54.566615
- Title: LAGOON: An Analysis Tool for Open Source Communities
- Title(参考訳): lagoon - オープンソースコミュニティのための分析ツール
- Authors: Sourya Dey, Walt Woods
- Abstract要約: LAGOONはオープンソースソフトウェア(OSS)コミュニティのエコシステムを理解するためのオープンソースプラットフォームである。
LAGOONはソースコードリポジトリ、イシュートラッカ、メーリングリスト、ウェブサイトからのコンテンツスクラップなど、いくつかの一般的なソースからアーティファクトを取り込みます。
OSSプロジェクトの完全な社会技術グラフの可視化と探索のためのユーザインターフェースを提供する。
- 参考スコア(独自算出の注目度): 7.3861897382622015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents LAGOON -- an open source platform for understanding the
complex ecosystems of Open Source Software (OSS) communities. The platform
currently utilizes spatiotemporal graphs to store and investigate the artifacts
produced by these communities, and help analysts identify bad actors who might
compromise an OSS project's security. LAGOON provides ingest of artifacts from
several common sources, including source code repositories, issue trackers,
mailing lists and scraping content from project websites. Ingestion utilizes a
modular architecture, which supports incremental updates from data sources and
provides a generic identity fusion process that can recognize the same
community members across disparate accounts. A user interface is provided for
visualization and exploration of an OSS project's complete sociotechnical
graph. Scripts are provided for applying machine learning to identify patterns
within the data. While current focus is on the identification of bad actors in
the Python community, the platform's reusability makes it easily extensible
with new data and analyses, paving the way for LAGOON to become a comprehensive
means of assessing various OSS-based projects and their communities.
- Abstract(参考訳): 本稿では,オープンソースソフトウェア(OSS)コミュニティの複雑なエコシステムを理解するためのオープンソースプラットフォームであるLAGOONについて述べる。
このプラットフォームは現在、時空間グラフを使用して、これらのコミュニティによって生成されたアーティファクトを保存および調査し、OSSプロジェクトのセキュリティを侵害する可能性のある悪いアクターを特定するのに役立つ。
lagoonはソースコードリポジトリ、イシュートラッカー、メーリングリスト、プロジェクトwebサイトからのスクレイピングコンテンツなど、いくつかの一般的なソースからアーティファクトを取り込みます。
Ingestionは、データソースからのインクリメンタルアップデートをサポートし、異なるアカウントで同じコミュニティメンバーを認識可能な汎用ID融合プロセスを提供するモジュールアーキテクチャを使用している。
OSSプロジェクトの完全な社会技術グラフの可視化と探索のためのユーザインターフェースを提供する。
データ内のパターンを識別するために機械学習を適用するためのスクリプトが提供されている。
現在の焦点はpythonコミュニティにおける悪役の識別にあるが、プラットフォームの再利用性は、新しいデータと分析で容易に拡張でき、ラグーンが様々なossベースのプロジェクトとそのコミュニティを評価する包括的な手段になる道を開く。
関連論文リスト
- DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - How to Understand Whole Software Repository? [64.19431011897515]
リポジトリ全体に対する優れた理解は、自動ソフトウェアエンジニアリング(ASE)への重要な道になるでしょう。
本研究では,リポジトリ全体を包括的に理解するためのエージェントによるRepoUnderstanderという新しい手法を開発した。
リポジトリレベルの知識をより活用するために、エージェントをまとめ、分析し、計画する。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - Private Knowledge Sharing in Distributed Learning: A Survey [50.51431815732716]
人工知能の台頭は多くの産業に革命をもたらし、社会の働き方を変えた。
異なるエンティティが分散または所有する学習プロセスにおいて、情報を活用することが不可欠である。
現代のデータ駆動サービスは、分散知識エンティティを結果に統合するために開発されています。
論文 参考訳(メタデータ) (2024-02-08T07:18:23Z) - Towards a Structural Equation Model of Open Source Blockchain Software
Health [0.0]
この研究は探索的因子分析を用いて、一般大衆の関心やソフトウェアの人気を表す潜在構造を特定する。
私たちはGitHubリポジトリでスター、フォーク、テキストの言及が組み合わさっているのに対して、堅牢性のための第2の要因は臨界スコアで構成されていることに気付きました。
ソフトウェアヘルスの構造モデルが提案され、一般の関心が開発者のエンゲージメントに肯定的な影響を与え、ソフトウェアの堅牢性を肯定的に予測する。
論文 参考訳(メタデータ) (2023-10-31T08:47:41Z) - PyRCA: A Library for Metric-based Root Cause Analysis [66.72542200701807]
PyRCAは、AIOps(AIOps)のためのRoot Cause Analysis(RCA)のオープンソースの機械学習ライブラリである。
複雑なメトリクス因果依存性を明らかにし、インシデントの根本原因を自動的に特定する、包括的なフレームワークを提供する。
論文 参考訳(メタデータ) (2023-06-20T09:55:10Z) - Enclosed Loops: How open source communities become datasets [2.4269101271105176]
2010年代のコードホスティングとパッケージ管理の集中化は、オープンソースエコシステムの社会的配置に根本的な変化をもたらした。
本稿では, Dependabot, Crater, Copilotの3つのツールについて検討する。
論文 参考訳(メタデータ) (2023-06-09T00:02:25Z) - GAIA Search: Hugging Face and Pyserini Interoperability for NLP Training
Data Exploration [97.68234051078997]
我々はPyseriniを、オープンソースのAIライブラリとアーティファクトのHugging Faceエコシステムに統合する方法について論じる。
Jupyter NotebookベースのウォークスルーがGitHubで公開されている。
GAIA Search - 前述した原則に従って構築された検索エンジンで、人気の高い4つの大規模テキストコレクションへのアクセスを提供する。
論文 参考訳(メタデータ) (2023-06-02T12:09:59Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - Code Recommendation for Open Source Software Developers [32.181023933552694]
CODERは、オープンソースのソフトウェア開発者のための新しいグラフベースのコードレコメンデーションフレームワークである。
本フレームワークは,プロジェクト内,クロスプロジェクト,コールドスタートレコメンデーションなど,様々な実験環境下での優れた性能を実現する。
論文 参考訳(メタデータ) (2022-10-15T16:40:36Z) - Which contributions count? Analysis of attribution in open source [0.0]
我々は、何千ものプロジェクトを分析することで、オープンソースにおけるコントリビュータ認定モデルを特徴づける。
コミュニティが作成したコントリビューション承認システムによって,アイデア生成やバグ発見といった作業がより可視化されることが分かりました。
論文 参考訳(メタデータ) (2021-03-19T20:14:40Z) - Representation of Developer Expertise in Open Source Software [12.583969739954526]
We use the World of Code infrastructure to extract the complete set of APIs in the file changed by the open source developer。
次に、API、開発者、プロジェクトのベクター表現にDoc2Vecの埋め込みを使用します。
これらの埋め込みがスキル空間の仮定トポロジを反映しているかどうかを評価する。
論文 参考訳(メタデータ) (2020-05-20T16:36:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。