論文の概要: Understanding Open Source Contributor Profiles in Popular Machine Learning Libraries
- arxiv url: http://arxiv.org/abs/2406.05685v1
- Date: Sun, 9 Jun 2024 08:10:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 18:36:48.506582
- Title: Understanding Open Source Contributor Profiles in Popular Machine Learning Libraries
- Title(参考訳): 人気のある機械学習ライブラリにおけるオープンソースコントリビュータプロファイルの理解
- Authors: Jiawen Liu, Haoxiang Zhang, Ying Zou,
- Abstract要約: MLライブラリ内のコントリビュータプロファイルを識別することで,機械学習コントリビュータの理解を目指す。
6つの有名なMLライブラリから7,640人のコントリビュータを調査して、Core-Afterhour、Core-Workhour、Peripheral-Afterhour、Peripheral-Workhourの4つのコントリビュータプロファイルを特定しました。
1) プロジェクトエクスペリエンス、オーサリングファイル、コラボレーション、地理的位置は、すべてのプロファイルの重要な特徴です。 2) コアのコントリビュータは、周辺プロファイルと比較してOSSのエンゲージメントが著しく異なること、3) コントリビュータの作業好みとワークロードのコントリビュータがプロジェクトの人気に大きく影響すること、4) 長期的なコントリビュータが、より小さく、一定で、バランスが取れ、技術的なコントリビューションが少ないこと、などです。
- 参考スコア(独自算出の注目度): 3.0980895658489995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the increasing popularity of machine learning (ML), many open-source software (OSS) contributors are attracted to developing and adopting ML approaches. Comprehensive understanding of ML contributors is crucial for successful ML OSS development and maintenance. Without such knowledge, there is a risk of inefficient resource allocation and hindered collaboration in ML OSS projects. Existing research focuses on understanding the difficulties and challenges perceived by ML contributors by user surveys. There is a lack of understanding of ML contributors based on their activities tracked from software repositories. In this paper, we aim to understand ML contributors by identifying contributor profiles in ML libraries. We further study contributors' OSS engagement from three aspects: workload composition, work preferences, and technical importance. By investigating 7,640 contributors from 6 popular ML libraries (TensorFlow, PyTorch, Keras, MXNet, Theano, and ONNX), we identify four contributor profiles: Core-Afterhour, Core-Workhour, Peripheral-Afterhour, and Peripheral-Workhour. We find that: 1) project experience, authored files, collaborations, and geographical location are significant features of all profiles; 2) contributors in Core profiles exhibit significantly different OSS engagement compared to Peripheral profiles; 3) contributors' work preferences and workload compositions significantly impact project popularity; 4) long-term contributors evolve towards making fewer, constant, balanced and less technical contributions.
- Abstract(参考訳): 機械学習(ML)の人気が高まり、多くのオープンソースソフトウェア(OSS)コントリビュータがMLアプローチの開発と採用に興味を持っている。
MLコントリビュータの全体的な理解は、ML OSSの開発とメンテナンスの成功に不可欠である。
このような知識がなければ、ML OSSプロジェクトで非効率なリソース割り当てとコラボレーションを妨げるリスクがある。
既存の研究は、ユーザ調査によってMLコントリビュータが認識する困難と課題を理解することに焦点を当てている。
ソフトウェアリポジトリから追跡されたアクティビティに基づいたMLコントリビュータの理解の欠如。
本稿では,MLライブラリのコントリビュータプロファイルを識別することで,MLコントリビュータを理解することを目的とする。
さらに、ワークロードの構成、仕事の好み、技術的重要性の3つの側面から、コントリビュータのOSSエンゲージメントについて研究する。
6つの有名なMLライブラリ(TensorFlow、PyTorch、Keras、MXNet、Theano、ONNX)から7,640人のコントリビュータを調査して、Core-Afterhour、Core-Workhour、Peripheral-Afterhour、Peripheral-Workhourの4つのコントリビュータプロファイルを特定した。
以下に示す。
1) プロジェクト体験,登録ファイル,共同作業,地理的位置は,すべてのプロファイルの重要な特徴である。
2)コアプロファイルのコントリビュータは,周辺プロファイルと比較してOSSエンゲージメントが著しく異なる。
3)コントリビュータの作業好みと作業負荷構成がプロジェクトの人気に大きく影響します。
4) 長期的なコントリビュータは、少ない、一定の、バランスのとれた、少ない技術的コントリビューションへと進化します。
関連論文リスト
- What's Wrong with Your Code Generated by Large Language Models? An Extensive Study [80.18342600996601]
大規模言語モデル(LLM)は、標準解に比べて短いがより複雑なコードを生成する。
3つのカテゴリと12のサブカテゴリを含む誤ったコードに対するバグの分類を開発し、一般的なバグタイプに対する根本原因を分析する。
そこで本研究では,LLMがバグタイプやコンパイラフィードバックに基づいて生成したコードを批判し,修正することのできる,自己批判を導入した新たな学習自由反復手法を提案する。
論文 参考訳(メタデータ) (2024-07-08T17:27:17Z) - Machine learning in business process management: A systematic literature review [0.0]
機械学習(ML)は、明示的にプログラムすることなく、データに基づいてコンピュータプログラムを作成するアルゴリズムを提供する。
MLを使用する3つの頻繁な例は、予測による意思決定のサポート、正確なプロセスモデルの検出、リソース割り当ての改善である。
この研究は、BPMでMLがどのように使われているかについて、初めての徹底的なレビューである。
論文 参考訳(メタデータ) (2024-05-26T01:12:24Z) - Characterization of Large Language Model Development in the Datacenter [55.9909258342639]
大きな言語モデル(LLM)は、いくつかの変換タスクにまたがって素晴らしいパフォーマンスを示している。
しかし,大規模クラスタ資源を効率よく利用してLCMを開発することは容易ではない。
我々は,GPUデータセンタAcmeから収集した6ヶ月のLDM開発ワークロードの詳細な評価を行った。
論文 参考訳(メタデータ) (2024-03-12T13:31:14Z) - InfuserKI: Enhancing Large Language Models with Knowledge Graphs via
Infuser-Guided Knowledge Integration [61.554209059971576]
大規模言語モデル(LLM)は、様々な領域にまたがる顕著なオープンジェネレーション機能を示している。
新しい知識を注入すると、以前に獲得した知識を忘れるリスクが生じる。
Infuser-Guided Knowledge Integration フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-18T03:36:26Z) - Knowledge Plugins: Enhancing Large Language Models for Domain-Specific
Recommendations [50.81844184210381]
本稿では,大規模言語モデルをDOmain固有のKnowledgEで拡張し,実践的アプリケーション,すなわちDOKEの性能を向上させるためのパラダイムを提案する。
このパラダイムはドメイン知識抽出器に依存し,1)タスクに効果的な知識を準備すること,2)特定のサンプルごとに知識を選択すること,3)LLMで理解可能な方法で知識を表現すること,の3つのステップで動作する。
論文 参考訳(メタデータ) (2023-11-16T07:09:38Z) - Beyond Factuality: A Comprehensive Evaluation of Large Language Models
as Knowledge Generators [78.63553017938911]
大規模言語モデル(LLM)は、下流の知識集約タスクのための情報検索技術より優れている。
しかし、コミュニティの懸念は、この無検閲の知識を使用することの事実と潜在的意味について多岐にわたる。
本研究では,6つの重要な視点から生成した知識を評価するために設計されたCONNERを紹介する。
論文 参考訳(メタデータ) (2023-10-11T08:22:37Z) - Identifying Concerns When Specifying Machine Learning-Enabled Systems: A
Perspective-Based Approach [1.2184324428571227]
PerSpecMLは、ML対応システムを指定するためのパースペクティブベースのアプローチである。
MLや非MLコンポーネントを含むどの属性がシステム全体の品質に寄与するかを、実践者が特定するのに役立つ。
論文 参考訳(メタデータ) (2023-09-14T18:31:16Z) - MLCopilot: Unleashing the Power of Large Language Models in Solving
Machine Learning Tasks [31.733088105662876]
我々は、新しいフレームワークを導入することで、機械学習と人間の知識のギャップを埋めることを目指している。
本稿では、構造化された入力を理解するためのLLMの能力を拡張し、新しいMLタスクを解くための徹底的な推論を行う可能性を示す。
論文 参考訳(メタデータ) (2023-04-28T17:03:57Z) - Towards Perspective-Based Specification of Machine Learning-Enabled
Systems [1.3406258114080236]
本稿では、ML対応システムを特定するための視点に基づくアプローチに向けた取り組みについて述べる。
このアプローチでは、目標、ユーザエクスペリエンス、インフラストラクチャ、モデル、データという5つの視点にグループ化された45のML関心事のセットを分析する。
本論文の主な貢献は、ML対応システムを特定するのに役立つ2つの新しいアーティファクトを提供することである。
論文 参考訳(メタデータ) (2022-06-20T13:09:23Z) - Characterizing and Detecting Mismatch in Machine-Learning-Enabled
Systems [1.4695979686066065]
機械学習システムの開発と展開は依然として課題だ。
本論文では,エンドツーエンドのML対応システム開発における知見とその意義について報告する。
論文 参考訳(メタデータ) (2021-03-25T19:40:29Z) - Understanding the Usability Challenges of Machine Learning In
High-Stakes Decision Making [67.72855777115772]
機械学習(ML)は、多種多様な成長を続ける一連のドメインに適用されている。
多くの場合、MLやデータサイエンスの専門知識を持たないドメインの専門家は、ML予測を使用してハイステークな意思決定を行うように求められます。
児童福祉スクリーニングにおけるMLユーザビリティの課題について,児童福祉スクリーニング者との一連のコラボレーションを通じて検討する。
論文 参考訳(メタデータ) (2021-03-02T22:50:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。