論文の概要: Governance Matters: Lessons from Restructuring the data.table OSS Project
- arxiv url: http://arxiv.org/abs/2601.13466v1
- Date: Mon, 19 Jan 2026 23:41:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.101593
- Title: Governance Matters: Lessons from Restructuring the data.table OSS Project
- Title(参考訳): ガバナンスの問題: Data.table OSSプロジェクトの再構築から学んだこと
- Authors: Pedro Oliveira, Doris Amoakohene, Toby Hocking, Marco Gerosa, Igor Steinmacher,
- Abstract要約: Data.tableは、プロダクション分析パイプラインで広く採用されている高性能Rパッケージである。
改革前、Data.tableは未解決の問題とプルリクエストのバックログの増大に直面した。
改革後、新しいコントリビュータの採用が200%増加し、プルリクエストの解決時間が700日以上から1週間未満に減少し、コントリビュータの保持率が3倍になった。
- 参考スコア(独自算出の注目度): 7.308586458018547
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Open source software (OSS) forms the backbone of industrial data workflows and enterprise systems. However, many OSS projects face operational risks due to informal or centralized governance. This paper presents a practical case study of data.table, a high-performance R package widely adopted in production analytics pipelines, which underwent a community-led governance reform to address scalability and sustainability concerns. Before the reform, data.table faced a growing backlog of unresolved issues and open pull requests, unclear contributor pathways, and bottlenecks caused by reliance on a single core maintainer. In response, the community initiated a redesign of its governance structure. In this paper, we evaluated the impact of this transition through a mixed-methods approach, combining a contributor survey (n=17) with mining project repository data. Our results show that following the reform, the project experienced a 200% increase in new contributor recruitment, a drop in pull request resolution time from over 700 days to under a week, and a 3x increase in contributor retention. Community sentiment improved around transparency, onboarding, and project momentum, though concerns around fairness and conflict resolution remain. This case study provides practical guidance for maintainers, companies, and foundations seeking to enhance OSS governance.
- Abstract(参考訳): オープンソースソフトウェア(OSS)は、産業データワークフローとエンタープライズシステムのバックボーンを形成する。
しかし、多くのOSSプロジェクトは非公式または中央集権的なガバナンスのために運用上のリスクに直面している。
本稿では,生産分析パイプラインに広く採用されている高性能RパッケージであるData.tableの実践事例について述べる。
改革前、Data.tableは未解決の問題とオープンプルリクエスト、不明瞭なコントリビュータパス、単一コアメンテナへの依存によるボトルネックのバックログの増大に直面していた。
これに応えて、コミュニティはガバナンス構造の再設計を開始した。
本稿では, コントリビュータ調査(n=17)とマイニングプロジェクトリポジトリデータを組み合わせることで, 混合メソッドアプローチによる移行の影響を評価した。
その結果,新たなコントリビュータの採用が200%増加し,プルリクエストの解決時間が700日以上から1週間未満に短縮され,コントリビュータの保持率が3倍になった。
透明性、乗船、プロジェクトの勢いに関するコミュニティの感情は改善されたが、公平性や紛争解決に関する懸念は残る。
このケーススタディは、OSSガバナンスの強化を目指すメンテナ、企業、財団に対して実践的なガイダンスを提供する。
関連論文リスト
- The Case for Strategic Data Stewardship: Re-imagining Data Governance to Make Responsible Data Re-use Possible [0.0]
本稿では,公共価値のためのデータ活性化を目的とした補助的機関機能として,戦略的データ管理を提案する。
内向きに見える伝統的なスチュワードシップとは異なり、戦略的データスチュワードシップはクロスセクターの再利用の実現に重点を置いている。
基本原則、機能、能力について概説し、コンテキストを越えた採用をサポートするための実践的なData Stewardship Canvasを紹介している。
論文 参考訳(メタデータ) (2026-01-10T21:22:50Z) - Process-based Indicators of Vulnerability Re-Introducing Code Changes: An Exploratory Case Study [2.204918347869259]
この作業は、脆弱性の再導入の理解と緩和におけるコードの変更とともに、プロセスメトリクスの重要な役割を強調します。
我々のアプローチは、再導入が一つの孤立した行動の結果であることは滅多にないが、累積的な開発活動や社会技術的条件から生じることを強調している。
論文 参考訳(メタデータ) (2025-10-30T16:45:36Z) - TACO: Think-Answer Consistency for Optimized Long-Chain Reasoning and Efficient Data Learning via Reinforcement Learning in LVLMs [50.820065021136024]
DeepSeek R1には、大規模言語モデル(LLM)のためのかなり高度な複雑な推論がある。
最近の手法は、R1の推論能力をマルチモーダルな設定で再現しようと試みている。
視覚推論のための新しい強化学習アルゴリズムTACOを提案する。
論文 参考訳(メタデータ) (2025-05-27T06:30:48Z) - Fixing Outside the Box: Uncovering Tactics for Open-Source Security Issue Management [9.990683064304207]
我々はOSSプロジェクトにおける脆弱性修復戦術(RT)の分類に関する総合的研究を行う。
44個の異なるRTの階層型分類法を開発し,その有効性とコストを評価した。
私たちの発見は、代替ライブラリの使用や脆弱性の回避など、コミュニティ主導の戦略に大きく依存していることを強調しています。
論文 参考訳(メタデータ) (2025-03-30T08:24:58Z) - A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond [88.5807076505261]
大規模推論モデル (LRM) は, 推論中におけるチェーン・オブ・ソート (CoT) の推論長を拡大することにより, 高い性能向上を示した。
懸念が高まっているのは、過度に長い推論の痕跡を生み出す傾向にある。
この非効率性は、トレーニング、推論、現実のデプロイメントに重大な課題をもたらす。
論文 参考訳(メタデータ) (2025-03-27T15:36:30Z) - Efficient Safety Alignment of Large Language Models via Preference Re-ranking and Representation-based Reward Modeling [84.00480999255628]
大規模言語モデル(LLM)の安全性アライメントのための強化学習アルゴリズムは,分散シフトの課題に直面している。
現在のアプローチでは、ターゲットポリシーからのオンラインサンプリングを通じてこの問題に対処するのが一般的である。
モデル固有の安全判断能力を活用して報酬信号を抽出する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-13T06:40:34Z) - Do We Need to Verify Step by Step? Rethinking Process Supervision from a Theoretical Perspective [59.61868506896214]
標準的なデータカバレッジの仮定では、強化学習はプロセスの監督よりも統計的に難しいものではない。
任意のポリシーの利点関数が最適なプロセス報酬モデルとして機能することを証明する。
論文 参考訳(メタデータ) (2025-02-14T22:21:56Z) - Trustworthiness in Retrieval-Augmented Generation Systems: A Survey [59.26328612791924]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の開発において、急速に重要なパラダイムへと成長してきた。
本稿では,RAGシステムの信頼性を,事実性,堅牢性,公正性,透明性,説明責任,プライバシの6つの面で評価する統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2024-09-16T09:06:44Z) - Using Process Mining to Improve Digital Service Delivery [2.987116048422597]
カナダ政府における人事安全検査のためのプロセスマイニング(PM)の事例研究について述べる。
私たちは顧客(プロセス時間)と組織(コスト)の観点から考えます。
介入前分析では、初期ボトルネックを指摘し、介入後の分析では、介入の影響と改善のための残りの領域を特定した。
論文 参考訳(メタデータ) (2024-08-23T15:28:47Z) - Ownership in the Hands of Accountability at Brightsquid -- A Case Study
and a Developer Survey [2.594420805049218]
新型コロナウイルスのパンデミックにより、デジタルヘルスソリューションの採用が加速した。
これは、ソフトウェア開発チームが市場のニーズと需要に迅速に適応する上で、重大な課題を提示しました。
これらの課題に対処するためには、製品管理チームは、パンデミックの要求に応えるために、自分たちのアプローチをソフトウェア開発に適応させなければなりませんでした。
論文 参考訳(メタデータ) (2023-08-23T22:39:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。