論文の概要: How Do Community Smells Influence Self-Admitted Technical Debt in Machine Learning Projects?
- arxiv url: http://arxiv.org/abs/2506.15884v1
- Date: Wed, 18 Jun 2025 21:18:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:04.857484
- Title: How Do Community Smells Influence Self-Admitted Technical Debt in Machine Learning Projects?
- Title(参考訳): コミュニティ・スメルズは機械学習プロジェクトにおける自己申告技術的負債にどのように影響するか?
- Authors: Shamse Tasnim Cynthia, Nuri Almarimi, Banani Roy,
- Abstract要約: 本研究では,オープンソース機械学習(ML)プロジェクトにおけるコミュニティの匂いの出現状況と,SATD(Self-Admitted Technical Debt)との関係について検討した。
コミュニティの匂いが広まっており、小規模、中型、大規模プロジェクト間で異なる分布パターンが示されることがわかった。
ラジオサイレンスや組織サイロのような特定の匂いは、高いSATD発生と強く相関している。
- 参考スコア(独自算出の注目度): 1.971759811837406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Community smells reflect poor organizational practices that often lead to socio-technical issues and the accumulation of Self-Admitted Technical Debt (SATD). While prior studies have explored these problems in general software systems, their interplay in machine learning (ML)-based projects remains largely underexamined. In this study, we investigated the prevalence of community smells and their relationship with SATD in open-source ML projects, analyzing data at the release level. First, we examined the prevalence of ten community smell types across the releases of 155 ML-based systems and found that community smells are widespread, exhibiting distinct distribution patterns across small, medium, and large projects. Second, we detected SATD at the release level and applied statistical analysis to examine its correlation with community smells. Our results showed that certain smells, such as Radio Silence and Organizational Silos, are strongly correlated with higher SATD occurrences. Third, we considered the six identified types of SATD to determine which community smells are most associated with each debt category. Our analysis revealed authority- and communication-related smells often co-occur with persistent code and design debt. Finally, we analyzed how the community smells and SATD evolve over the releases, uncovering project size-dependent trends and shared trajectories. Our findings emphasize the importance of early detection and mitigation of socio-technical issues to maintain the long-term quality and sustainability of ML-based systems.
- Abstract(参考訳): コミュニティの臭いは、しばしば社会技術的問題や自称技術的負債(SATD)の蓄積につながる組織的なプラクティスの悪さを反映している。
これまでの研究では、これらの問題を一般的なソフトウェアシステムで調べてきたが、機械学習(ML)ベースのプロジェクトにおけるそれらの相互作用は、大半が過小評価されている。
本研究では,オープンソースMLプロジェクトにおけるコミュニティの匂いの頻度とSATDとの関係について検討し,リリースレベルでのデータ分析を行った。
まず,155のMLベースシステムのリリースにおいて,コミュニティの匂いの種類が10種類あることを調査し,コミュニティの匂いが広まっており,小・中・大規模プロジェクト間で異なる分布パターンが見られた。
第2に、SATDを放出レベルで検出し、統計分析を適用し、コミュニティの匂いとの相関について検討した。
その結果,Radio SilenceやOrganizational Silosなどの匂いはSATDの発生量と強く相関していることがわかった。
第3に,これら6種類のSATDについて,それぞれの債務カテゴリーに最も関連性があるコミュニティの臭いを識別する検討を行った。
私たちの分析では、権威とコミュニケーションに関する臭いが、しばしば永続的なコードと設計の負債と一致していることがわかりました。
最後に、コミュニティの匂いとSATDがリリースを通じてどのように進化するかを分析し、プロジェクトのサイズに依存したトレンドと共有軌跡を明らかにした。
本研究は,MLベースのシステムの長期的品質と持続可能性を維持するために,社会技術課題の早期発見と緩和の重要性を強調した。
関連論文リスト
- How Do Communities of ML-Enabled Systems Smell? A Cross-Sectional Study on the Prevalence of Community Smells [13.840177755312665]
NICHEデータセットからの188個のレポジトリについて,CADOCSツールを用いて実験を行った。
プリマ・ドナ・エフェクトやシェア・ヴィラニーのような特定の匂いは、ラジオ・サイレンスやオーガナイゼーション・スキルミッシュなどと比べて、時間とともに広まり、変動することがわかった。
論文 参考訳(メタデータ) (2025-04-24T10:23:37Z) - Generalized Out-of-Distribution Detection and Beyond in Vision Language Model Era: A Survey [107.08019135783444]
アウト・オブ・ディストリビューション(OOD)サンプルは、機械学習システムの安全性を保証するために不可欠である。
その他の問題としては、異常検出(AD)、新規検出(ND)、オープンセット認識(OSR)、異常検出(OD)などがある。
論文 参考訳(メタデータ) (2024-07-31T17:59:58Z) - A Comprehensive Survey of Contamination Detection Methods in Large Language Models [68.10605098856087]
近年のLarge Language Models(LLM)の台頭に伴い、多くの新しい機会が生まれつつありますが、新たな課題もあります。
LLMの性能は、データへの以前の露出のために、少なくとも部分的には高性能である可能性があるため、もはや信頼性が低い可能性がある。
この制限は、NLPの分野での実際の能力向上を阻害するが、汚染を効率的に検出する方法が不足している。
論文 参考訳(メタデータ) (2024-03-31T14:32:02Z) - VEC-SBM: Optimal Community Detection with Vectorial Edges Covariates [67.51637355249986]
本稿では,コミュニティ検出のための統計フレームワークであるブロックモデル(SBM)の拡張について検討する。
本稿では,反復的改良手法に基づく新しいアルゴリズムを提案し,潜在コミュニティを最適に回復することを示す。
コミュニティ検出プロセスにおいて,エッジ側情報を活用する付加価値を厳格に評価する。
論文 参考訳(メタデータ) (2024-02-29T02:19:55Z) - Individual context-free online community health indicators fail to identify open source software sustainability [3.192308005611312]
私たちは1年間に38のオープンソースプロジェクトを監視しました。
この期間に計画は放棄されず、計画された1つのプロジェクトのみが閉鎖された。
結果は極めて異質で、ドキュメント間の共通性はほとんどなく、イシューやコードコントリビューションに対するレスポンス時間の平均、資金/スタッフリソースが利用可能でした。
論文 参考訳(メタデータ) (2023-09-21T14:41:41Z) - Continuous Integration and Software Quality: A Causal Explanatory Study [0.46040036610482665]
継続的インテグレーション(CI)は、チーム間のコード統合のコストとリスクを低減することを目的とした、ソフトウェアエンジニアリングのプラクティスである。
最近の実証研究により、CIとソフトウェア品質(SQ)の関連性が確認されている。
論文 参考訳(メタデータ) (2023-09-18T23:10:34Z) - Locating Community Smells in Software Development Processes Using
Higher-Order Network Centralities [38.72139150402261]
コミュニティの臭いは、ソフトウェア開発チームのインタラクションにおいて、ソフトウェアを作る能力を阻害する負のパターンである。
現在のアプローチは、ソフトウェアチームの相互作用構造の静的ネットワーク表現を分析して、コミュニティの臭いを検出することを目的としている。
我々は、高階ネットワークモデルが、そのような隠れパターンと複雑な関係を明らかにする堅牢な手段を提供することを示した。
論文 参考訳(メタデータ) (2023-09-14T06:48:15Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Assessing Hidden Risks of LLMs: An Empirical Study on Robustness,
Consistency, and Credibility [37.682136465784254]
我々は、ChatGPT、LLaMA、OPTを含む、主流の大規模言語モデル(LLM)に100万以上のクエリを実行します。
入力が極端に汚染された場合でも、ChatGPTは正しい答えを得ることができる。
そこで本研究では,LCMによる評価において,そのようなデータの有効性を大まかに決定する新たな指標を提案する。
論文 参考訳(メタデータ) (2023-05-15T15:44:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。