論文の概要: Investigating the Impact of SOLID Design Principles on Machine Learning
Code Understanding
- arxiv url: http://arxiv.org/abs/2402.05337v1
- Date: Thu, 8 Feb 2024 00:44:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 16:57:05.667166
- Title: Investigating the Impact of SOLID Design Principles on Machine Learning
Code Understanding
- Title(参考訳): SOLID設計原則が機械学習コード理解に及ぼす影響の検討
- Authors: Raphael Cabral, Marcos Kalinowski, Maria Teresa Baldassarre, Hugo
Villamizar, Tatiana Escovedo, H\'elio Lopes
- Abstract要約: 我々は,SOLID設計原則が機械学習コード理解に与える影響を検討した。
SOLIDの原則を使わなかった実際の産業用MLコードを再構築した。
その結果、SOLID設計原則の採用がコード理解を改善するという統計的に重要な証拠が得られた。
- 参考スコア(独自算出の注目度): 2.5788518098820337
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: [Context] Applying design principles has long been acknowledged as beneficial
for understanding and maintainability in traditional software projects. These
benefits may similarly hold for Machine Learning (ML) projects, which involve
iterative experimentation with data, models, and algorithms. However, ML
components are often developed by data scientists with diverse educational
backgrounds, potentially resulting in code that doesn't adhere to software
design best practices. [Goal] In order to better understand this phenomenon, we
investigated the impact of the SOLID design principles on ML code
understanding. [Method] We conducted a controlled experiment with three
independent trials involving 100 data scientists. We restructured real
industrial ML code that did not use SOLID principles. Within each trial, one
group was presented with the original ML code, while the other was presented
with ML code incorporating SOLID principles. Participants of both groups were
asked to analyze the code and fill out a questionnaire that included both
open-ended and closed-ended questions on their understanding. [Results] The
study results provide statistically significant evidence that the adoption of
the SOLID design principles can improve code understanding within the realm of
ML projects. [Conclusion] We put forward that software engineering design
principles should be spread within the data science community and considered
for enhancing the maintainability of ML code.
- Abstract(参考訳): [コンテキスト] 設計原則を適用することは、伝統的なソフトウェアプロジェクトにおける理解と保守性に有益であると長年認識されてきた。
これらのメリットは、データ、モデル、アルゴリズムによる反復的な実験を含む機械学習(ML)プロジェクトにも当てはまります。
しかし、MLコンポーネントは様々な学歴を持つデータサイエンティストによってしばしば開発され、ソフトウェア設計のベストプラクティスに従わないコードをもたらす可能性がある。
[目標]この現象をよりよく理解するために,SOLID設計原則がMLコード理解に与える影響を検討した。
方法]100人のデータサイエンティストを含む3つの独立した実験で制御実験を行った。
SOLID原則を使わなかった実産業MLコードを再構築した。
各試験では、1つのグループにオリジナルのMLコードが提示され、もう1つのグループはSOLID原則を取り入れたMLコードが提示された。
両グループの参加者は、コードを分析し、オープンエンドとクローズドエンドの両方の質問を含む質問に答えるよう求められた。
結果]SOLID設計原則の採用により,MLプロジェクトの領域内でのコード理解が向上することを示す統計的に有意な証拠が得られた。
[結論]ソフトウェアエンジニアリング設計の原則をデータサイエンスコミュニティに広めるべきであり、MLコードの保守性を高めることを考慮している。
関連論文リスト
- MachineLearnAthon: An Action-Oriented Machine Learning Didactic Concept [34.6229719907685]
本稿では、異なる分野の学生に包括的にデザインされた革新的教科概念であるMachineLearnAthonフォーマットを紹介する。
この概念の核心はMLの課題であり、現実の問題を解決するために産業用データセットを利用している。
これらはMLパイプライン全体をカバーするもので、データ準備からデプロイメント、評価に至るまで、データのリテラシーと実践的なスキルを促進する。
論文 参考訳(メタデータ) (2024-01-29T16:50:32Z) - Benchmarking and Explaining Large Language Model-based Code Generation:
A Causality-Centric Approach [12.214585409361126]
大規模言語モデル(LLM)ベースのコード生成は複雑で強力なブラックボックスモデルである。
本稿では,プロンプトと生成されたコードの因果グラフに基づく新しい表現を提案する。
我々は,12以上の迅速な調整戦略で3つの人気のあるLCMを研究することで,我々のフレームワークが提供できる洞察について説明する。
論文 参考訳(メタデータ) (2023-10-10T14:56:26Z) - When Do Program-of-Thoughts Work for Reasoning? [51.2699797837818]
本稿では,コードと推論能力の相関性を測定するために,複雑性に富んだ推論スコア(CIRS)を提案する。
具体的には、抽象構文木を用いて構造情報をエンコードし、論理的複雑性を計算する。
コードはhttps://github.com/zjunlp/EasyInstructのEasyInstructフレームワークに統合される。
論文 参考訳(メタデータ) (2023-08-29T17:22:39Z) - KoLA: Carefully Benchmarking World Knowledge of Large Language Models [56.672981891304005]
我々は知識指向LLMアセスメントベンチマーク(KoLA)を構築した。
能力モデリングでは、人間の認知を模倣して知識関連能力の4段階の分類を作成し、19ドルのタスクをカバーしている。
データには、LLMによって事前訓練されたコーパスであるウィキペディアと、継続的に収集される新興コーパスの両方を使用し、目に見えないデータを扱う能力と知識の進化を評価することを目的としています。
論文 参考訳(メタデータ) (2023-06-15T17:20:46Z) - Exploring Self-supervised Logic-enhanced Training for Large Language Models [59.227222647741094]
本稿では,自己指導型ポストトレーニングによる論理的知識の活用の可能性について検討する。
我々はMERItの自己回帰的目的変数を考案し、パラメータサイズが30億から13億の2つのLLM系列、すなわちFLAN-T5とLLaMAと統合する。
2つの挑戦的な論理的推論ベンチマークの結果は、LogicLLMの有効性を示している。
論文 参考訳(メタデータ) (2023-05-23T06:13:10Z) - Large Language Models are Few-Shot Summarizers: Multi-Intent Comment
Generation via In-Context Learning [34.006227676170504]
本研究では,大規模言語モデル(LLM)を用いて,開発者の多様な意図を満たすコメントを生成することの実現可能性について検討する。
2つの大規模なデータセットの実験は、私たちの洞察の理論的根拠を示しています。
論文 参考訳(メタデータ) (2023-04-22T12:26:24Z) - Empowering the trustworthiness of ML-based critical systems through
engineering activities [0.0]
本稿では、信頼できる機械学習(ML)アルゴリズムの全エンジニアリングプロセスについてレビューする。
MLの基本原則から始まり、特に設計を通じて、その信頼を条件づける中核要素を説明します。
論文 参考訳(メタデータ) (2022-09-30T12:42:18Z) - Panoramic Learning with A Standardized Machine Learning Formalism [116.34627789412102]
本稿では,多様なMLアルゴリズムの統一的な理解を提供する学習目的の標準化された方程式を提案する。
また、新しいMLソリューションのメカニック設計のガイダンスも提供し、すべての経験を持つパノラマ学習に向けた有望な手段として機能する。
論文 参考訳(メタデータ) (2021-08-17T17:44:38Z) - Machine Learning Force Fields [54.48599172620472]
機械学習(ML)は、計算化学の多くの進歩を可能にした。
最も有望な応用の1つは、MLベースの力場(FF)の構築である。
本稿では,ML-FFの応用と,それらから得られる化学的知見について概説する。
論文 参考訳(メタデータ) (2020-10-14T13:14:14Z) - Technology Readiness Levels for AI & ML [79.22051549519989]
機械学習システムの開発は、現代的なツールで容易に実行できるが、プロセスは通常急いで、エンドツーエンドで実行される。
エンジニアリングシステムは、高品質で信頼性の高い結果の開発を効率化するために、明確に定義されたプロセスとテスト標準に従います。
我々は、機械学習の開発と展開のための実証されたシステムエンジニアリングアプローチを提案する。
論文 参考訳(メタデータ) (2020-06-21T17:14:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。