Fugu-MT 論文翻訳(概要): Investigating the Impact of SOLID Design Principles on Machine Learning Code Understanding

論文の概要: Investigating the Impact of SOLID Design Principles on Machine Learning Code Understanding

arxiv url: http://arxiv.org/abs/2402.05337v1
Date: Thu, 8 Feb 2024 00:44:45 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-09 16:57:05.667166
Title: Investigating the Impact of SOLID Design Principles on Machine Learning Code Understanding
Title（参考訳）: SOLID設計原則が機械学習コード理解に及ぼす影響の検討
Authors: Raphael Cabral, Marcos Kalinowski, Maria Teresa Baldassarre, Hugo Villamizar, Tatiana Escovedo, H\'elio Lopes
Abstract要約: 我々は,SOLID設計原則が機械学習コード理解に与える影響を検討した。 SOLIDの原則を使わなかった実際の産業用MLコードを再構築した。その結果、SOLID設計原則の採用がコード理解を改善するという統計的に重要な証拠が得られた。
参考スコア（独自算出の注目度）: 2.5788518098820337
License: http://creativecommons.org/licenses/by/4.0/
Abstract: [Context] Applying design principles has long been acknowledged as beneficial for understanding and maintainability in traditional software projects. These benefits may similarly hold for Machine Learning (ML) projects, which involve iterative experimentation with data, models, and algorithms. However, ML components are often developed by data scientists with diverse educational backgrounds, potentially resulting in code that doesn't adhere to software design best practices. [Goal] In order to better understand this phenomenon, we investigated the impact of the SOLID design principles on ML code understanding. [Method] We conducted a controlled experiment with three independent trials involving 100 data scientists. We restructured real industrial ML code that did not use SOLID principles. Within each trial, one group was presented with the original ML code, while the other was presented with ML code incorporating SOLID principles. Participants of both groups were asked to analyze the code and fill out a questionnaire that included both open-ended and closed-ended questions on their understanding. [Results] The study results provide statistically significant evidence that the adoption of the SOLID design principles can improve code understanding within the realm of ML projects. [Conclusion] We put forward that software engineering design principles should be spread within the data science community and considered for enhancing the maintainability of ML code.
Abstract（参考訳）: [コンテキスト] 設計原則を適用することは、伝統的なソフトウェアプロジェクトにおける理解と保守性に有益であると長年認識されてきた。これらのメリットは、データ、モデル、アルゴリズムによる反復的な実験を含む機械学習(ML)プロジェクトにも当てはまります。しかし、MLコンポーネントは様々な学歴を持つデータサイエンティストによってしばしば開発され、ソフトウェア設計のベストプラクティスに従わないコードをもたらす可能性がある。 [目標]この現象をよりよく理解するために,SOLID設計原則がMLコード理解に与える影響を検討した。方法]100人のデータサイエンティストを含む3つの独立した実験で制御実験を行った。 SOLID原則を使わなかった実産業MLコードを再構築した。各試験では、1つのグループにオリジナルのMLコードが提示され、もう1つのグループはSOLID原則を取り入れたMLコードが提示された。両グループの参加者は、コードを分析し、オープンエンドとクローズドエンドの両方の質問を含む質問に答えるよう求められた。結果]SOLID設計原則の採用により,MLプロジェクトの領域内でのコード理解が向上することを示す統計的に有意な証拠が得られた。 [結論]ソフトウェアエンジニアリング設計の原則をデータサイエンスコミュニティに広めるべきであり、MLコードの保守性を高めることを考慮している。

関連論文リスト

CodeSimpleQA: Scaling Factuality in Code Large Language Models [55.705748501461294]
本稿では,コード関連質問への回答において,LLMの実際の精度を評価するための総合的なベンチマークであるCodeSimpleQAを提案する。また,66万サンプルの大規模インストラクションコーパスであるCodeSimpleQA-Instructを作成し,教師付き微調整と強化学習を組み合わせたポストトレーニングフレームワークを開発した。
論文参考訳（メタデータ） (2025-12-22T14:27:17Z)
From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence [150.3696990310269]
大規模言語モデル(LLM)は、自然言語記述を直接関数コードに変換することによって、自動ソフトウェア開発を変革した。コードLLMに関する総合的な合成と実践的ガイド(一連の解析および探索実験)を提供する。一般LLM(GPT-4, Claude, LLaMA)とコード特殊化LLM(StarCoder, Code LLaMA, DeepSeek-Coder, QwenCoder)のコード機能の解析を行う。
論文参考訳（メタデータ） (2025-11-23T17:09:34Z)
Is Compression Really Linear with Code Intelligence? [60.123628177110206]
textitFormat Annealingは、事前訓練されたモデルの本質的な能力を同等に評価するために設計された、軽量で透明なトレーニング手法である。我々の経験的結果は、測定されたコードインテリジェンスとビット・パー・キャラクタ(BPC)の基本的な対数関係を明らかにする。私たちの研究は、コードインテリジェンスの開発における圧縮の役割をより微妙に理解し、コードドメインにおける堅牢な評価フレームワークに貢献します。
論文参考訳（メタデータ） (2025-05-16T16:59:14Z)
Combining physics education and machine learning research to measure evidence of students' mechanistic sensemaking [3.82216862698789]
学習者の機械的感覚を解析するMLツールの設計の進歩について報告する。本ツールのパイロットテストについて,異なる言語エンコーダを用いた3つのバージョンで記述し,簡単な概念的質問に対する大学生の回答から明らかな意味を解析した。
論文参考訳（メタデータ） (2025-03-19T18:49:21Z)
Evaluating the Application of SOLID Principles in Modern AI Framework Architectures [0.0]
この研究は、現代のAIフレームワーク、特にスキキットラーンがSOLID設計原則にどの程度準拠しているかを評価する。それぞれのフレームワークのドキュメンテーション、ソースコード、アーキテクチャコンポーネントを調べて、これらの原則への準拠性を評価しました。
論文参考訳（メタデータ） (2025-03-18T00:37:23Z)
OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models [70.72097493954067]
コードのための大規模言語モデル(LLM)は、コード生成、推論タスク、エージェントシステムなど、さまざまな領域で必須になっている。オープンアクセスのコード LLM はプロプライエタリなモデルの性能レベルに近づきつつあるが、高品質なコード LLM は依然として限られている。トップクラスのコードLLMであるOpenCoderは、主要なモデルに匹敵するパフォーマンスを達成するだけでなく、研究コミュニティの"オープンクックブック"としても機能します。
論文参考訳（メタデータ） (2024-11-07T17:47:25Z)
What's Wrong with Your Code Generated by Large Language Models? An Extensive Study [80.18342600996601]
大規模言語モデル(LLM)は、標準解に比べて短いがより複雑なコードを生成する。 3つのカテゴリと12のサブカテゴリを含む誤ったコードに対するバグの分類を開発し、一般的なバグタイプに対する根本原因を分析する。そこで本研究では,LLMがバグタイプやコンパイラフィードバックに基づいて生成したコードを批判し,修正することのできる,自己批判を導入した新たな学習自由反復手法を提案する。
論文参考訳（メタデータ） (2024-07-08T17:27:17Z)
A Study on Developer Behaviors for Validating and Repairing LLM-Generated Code Using Eye Tracking and IDE Actions [13.58143103712]
GitHub Copilotは、LLM(Big Language Model)ベースのコード生成ツールである。本稿では,Copilotが生成したコードを開発者がどのように検証し,修復するかを検討する。コードの存在を認識したことにより、パフォーマンスの向上、検索努力の向上、コパイロットの使用頻度の向上、認知作業負荷の向上につながった。
論文参考訳（メタデータ） (2024-05-25T06:20:01Z)
MachineLearnAthon: An Action-Oriented Machine Learning Didactic Concept [34.6229719907685]
本稿では、異なる分野の学生に包括的にデザインされた革新的教科概念であるMachineLearnAthonフォーマットを紹介する。この概念の核心はMLの課題であり、現実の問題を解決するために産業用データセットを利用している。これらはMLパイプライン全体をカバーするもので、データ準備からデプロイメント、評価に至るまで、データのリテラシーと実践的なスキルを促進する。
論文参考訳（メタデータ） (2024-01-29T16:50:32Z)
When Do Program-of-Thoughts Work for Reasoning? [51.2699797837818]
本稿では,コードと推論能力の相関性を測定するために,複雑性に富んだ推論スコア(CIRS)を提案する。具体的には、抽象構文木を用いて構造情報をエンコードし、論理的複雑性を計算する。コードはhttps://github.com/zjunlp/EasyInstructのEasyInstructフレームワークに統合される。
論文参考訳（メタデータ） (2023-08-29T17:22:39Z)
Large Language Models are Few-Shot Summarizers: Multi-Intent Comment Generation via In-Context Learning [34.006227676170504]
本研究では,大規模言語モデル(LLM)を用いて,開発者の多様な意図を満たすコメントを生成することの実現可能性について検討する。 2つの大規模なデータセットの実験は、私たちの洞察の理論的根拠を示しています。
論文参考訳（メタデータ） (2023-04-22T12:26:24Z)
Empowering the trustworthiness of ML-based critical systems through engineering activities [0.0]
本稿では、信頼できる機械学習(ML)アルゴリズムの全エンジニアリングプロセスについてレビューする。 MLの基本原則から始まり、特に設計を通じて、その信頼を条件づける中核要素を説明します。
論文参考訳（メタデータ） (2022-09-30T12:42:18Z)
Panoramic Learning with A Standardized Machine Learning Formalism [116.34627789412102]
本稿では,多様なMLアルゴリズムの統一的な理解を提供する学習目的の標準化された方程式を提案する。また、新しいMLソリューションのメカニック設計のガイダンスも提供し、すべての経験を持つパノラマ学習に向けた有望な手段として機能する。
論文参考訳（メタデータ） (2021-08-17T17:44:38Z)
Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文参考訳（メタデータ） (2021-01-24T05:40:29Z)
Machine Learning Force Fields [54.48599172620472]
機械学習(ML)は、計算化学の多くの進歩を可能にした。最も有望な応用の1つは、MLベースの力場(FF)の構築である。本稿では,ML-FFの応用と,それらから得られる化学的知見について概説する。
論文参考訳（メタデータ） (2020-10-14T13:14:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。