論文の概要: Design Smells in Deep Learning Programs: An Empirical Study
- arxiv url: http://arxiv.org/abs/2107.02279v2
- Date: Wed, 7 Jul 2021 13:50:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-09 13:24:15.168898
- Title: Design Smells in Deep Learning Programs: An Empirical Study
- Title(参考訳): 深層学習プログラムにおけるデザインの匂い--経験的研究
- Authors: Amin Nikanjam, Foutse Khomh
- Abstract要約: DL(Deep Learning)プログラムにおける設計の臭いは、DLコンポーネントの開発時に行われる設計や構成上の判断が貧弱である。
我々は、人気のあるDLアーキテクチャ、すなわちディープフィードフォワードニューラルネットワークのための8つの設計臭いのカタログを提示する。
- 参考スコア(独自算出の注目度): 9.112172220055431
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nowadays, we are witnessing an increasing adoption of Deep Learning (DL)
based software systems in many industries. Designing a DL program requires
constructing a deep neural network (DNN) and then training it on a dataset.
This process requires that developers make multiple architectural (e.g., type,
size, number, and order of layers) and configuration (e.g., optimizer,
regularization methods, and activation functions) choices that affect the
quality of the DL models, and consequently software quality. An under-specified
or poorly-designed DL model may train successfully but is likely to perform
poorly when deployed in production. Design smells in DL programs are poor
design and-or configuration decisions taken during the development of DL
components, that are likely to have a negative impact on the performance (i.e.,
prediction accuracy) and then quality of DL based software systems. In this
paper, we present a catalogue of 8 design smells for a popular DL architecture,
namely deep Feedforward Neural Networks which is widely employed in industrial
applications. The design smells were identified through a review of the
existing literature on DL design and a manual inspection of 659 DL programs
with performance issues and design inefficiencies. The smells are specified by
describing their context, consequences, and recommended refactorings. To
provide empirical evidence on the relevance and perceived impact of the
proposed design smells, we conducted a survey with 81 DL developers. In
general, the developers perceived the proposed design smells as reflective of
design or implementation problems, with agreement levels varying between 47\%
and 68\%.
- Abstract(参考訳): 現在、多くの業界でディープラーニング(DL)ベースのソフトウェアシステムの採用が増えているのを目撃しています。
DLプログラムを設計するには、ディープニューラルネットワーク(DNN)を構築し、データセットでそれをトレーニングする必要がある。
このプロセスでは、開発者は複数のアーキテクチャ(例えば、タイプ、サイズ、数、レイヤの順序)と構成(例えば、最適化、正規化メソッド、アクティベーション関数)を選択してDLモデルの品質に影響を与え、その結果、ソフトウェアの品質を決定する必要がある。
未定または設計のdlモデルは、うまくトレーニングできるが、本番環境に配備されると性能が低下する可能性がある。
dlプログラムにおける設計の臭いは、dlコンポーネントの開発中に取られた設計および/または構成上の判断が貧弱であり、dlベースのソフトウェアシステムの品質(すなわち予測精度)に悪影響を及ぼす可能性が高い。
本稿では,産業用途に広く用いられている,一般的なdlアーキテクチャであるディープフィードフォワードニューラルネットワークのための8種類の設計臭のカタログを提案する。
DL設計に関する既存の文献のレビューと、659個のDLプログラムを手動で検査し、性能問題と設計の非効率性について検討した。
臭いは、そのコンテキスト、結果、推奨リファクタリングを説明することで特定されます。
提案したデザインの匂いが与える影響に関する実証的証拠を提供するため,81人のDL開発者を対象に調査を行った。
一般に、開発者は提案された設計の臭いが設計や実装の問題の反映であると認識し、合意レベルは47 %から68 %の間である。
関連論文リスト
- Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。
本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文 参考訳(メタデータ) (2024-10-22T06:43:28Z) - What matters when building vision-language models? [52.8539131958858]
我々は、80億のパラメータを持つ効率的な基礎的視覚言語モデルであるIdefics2を開発した。
Idefics2は、様々なマルチモーダルベンチマークで、そのサイズカテゴリ内で最先端のパフォーマンスを達成する。
トレーニング用に作成されたデータセットとともに、モデル(ベース、指示、チャット)をリリースします。
論文 参考訳(メタデータ) (2024-05-03T17:00:00Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - Qualitative analysis of the relationship between design smells and
software engineering challenges [3.9704849108478704]
本研究は,大量のソースコードを解析することにより,Javaソフトウェアの設計臭い検出に使用するツールを提供する。
ツールの出力に基づいて、検出された設計の臭いの原因を「不規則なチームミーティング」と「スコープクリープ」という2つのソフトウェアエンジニアリング課題に関連付ける研究を行った。
論文 参考訳(メタデータ) (2023-10-22T23:21:13Z) - Serving Deep Learning Model in Relational Databases [70.53282490832189]
リレーショナルデータ上での深層学習(DL)モデルの実現は、様々な商業分野や科学分野において重要な要件となっている。
最先端のDL中心アーキテクチャは、DL計算を専用のDLフレームワークにオフロードします。
UDF中心アーキテクチャの可能性は、リレーショナルデータベース管理システム(RDBMS)内の1つ以上のテンソル計算をユーザ定義関数(UDF)にカプセル化する。
論文 参考訳(メタデータ) (2023-10-07T06:01:35Z) - Challenges in Migrating Imperative Deep Learning Programs to Graph
Execution: An Empirical Study [4.415977307120617]
我々は、信頼できるがパフォーマンスのよい命令型DLコードを書くことに関わる課題と結果のバグを、データ駆動で分析します。
命令型DLコードを効果的にハイブリダイズするために、いくつかの推奨事項、ベストプラクティス、アンチパターンを提示しました。
論文 参考訳(メタデータ) (2022-01-24T21:12:38Z) - Automatic Fault Detection for Deep Learning Programs Using Graph
Transformations [13.572917264310119]
ディープラーニングプログラムのためのモデルに基づく故障検出手法であるNeuraLintを提案する。
NeuraLintは、70.5%のリコールと100%の精度で、合成および実世界の両方の例の欠陥と設計上の問題を効果的に検出する。
提案するメタモデルはフィードフォワードニューラルネットワーク用に設計されているが、他のニューラルネットワークアーキテクチャをサポートするように拡張することができる。
論文 参考訳(メタデータ) (2021-05-17T18:06:11Z) - An Empirical Study on Deployment Faults of Deep Learning Based Mobile
Applications [7.58063287182615]
モバイルディープラーニング(DL)アプリは、大規模データを使用してトレーニングされたDLモデルとDLプログラムを統合する。
本稿では,モバイルdlアプリのデプロイ障害に関する最初の総合的研究を行う。
我々は,断層症状に関する23のカテゴリからなる微粒度分類を構築し,異なる断層タイプに対する共通修正戦略を蒸留する。
論文 参考訳(メタデータ) (2021-01-13T08:19:50Z) - CorDEL: A Contrastive Deep Learning Approach for Entity Linkage [70.82533554253335]
エンティティリンケージ(EL)は、データのクリーニングと統合において重要な問題である。
新たなデータの増加に伴い、ディープラーニング(DL)ベースのアプローチが提案され、従来のモデルに付随するELの高コスト化が図られている。
我々は、ツインネットワークアーキテクチャはELに準最適であり、既存のモデルに固有の欠点をもたらすと主張している。
論文 参考訳(メタデータ) (2020-09-15T16:33:05Z) - A Survey of Deep Active Learning [54.376820959917005]
アクティブラーニング(AL)は、最も少ないサンプルをマークすることで、モデルの性能向上を最大化しようとする。
ディープラーニング(DL)はデータに対して欲張りであり、大量のパラメータを最適化するために大量のデータ供給を必要とする。
ディープラーニング(Deep Active Learning, DAL)が誕生した。
論文 参考訳(メタデータ) (2020-08-30T04:28:31Z) - The Deep Learning Compiler: A Comprehensive Survey [16.19025439622745]
我々は、広く採用されている設計を詳細に分離し、既存のDLコンパイラを網羅的に調査する。
具体的には、様々な側面から既存のDLコンパイラを総合的に比較する。
論文 参考訳(メタデータ) (2020-02-06T07:29:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。