論文の概要: What are the Machine Learning best practices reported by practitioners
on Stack Exchange?
- arxiv url: http://arxiv.org/abs/2301.10516v1
- Date: Wed, 25 Jan 2023 10:50:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-26 15:30:07.642174
- Title: What are the Machine Learning best practices reported by practitioners
on Stack Exchange?
- Title(参考訳): Stack Exchangeで実践者が報告した機械学習のベストプラクティスは?
- Authors: Anamaria Mojica-Hanke and Andrea Bayona and Mario Linares-V\'asquez
and Steffen Herbold and Fabio A. Gonz\'alez
- Abstract要約: 127の機械学習ベストプラクティスを14のStack Exchange(STE)ウェブサイトから242のポストを体系的にマイニングする。
プラクティスのリストは、ML対応システムの実装プロセスの異なる段階に関連するカテゴリのセットで示されます。
- 参考スコア(独自算出の注目度): 4.882319198853359
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine Learning (ML) is being used in multiple disciplines due to its
powerful capability to infer relationships within data. In particular, Software
Engineering (SE) is one of those disciplines in which ML has been used for
multiple tasks, like software categorization, bugs prediction, and testing. In
addition to the multiple ML applications, some studies have been conducted to
detect and understand possible pitfalls and issues when using ML. However, to
the best of our knowledge, only a few studies have focused on presenting ML
best practices or guidelines for the application of ML in different domains. In
addition, the practices and literature presented in previous literature (i) are
domain-specific (e.g., concrete practices in biomechanics), (ii) describe few
practices, or (iii) the practices lack rigorous validation and are presented in
gray literature. In this paper, we present a study listing 127 ML best
practices systematically mining 242 posts of 14 different Stack Exchange (STE)
websites and validated by four independent ML experts. The list of practices is
presented in a set of categories related to different stages of the
implementation process of an ML-enabled system; for each practice, we include
explanations and examples. In all the practices, the provided examples focus on
SE tasks. We expect this list of practices could help practitioners to
understand better the practices and use ML in a more informed way, in
particular newcomers to this new area that sits at the intersection of software
engineering and machine learning.
- Abstract(参考訳): 機械学習(ml)は、データ内の関係を推論する能力があるため、複数の分野で使用されている。
特に、ソフトウェアエンジニアリング(SE)は、ソフトウェア分類、バグ予測、テストなど、MLが複数のタスクに使用されている分野のひとつです。
複数のMLアプリケーションに加えて、MLを使用する際の落とし穴や問題を検出し、理解するためにいくつかの研究がなされている。
しかしながら、私たちの知る限りでは、MLのベストプラクティスやガイドラインをさまざまな分野に適用することに注力する研究はごくわずかです。
さらに 前回の文献に提示された 実践や文学は
(i)ドメイン特有(例えば、バイオメカニクスにおける具体的な実践)
(二)実践の少ないこと、又は
(iii)厳格な検証がなく、灰色文献で示される。
本稿では,14のStack Exchange (STE) サイトから242のポストを体系的にマイニングし,独立したML専門家4名による検証を行った。
プラクティスのリストは、ML対応システムの実装プロセスの異なる段階に関するカテゴリのセットで示され、それぞれのプラクティスには、説明と例が含まれています。
すべてのプラクティスにおいて、提供された例はseタスクにフォーカスします。
このプラクティスのリストは、実践者がプラクティスをよりよく理解し、より情報のある方法でMLを使用するのに役立つと期待しています。
関連論文リスト
- Knowledge Plugins: Enhancing Large Language Models for Domain-Specific
Recommendations [50.81844184210381]
本稿では,大規模言語モデルをDOmain固有のKnowledgEで拡張し,実践的アプリケーション,すなわちDOKEの性能を向上させるためのパラダイムを提案する。
このパラダイムはドメイン知識抽出器に依存し,1)タスクに効果的な知識を準備すること,2)特定のサンプルごとに知識を選択すること,3)LLMで理解可能な方法で知識を表現すること,の3つのステップで動作する。
論文 参考訳(メタデータ) (2023-11-16T07:09:38Z) - On Using Information Retrieval to Recommend Machine Learning Good
Practices for Software Engineers [6.7659763626415135]
優れた機械学習プラクティスを受け入れていないと、MLシステムのパフォーマンスが損なわれる可能性がある。
多くの非ML専門家は、助けやガイダンスを探すとき、ブログやQ&Aシステムのようなグレーの文献に目を向ける。
本稿では,ユーザのコンテキストに基づいてMLプラクティスを推奨するレコメンデーションシステムを提案する。
論文 参考訳(メタデータ) (2023-08-23T12:28:18Z) - MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models [73.86954509967416]
マルチモーダル言語モデル(MLLM)は、マルチモーダルタスクを実行するために強力なLLMに依存している。
本稿では,MLLM 評価ベンチマーク MME について述べる。
知覚能力と認知能力の両方を合計14のサブタスクで測定する。
論文 参考訳(メタデータ) (2023-06-23T09:22:36Z) - Towards machine learning guided by best practices [0.0]
機械学習(ML)は、医学からソフトウェア工学(SE)まで、複数の応用分野を持つソフトウェアシステムで使われている。
この論文は、SEコミュニティの実践者や研究者が使用し議論するプラクティスを理解するのに役立つ研究の質問に答えることを目的としている。
論文 参考訳(メタデータ) (2023-04-29T10:58:37Z) - ICL-D3IE: In-Context Learning with Diverse Demonstrations Updating for
Document Information Extraction [56.790794611002106]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて、文脈内学習による顕著な結果を示している。
ICL-D3IEと呼ばれるシンプルだが効果的なテキスト内学習フレームワークを提案する。
具体的には、ハードトレーニング文書から最も困難で独特なセグメントをハードデモとして抽出する。
論文 参考訳(メタデータ) (2023-03-09T06:24:50Z) - Democratizing Machine Learning for Interdisciplinary Scholars: Report on
Organizing the NLP+CSS Online Tutorial Series [0.9645196221785691]
既存のチュートリアルは参加者にとってコストがかかることが多く、広範なプログラミング知識を前提としており、特定のアプリケーション分野に合わせたものではない。
我々は,高度な自然言語処理(NLP)手法を計算社会科学(CSS)研究者に教えることを目的とした,1年間の無料オンラインチュートリアルシリーズを組織した。
ライブ参加は予想以上に限定的であったが,前・後調査との比較では,7点様の尺度において,ほぼ1点の知識に対する参加者の認識が増加した。
論文 参考訳(メタデータ) (2022-11-29T07:06:45Z) - Machine Learning for Software Engineering: A Tertiary Study [13.832268599253412]
機械学習(ML)技術は、ソフトウェアエンジニアリング(SE)ライフサイクルアクティビティの有効性を高める。
2009~2022年に発行されたML for SEで, 体系的, 品質評価, 要約, 分類を行い, 初等研究6,117件について検討した。
MLに最も取り組まれているSE領域は、ソフトウェアの品質とテストである。
論文 参考訳(メタデータ) (2022-11-17T09:19:53Z) - Panoramic Learning with A Standardized Machine Learning Formalism [116.34627789412102]
本稿では,多様なMLアルゴリズムの統一的な理解を提供する学習目的の標準化された方程式を提案する。
また、新しいMLソリューションのメカニック設計のガイダンスも提供し、すべての経験を持つパノラマ学習に向けた有望な手段として機能する。
論文 参考訳(メタデータ) (2021-08-17T17:44:38Z) - "Garbage In, Garbage Out" Revisited: What Do Machine Learning
Application Papers Report About Human-Labeled Training Data? [0.0]
ラベル付きトレーニングデータからモデルを自動的に抽出する監視された機械学習は、そのデータの品質に匹敵する。
本研究は、機械学習の応用出版物において、トレーニングデータのラベル付けに関する「ベストプラクティス」がどの程度続くかを調査した先行研究に基づいている。
論文 参考訳(メタデータ) (2021-07-05T21:24:02Z) - White Paper Machine Learning in Certified Systems [70.24215483154184]
DEEL Project set-up the ML Certification 3 Workgroup (WG) set-up by the Institut de Recherche Technologique Saint Exup'ery de Toulouse (IRT)
論文 参考訳(メタデータ) (2021-03-18T21:14:30Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。