論文の概要: On Using Information Retrieval to Recommend Machine Learning Good
Practices for Software Engineers
- arxiv url: http://arxiv.org/abs/2308.12095v2
- Date: Fri, 25 Aug 2023 08:05:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 12:55:04.316122
- Title: On Using Information Retrieval to Recommend Machine Learning Good
Practices for Software Engineers
- Title(参考訳): ソフトウェアエンジニアのための機械学習のグッドプラクティスを推薦する情報検索について
- Authors: Laura Cabra-Acela and Anamaria Mojica-Hanke and Mario
Linares-V\'asquez and Steffen Herbold
- Abstract要約: 優れた機械学習プラクティスを受け入れていないと、MLシステムのパフォーマンスが損なわれる可能性がある。
多くの非ML専門家は、助けやガイダンスを探すとき、ブログやQ&Aシステムのようなグレーの文献に目を向ける。
本稿では,ユーザのコンテキストに基づいてMLプラクティスを推奨するレコメンデーションシステムを提案する。
- 参考スコア(独自算出の注目度): 6.7659763626415135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning (ML) is nowadays widely used for different purposes and in
several disciplines. From self-driving cars to automated medical diagnosis,
machine learning models extensively support users' daily activities, and
software engineering tasks are no exception. Not embracing good ML practices
may lead to pitfalls that hinder the performance of an ML system and
potentially lead to unexpected results. Despite the existence of documentation
and literature about ML best practices, many non-ML experts turn towards gray
literature like blogs and Q&A systems when looking for help and guidance when
implementing ML systems. To better aid users in distilling relevant knowledge
from such sources, we propose a recommender system that recommends ML practices
based on the user's context. As a first step in creating a recommender system
for machine learning practices, we implemented Idaka. A tool that provides two
different approaches for retrieving/generating ML best practices: i) an
information retrieval (IR) engine and ii) a large language model. The IR-engine
uses BM25 as the algorithm for retrieving the practices, and a large language
model, in our case Alpaca. The platform has been designed to allow comparative
studies of best practices retrieval tools. Idaka is publicly available at
GitHub: https://bit.ly/idaka. Video: https://youtu.be/cEb-AhIPxnM.
- Abstract(参考訳): 機械学習(ml)は現在、異なる目的といくつかの分野で広く使われている。
自動運転車から自動診断まで、機械学習モデルはユーザの日々の活動を広範囲にサポートし、ソフトウェアエンジニアリングタスクは例外ではない。
優れたMLプラクティスを受け入れないことは、MLシステムのパフォーマンスを妨げ、予期せぬ結果をもたらす落とし穴につながる可能性がある。
MLベストプラクティスに関するドキュメントや文献が存在するにも関わらず、多くの非ML専門家は、MLシステムを実装する際の助けやガイダンスを探す際に、ブログやQ&Aシステムのような灰色の文献に目を向ける。
このような情報源から関連する知識を蒸留するユーザを支援するために,ユーザのコンテキストに基づいてmlプラクティスを推奨するレコメンダシステムを提案する。
機械学習プラクティスのレコメンデーションシステムを構築するための第一歩として、Idakaを実装しました。
MLベストプラクティスの検索/生成に2つの異なるアプローチを提供するツール。
一 情報検索(IR)エンジン及び装置
ii) 大きな言語モデル。
irエンジンはプラクティス検索のアルゴリズムとしてbm25を使用し、alpacaでは大きな言語モデルを採用している。
このプラットフォームは、ベストプラクティス検索ツールの比較研究を可能にするように設計されている。
IdakaはGitHubで公開されている。
ビデオ: https://youtu.be/ceb-ahipxnm。
関連論文リスト
- A Large-Scale Study of Model Integration in ML-Enabled Software Systems [4.776073133338119]
機械学習(ML)とそのシステムへの組み込みは、ソフトウェア集約システムのエンジニアリングを大きく変えた。
伝統的に、ソフトウェアエンジニアリングは、ソースコードやそれらを作成するプロセスなど、手作業で作成したアーティファクトに焦点を当てている。
我々は、GitHub上で2,928以上のオープンソースシステムをカバーする、実際のML対応ソフトウェアシステムに関する最初の大規模な研究を提示する。
論文 参考訳(メタデータ) (2024-08-12T15:28:40Z) - MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models [73.86954509967416]
マルチモーダル言語モデル(MLLM)は、マルチモーダルタスクを実行するために強力なLLMに依存している。
本稿では,MLLM 評価ベンチマーク MME について述べる。
知覚能力と認知能力の両方を合計14のサブタスクで測定する。
論文 参考訳(メタデータ) (2023-06-23T09:22:36Z) - How Can Recommender Systems Benefit from Large Language Models: A Survey [82.06729592294322]
大きな言語モデル(LLM)は、印象的な汎用知性と人間のような能力を示している。
我々は,実世界のレコメンデータシステムにおけるパイプライン全体の観点から,この研究の方向性を包括的に調査する。
論文 参考訳(メタデータ) (2023-06-09T11:31:50Z) - What are the Machine Learning best practices reported by practitioners
on Stack Exchange? [4.882319198853359]
127の機械学習ベストプラクティスを14のStack Exchange(STE)ウェブサイトから242のポストを体系的にマイニングする。
プラクティスのリストは、ML対応システムの実装プロセスの異なる段階に関連するカテゴリのセットで示されます。
論文 参考訳(メタデータ) (2023-01-25T10:50:28Z) - A Survey of Machine Unlearning [56.017968863854186]
最近の規制では、要求に応じて、ユーザに関する個人情報をコンピュータシステムから削除する必要がある。
MLモデルは古いデータをよく記憶します。
機械学習に関する最近の研究は、この問題を完全に解決することはできなかった。
論文 参考訳(メタデータ) (2022-09-06T08:51:53Z) - OmniXAI: A Library for Explainable AI [98.07381528393245]
eXplainable AI(XAI)のオープンソースPythonライブラリであるOmniXAIを紹介する。
オールニウェイで説明可能なAI機能と、さまざまな解釈可能な機械学習技術を提供する。
実践者にとってこのライブラリは、アプリケーションの説明を生成するために、使いやすく統合されたインターフェースを提供する。
論文 参考訳(メタデータ) (2022-06-01T11:35:37Z) - Declarative Machine Learning Systems [7.5717114708721045]
機械学習(ML)は、学術的な取り組みから、コンピューティングのほぼすべての側面で採用されている普及した技術へと移行してきた。
近年の自然科学におけるMLの適用の成功により、MLは人類が直面する最も困難な現実世界問題に対処するために利用できることが明らかとなった。
MLシステムの次の波は、おそらくコーディングスキルなしで、より多くの人が同じタスクを実行できると信じています。
論文 参考訳(メタデータ) (2021-07-16T23:57:57Z) - White Paper Machine Learning in Certified Systems [70.24215483154184]
DEEL Project set-up the ML Certification 3 Workgroup (WG) set-up by the Institut de Recherche Technologique Saint Exup'ery de Toulouse (IRT)
論文 参考訳(メタデータ) (2021-03-18T21:14:30Z) - A Neophyte With AutoML: Evaluating the Promises of Automatic Machine
Learning Tools [1.713291434132985]
本稿では,機械学習(ML)経験の少ない人の視点から,現代の自動機械学習(AutoML)ツールについて考察する。
ML技術の使用を簡素化し、民主化するために作られたAutoMLツールは、使いやすくも開発中のツールも数多くある。
論文 参考訳(メタデータ) (2021-01-14T19:28:57Z) - Insights into Performance Fitness and Error Metrics for Machine Learning [1.827510863075184]
機械学習(ML)は、高いレベルの認知を達成し、人間のような分析を行うための訓練機械の分野である。
本稿では、回帰アルゴリズムや分類アルゴリズムにおいて、最もよく使われている性能適合度と誤差の測定値について検討する。
論文 参考訳(メタデータ) (2020-05-17T22:59:04Z) - An Information-Theoretic Approach to Personalized Explainable Machine
Learning [92.53970625312665]
本稿では,予測とユーザ知識のための簡易確率モデルを提案する。
説明と予測の間の条件付き相互情報による説明の効果を定量化する。
論文 参考訳(メタデータ) (2020-03-01T13:06:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。