論文の概要: How to avoid machine learning pitfalls: a guide for academic researchers
- arxiv url: http://arxiv.org/abs/2108.02497v5
- Date: Thu, 29 Aug 2024 10:12:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-01 17:12:14.477411
- Title: How to avoid machine learning pitfalls: a guide for academic researchers
- Title(参考訳): 機械学習の落とし穴を避ける--研究者のためのガイド
- Authors: Michael A. Lones,
- Abstract要約: このガイドでは、マシンラーニングの使用時に発生する一般的なミスと、それを避けるためにできることを概説する。
モデル構築前に何をすべきか、モデルを確実に構築する方法、モデルを堅牢に評価する方法、モデルを公平に比較する方法、結果を報告する方法である。
- 参考スコア(独自算出の注目度): 4.242435932138821
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mistakes in machine learning practice are commonplace, and can result in a loss of confidence in the findings and products of machine learning. This guide outlines common mistakes that occur when using machine learning, and what can be done to avoid them. Whilst it should be accessible to anyone with a basic understanding of machine learning techniques, it focuses on issues that are of particular concern within academic research, such as the need to do rigorous comparisons and reach valid conclusions. It covers five stages of the machine learning process: what to do before model building, how to reliably build models, how to robustly evaluate models, how to compare models fairly, and how to report results.
- Abstract(参考訳): 機械学習の実践におけるミスは一般的な場所であり、機械学習の発見や製品に対する信頼を失う可能性がある。
このガイドでは、マシンラーニングの使用時に発生する一般的なミスと、それを避けるためにできることを概説する。
機械学習技術に関する基本的な知識を持つ人なら誰でもアクセスできるはずであるが、厳密な比較や有効な結論に達する必要性など、学術研究で特に懸念される問題に焦点を当てている。
モデル構築前に何をすべきか、モデルを確実に構築する方法、モデルを堅牢に評価する方法、モデルを公平に比較する方法、結果を報告する方法である。
関連論文リスト
- Generative Models as a Complex Systems Science: How can we make sense of
large language model behavior? [75.79305790453654]
事前訓練されたモデルから望ましい振る舞いを排除し、望ましくないモデルを避けながら、NLPを再定義した。
言語モデルの振る舞いをタスク間性能を説明するカテゴリに分解する体系的な取り組みについて論じる。
論文 参考訳(メタデータ) (2023-07-31T22:58:41Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - Learnware: Small Models Do Big [69.88234743773113]
自然言語処理やコンピュータビジョンの応用で目覚ましい成果を上げてきた、一般的なビッグモデルパラダイムは、これらの問題にまだ対応していないが、炭素排出量の深刻な源となっている。
この記事では、マシンラーニングモデルをスクラッチから構築する必要がないようにするための学習ソフトウェアパラダイムの概要を紹介します。
論文 参考訳(メタデータ) (2022-10-07T15:55:52Z) - Learning to Scaffold: Optimizing Model Explanations for Teaching [74.25464914078826]
我々は3つの自然言語処理とコンピュータビジョンタスクのモデルを訓練する。
筆者らは,本フレームワークで抽出した説明文を学習した学生が,従来の手法よりもはるかに効果的に教師をシミュレートできることを発見した。
論文 参考訳(メタデータ) (2022-04-22T16:43:39Z) - Applying Machine Learning to Study Fluid Mechanics [0.696194614504832]
本稿では,機械学習を用いて流体力学でデータ駆動モデルを構築する方法について概説する。
それぞれの段階において、流体力学の分野からの具体例を用いて、これまでの物理知識がどのようにプロセスに埋め込まれているかについて議論する。
論文 参考訳(メタデータ) (2021-10-05T14:30:24Z) - Exploring Strategies for Generalizable Commonsense Reasoning with
Pre-trained Models [62.28551903638434]
モデルの一般化と精度に及ぼす3つの異なる適応法の影響を計測する。
2つのモデルを用いた実験では、微調整はタスクの内容と構造の両方を学習することで最もうまく機能するが、過度に適合し、新しい答えへの限定的な一般化に苦しむ。
我々は、プレフィックスチューニングのような代替適応手法が同等の精度を持つのを観察するが、解を見落とさずに一般化し、対数分割に対してより堅牢である。
論文 参考訳(メタデータ) (2021-09-07T03:13:06Z) - Machine Learning with a Reject Option: A survey [18.43771007525432]
この調査は、拒絶を伴う機械学習の概要を提供することを目的としている。
本稿では,2種類の拒絶,曖昧さ,新規性拒絶につながる条件を紹介する。
我々は,モデルの予測的,拒絶的品質を評価するための戦略をレビューし,分類する。
論文 参考訳(メタデータ) (2021-07-23T14:43:56Z) - Knowledge as Invariance -- History and Perspectives of
Knowledge-augmented Machine Learning [69.99522650448213]
機械学習の研究は転換点にある。
研究の関心は、高度にパラメータ化されたモデルのパフォーマンス向上から、非常に具体的なタスクへとシフトしている。
このホワイトペーパーは、機械学習研究におけるこの新興分野の紹介と議論を提供する。
論文 参考訳(メタデータ) (2020-12-21T15:07:19Z) - Automated Content Grading Using Machine Learning [0.0]
本研究プロジェクトは,技術科の学生による試験で書かれた理論的回答の段階付けを自動化するための原始的な実験である。
本稿では,機械学習におけるアルゴリズム的アプローチを用いて,試験回答論文の理論的内容を自動的に検証し,評価する方法について述べる。
論文 参考訳(メタデータ) (2020-04-08T23:46:24Z) - A Hierarchy of Limitations in Machine Learning [0.0]
本稿では,社会に応用された機械学習におけるモデルの概念的,手続き的,統計的制限の包括的,構造化された概要を論じる。
モデラー自身は、記述された階層を使って、可能な障害点を特定し、それらに対処する方法を考えることができます。
機械学習モデルの消費者は、機械学習を適用するかどうか、場所、方法に関する決定に直面したときに、何を問うべきかを知ることができる。
論文 参考訳(メタデータ) (2020-02-12T19:39:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。