論文の概要: Democratizing Machine Learning for Interdisciplinary Scholars: Report on
Organizing the NLP+CSS Online Tutorial Series
- arxiv url: http://arxiv.org/abs/2211.15971v1
- Date: Tue, 29 Nov 2022 07:06:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 16:05:31.732594
- Title: Democratizing Machine Learning for Interdisciplinary Scholars: Report on
Organizing the NLP+CSS Online Tutorial Series
- Title(参考訳): 学際的学者のための機械学習の民主化 - NLP+CSSオンラインチュートリアルシリーズの実施レポート
- Authors: Ian Stewart and Katherine Keith
- Abstract要約: 既存のチュートリアルは参加者にとってコストがかかることが多く、広範なプログラミング知識を前提としており、特定のアプリケーション分野に合わせたものではない。
我々は,高度な自然言語処理(NLP)手法を計算社会科学(CSS)研究者に教えることを目的とした,1年間の無料オンラインチュートリアルシリーズを組織した。
ライブ参加は予想以上に限定的であったが,前・後調査との比較では,7点様の尺度において,ほぼ1点の知識に対する参加者の認識が増加した。
- 参考スコア(独自算出の注目度): 0.9645196221785691
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many scientific fields -- including biology, health, education, and the
social sciences -- use machine learning (ML) to help them analyze data at an
unprecedented scale. However, ML researchers who develop advanced methods
rarely provide detailed tutorials showing how to apply these methods. Existing
tutorials are often costly to participants, presume extensive programming
knowledge, and are not tailored to specific application fields. In an attempt
to democratize ML methods, we organized a year-long, free, online tutorial
series targeted at teaching advanced natural language processing (NLP) methods
to computational social science (CSS) scholars. Two organizers worked with
fifteen subject matter experts to develop one-hour presentations with hands-on
Python code for a range of ML methods and use cases, from data pre-processing
to analyzing temporal variation of language change. Although live participation
was more limited than expected, a comparison of pre- and post-tutorial surveys
showed an increase in participants' perceived knowledge of almost one point on
a 7-point Likert scale. Furthermore, participants asked thoughtful questions
during tutorials and engaged readily with tutorial content afterwards, as
demonstrated by 10K~total views of posted tutorial recordings. In this report,
we summarize our organizational efforts and distill five principles for
democratizing ML+X tutorials. We hope future organizers improve upon these
principles and continue to lower barriers to developing ML skills for
researchers of all fields.
- Abstract(参考訳): 生物学、健康、教育、社会科学を含む多くの科学分野は、機械学習(ML)を使用して、前例のない規模でデータを分析している。
しかし,高度な手法を開発したML研究者は,これらの手法の適用方法を示す詳細なチュートリアルをほとんど提供していない。
既存のチュートリアルは、しばしば参加者に費用がかかり、広範なプログラミング知識を前提としており、特定のアプリケーション分野に合わせたものではない。
ML手法を民主化するために,高度な自然言語処理(NLP)手法を計算社会科学(CSS)研究者に教えることを目的とした,1年間の無料オンラインチュートリアルシリーズを企画した。
2人のオーガナイザが15の課題の専門家と協力して、データ前処理から言語変更の時間的変動の分析に至るまで、さまざまなMLメソッドやユースケースに対して、ハンズオンのPythonコードを使った1時間のプレゼンテーションを開発した。
生の参加は予想より限定的であったが,前と後の比較では7点の類似尺度において,参加者の認識知識がほぼ1点近く増加した。
さらに、参加者はチュートリアル中に思慮深い質問をし、投稿されたチュートリアル記録の10K〜total viewで示されるように、その後すぐにチュートリアルコンテンツに関わった。
本報告では、組織的取り組みをまとめ、ml+xチュートリアルの民主化のための5つの原則を概説する。
今後はこれらの原則を改善し、すべての分野の研究者がMLスキルを開発するための障壁を低くしていきたいと考えています。
関連論文リスト
- Hands-On Tutorial: Labeling with LLM and Human-in-the-Loop [7.925650087629884]
このチュートリアルは、研究と業界の両方のバックグラウンドを持つNLP実践者向けに設計されている。
それぞれの戦略の基本を提示し、そのメリットと限界を強調し、実生活におけるケーススタディを詳細に議論する。
チュートリアルにはハンズオンワークショップが含まれており、参加者はハイブリッドアノテーションのセットアップを実装する際にガイドされる。
論文 参考訳(メタデータ) (2024-11-07T11:51:14Z) - Tutorly: Turning Programming Videos Into Apprenticeship Learning Environments with LLMs [1.6961276655027102]
我々の研究は、プログラミングビデオを認知的見習いのフレームワークを使って1対1の学習体験に変換する。
TutorlyはJupyterLabとして開発され、学習者はパーソナライズされた学習目標を設定することができる。
論文 参考訳(メタデータ) (2024-05-21T17:17:34Z) - Aligning Large Language Models with Human: A Survey [53.6014921995006]
広範囲なテキストコーパスで訓練されたLarge Language Models (LLM) は、幅広い自然言語処理(NLP)タスクの先導的なソリューションとして登場した。
その顕著な性能にもかかわらず、これらのモデルは、人間の指示を誤解したり、偏見のあるコンテンツを生成したり、事実的に誤った情報を生成するといった、ある種の制限を受ける傾向にある。
本調査では,これらのアライメント技術の概要について概観する。
論文 参考訳(メタデータ) (2023-07-24T17:44:58Z) - Towards Understanding Machine Learning Testing in Practise [23.535630175567146]
本稿では,Jupyterノートブックのマイニングによる機械学習パイプラインの可視化について検討する。
まず、より小さなノートのサンプルの質的研究を用いて、一般的な洞察と傾向を収集する。
そして、質的研究から得られた知識を使って、より大きなノートブックのサンプルを使って経験的な研究を設計する。
論文 参考訳(メタデータ) (2023-05-08T18:52:26Z) - What are the Machine Learning best practices reported by practitioners
on Stack Exchange? [4.882319198853359]
127の機械学習ベストプラクティスを14のStack Exchange(STE)ウェブサイトから242のポストを体系的にマイニングする。
プラクティスのリストは、ML対応システムの実装プロセスの異なる段階に関連するカテゴリのセットで示されます。
論文 参考訳(メタデータ) (2023-01-25T10:50:28Z) - A Survey of Knowledge Enhanced Pre-trained Language Models [78.56931125512295]
我々は、知識強化事前学習言語モデル(KE-PLMs)の包括的なレビューを行う。
NLUでは、言語知識、テキスト知識、知識グラフ(KG)、ルール知識の4つのカテゴリに分類する。
NLGのKE-PLMは、KGベースと検索ベースに分類される。
論文 参考訳(メタデータ) (2022-11-11T04:29:02Z) - Knowledgeable Salient Span Mask for Enhancing Language Models as
Knowledge Base [51.55027623439027]
我々は、モデルが構造化されていないテキストから、完全に自己教師された方法でより多くの知識を学習するのを助ける2つのソリューションを開発する。
最高の知識を得るために、私たちは、継続的事前学習における知識の完全な自己教師型学習を初めて探求します。
論文 参考訳(メタデータ) (2022-04-17T12:33:34Z) - Tutorial on Deep Learning for Human Activity Recognition [70.94062293989832]
このチュートリアルは2021年のACM International Symposium on Wearable Computers (ISWC'21)で初めて開催された。
これは、人間のアクティビティを深く学習する上で、データパイプラインにおける最も重要なステップの、ハンズオンでインタラクティブなウォークスルーを提供する。
論文 参考訳(メタデータ) (2021-10-13T12:01:02Z) - Panoramic Learning with A Standardized Machine Learning Formalism [116.34627789412102]
本稿では,多様なMLアルゴリズムの統一的な理解を提供する学習目的の標準化された方程式を提案する。
また、新しいMLソリューションのメカニック設計のガイダンスも提供し、すべての経験を持つパノラマ学習に向けた有望な手段として機能する。
論文 参考訳(メタデータ) (2021-08-17T17:44:38Z) - ProtoTransformer: A Meta-Learning Approach to Providing Student Feedback [54.142719510638614]
本稿では,フィードバックを数発の分類として提供するという課題について考察する。
メタラーナーは、インストラクターによるいくつかの例から、新しいプログラミング質問に関する学生のコードにフィードバックを与えるように適応します。
本手法は,第1段階の大学が提供したプログラムコースにおいて,16,000名の学生試験ソリューションに対するフィードバックの提供に成功している。
論文 参考訳(メタデータ) (2021-07-23T22:41:28Z) - Declarative Machine Learning Systems [7.5717114708721045]
機械学習(ML)は、学術的な取り組みから、コンピューティングのほぼすべての側面で採用されている普及した技術へと移行してきた。
近年の自然科学におけるMLの適用の成功により、MLは人類が直面する最も困難な現実世界問題に対処するために利用できることが明らかとなった。
MLシステムの次の波は、おそらくコーディングスキルなしで、より多くの人が同じタスクを実行できると信じています。
論文 参考訳(メタデータ) (2021-07-16T23:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。