論文の概要: The Data Science Fire Next Time: Innovative strategies for mentoring in
data science
- arxiv url: http://arxiv.org/abs/2003.07681v1
- Date: Sun, 1 Mar 2020 03:40:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 13:32:54.228656
- Title: The Data Science Fire Next Time: Innovative strategies for mentoring in
data science
- Title(参考訳): Data Science Fire Next Time: データサイエンスのメンタリングのための革新的戦略
- Authors: Latifa Jackson and Heriberto Acosta Maestre
- Abstract要約: BPDM(Broadening Participation in Data Mining)ワークショップは7年以上前に開催された。
BPDMは、データサイエンスと機械学習のコミュニティにおける少数派と少数派のグループのためのメンターシップ、ガイダンス、コネを奨励することを目的としている。
これまでのところ、データサイエンスの訓練生は330人を超えている。
- 参考スコア(独自算出の注目度): 14.213973379473655
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As data mining research and applications continue to expand in to a variety
of fields such as medicine, finance, security, etc., the need for talented and
diverse individuals is clearly felt. This is particularly the case as Big Data
initiatives have taken off in the federal, private and academic sectors,
providing a wealth of opportunities, nationally and internationally. The
Broadening Participation in Data Mining (BPDM) workshop was created more than 7
years ago with the goal of fostering mentorship, guidance, and connections for
minority and underrepresented groups in the data science and machine learning
community, while also enriching technical aptitude and exposure for a group of
talented students. To date it has impacted the lives of more than 330
underrepresented trainees in data science. We provide a venue to connect
talented students with innovative researchers in industry, academia,
professional societies, and government. Our mission is to facilitate
meaningful, lasting relationships between BPDM participants to ultimately
increase diversity in data mining. This most recent workshop took place at
Howard University in Washington, DC in February 2019. Here we report on the
mentoring strategies that we undertook at the 2019 BPDM and how those were
received.
- Abstract(参考訳): データマイニングの研究や応用が医学、金融、セキュリティなど様々な分野に拡大していくにつれ、才能と多様な個人の必要性が明らかに感じられる。
特に、ビッグデータイニシアチブが連邦政府、民間、学術セクターで離陸し、国内、国際的に豊富な機会を提供しているため、これは特にそうだ。
データマイニング(bpdm)ワークショップの広範な参加は、7年以上前に、データサイエンスと機械学習コミュニティの少数派と少数派グループへのメンターシップ、指導、つながりを育むと同時に、有能な学生のグループに対する技術的適性と露出を高めることを目的として作られた。
これまでのところ、データサイエンスの訓練生は330人を超えている。
我々は,有能な学生を産業,アカデミア,専門的社会,政府で革新的な研究者と結びつける場を提供する。
私たちのミッションはBPDM参加者間の有意義で永続的な関係を促進し、最終的にデータマイニングの多様性を高めることです。
直近のワークショップは2019年2月にワシントンD.C.のハワード大学で行われた。
ここでは、2019 BPDMで実施した指導戦略と、その受け取り方について報告する。
関連論文リスト
- High School Summer Camps Help Democratize Coding, Data Science, and Deep Learning [0.0]
本研究は,高校生がコーディング,データサイエンス,深層学習に導入するサマーキャンプシリーズの影響について報告する。
キャンプは没入的な大学経験を提供し、技術スキル、コラボレーション、インスピレーションを育んでいる。
調査データによると、AIとデータサイエンスのキャリアへの関心が68.6%と、コーディングに対する自信が増している。
論文 参考訳(メタデータ) (2024-09-17T19:59:39Z) - Pennsieve: A Collaborative Platform for Translational Neuroscience and Beyond [0.5130659559809153]
Pennsieveはオープンソースでクラウドベースの科学データ管理プラットフォームである。
複雑なマルチモーダルデータセットをサポートし、データの視覚化と分析のためのツールを提供する。
Pennsieveは125TB以上の科学的データを格納し、350以上のハイインパクトデータセットで35TB以上のデータを公開している。
論文 参考訳(メタデータ) (2024-09-16T17:55:58Z) - DSBench: How Far Are Data Science Agents to Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery [68.48094108571432]
大規模言語モデル(LLM)は、テキストやその他のデータ処理方法に革命をもたらした。
我々は,科学LLM間のクロスフィールドおよびクロスモーダル接続を明らかにすることで,研究ランドスケープのより総合的なビューを提供することを目指している。
論文 参考訳(メタデータ) (2024-06-16T08:03:24Z) - Simpson's Paradox and Lagging Progress in Completion Trends of
Underrepresented Students in Computer Science [0.09831489366502298]
コンピュータサイエンス(CS)コミュニティにとって、様々な背景を持つ学生の積極的な参加と成功を保証することが不可欠である。
この研究は、CSと他の研究分野を比較し、女性、黒人、ヒスパニック系、ラテン系の3つのグループから学生を成功させた。
データ駆動型アプローチを用いることで、CSの未表現グループにおける成功傾向が、他の分野に遅れを取っていることが示される。
論文 参考訳(メタデータ) (2023-11-25T01:00:23Z) - Evaluating and Incentivizing Diverse Data Contributions in Collaborative
Learning [89.21177894013225]
フェデレートされた学習モデルがうまく機能するためには、多様で代表的なデータセットを持つことが不可欠である。
データの多様性を定量化するために用いられる統計的基準と、使用するフェデレート学習アルゴリズムの選択が、結果の平衡に有意な影響を及ぼすことを示す。
我々はこれを活用して、データ収集者がグローバルな人口を代表するデータに貢献することを奨励する、シンプルな最適なフェデレーション学習機構を設計する。
論文 参考訳(メタデータ) (2023-06-08T23:38:25Z) - Assessing Scientific Contributions in Data Sharing Spaces [64.16762375635842]
本稿では、研究者の科学的貢献を測定するブロックチェーンベースのメトリクスであるSCIENCE-indexを紹介する。
研究者にデータ共有のインセンティブを与えるため、SCIENCE-indexはデータ共有パラメータを含むように拡張されている。
本モデルは, 地理的に多様な研究者の出力分布とh-indexの分布を比較して評価する。
論文 参考訳(メタデータ) (2023-03-18T19:17:47Z) - Data-centric AI: Perspectives and Challenges [51.70828802140165]
データ中心AI(DCAI)は、モデル進歩からデータ品質と信頼性の確保への根本的なシフトを提唱している。
データ開発、推論データ開発、データメンテナンスの3つの一般的なミッションをまとめます。
論文 参考訳(メタデータ) (2023-01-12T05:28:59Z) - Diversifying the Genomic Data Science Research Community [22.633385577446617]
我々はゲノミクス・データ・サイエンス・コミュニティ・ネットワークを設立し、機会を特定し、クラウド対応のゲノム・データ・サイエンスへの幅広いアクセスを支援する。
ここでは、UIの教員や管理者、資金提供者、R1研究者が、より多様なゲノムデータサイエンスコミュニティを構築するために考慮すべき優先順位についてまとめる。
論文 参考訳(メタデータ) (2022-01-20T20:36:18Z) - COVID-19 Datathon Based on Deidentified Governmental Data as an Approach
for Solving Policy Challenges, Increasing Trust, and Building a Community:
Case Study [4.643473310978546]
イスラエルの保健省(MoH)は、政府の特定データに基づく仮想データソンを開催した。
Datathonは、新型コロナウイルス(COVID-19)の健康政策問題に対処するために、運用可能なデータ駆動モデルを開発するように設計されている。
最も肯定的な結果は、MoHに対する信頼が増し、政府と協力する準備が整ったことである。
論文 参考訳(メタデータ) (2021-08-30T08:58:44Z) - Retiring Adult: New Datasets for Fair Machine Learning [47.27417042497261]
UCIアダルトは、多くのアルゴリズム的公正な介入の開発と比較の基礎として機能している。
UCIアダルトデータのスーパーセットを米国国勢調査資料から再構築し、その外部妥当性を制限するUCIアダルトデータセットの慣用性を明らかにする。
私たちの主な貢献は、公正な機械学習の研究のために既存のデータエコシステムを拡張する、一連の新しいデータセットです。
論文 参考訳(メタデータ) (2021-08-10T19:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。