論文の概要: Agile (data) science: a (draft) manifesto
- arxiv url: http://arxiv.org/abs/2104.12545v3
- Date: Mon, 4 Jul 2022 12:00:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 07:25:49.433300
- Title: Agile (data) science: a (draft) manifesto
- Title(参考訳): アジャイル(データ)科学:(ドラフト)マニフェスト
- Authors: Juan Juli\'an Merelo-Guerv\'os, Mario Garc\'ia-Valdez
- Abstract要約: 産業レベルのデータサイエンスチームはアジャイルマインドセットを受け入れてきたが、学術ベースの科学は依然として、単一の最終製品(論文)に焦点を当てたマインドセットに偏っている。
このレポートでは、学界におけるアジャイルマインドセットとアジャイルデータサイエンスツールの採用を議論し、より責任を負い、何よりも再現可能な科学を創出します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Science has a data management problem, as well as a project management
problem. While industrial-grade data science teams have embraced the agile
mindset, and adopted or created all kind of tools to create reproducible
workflows, academia-based science is still (mostly) mired in a mindset that is
focused on a single final product (a paper), without focusing on incremental
improvement, on any specific problem or customer, or, paying any attention
reproducibility. In this report we argue towards the adoption of the agile
mindset and agile data science tools in academia, to make a more responsible,
and over all, reproducible science.
- Abstract(参考訳): 科学にはデータ管理の問題とプロジェクト管理の問題があります。
産業レベルのデータサイエンスチームは、アジャイルマインドセットを採用し、再現可能なワークフローを作るためのあらゆる種類のツールを採用または作成したが、学術ベースの科学は、(主に)単一の最終製品(紙)に焦点を絞ったマインドセットで、漸進的な改善、特定の問題や顧客、注意を払って、再現性に重点を置いている。
このレポートでは、学界におけるアジャイルマインドセットとアジャイルデータサイエンスツールの採用を議論し、より責任を負い、何よりも再現可能な科学を創出します。
関連論文リスト
- Progress and Opportunities of Foundation Models in Bioinformatics [77.74411726471439]
基礎モデル(FM)は、特に深層学習の領域において、計算生物学の新しい時代に定着した。
我々の焦点は、特定の生物学的問題にFMを応用することであり、研究ニーズに適切なFMを選択するために研究コミュニティを指導することを目的としています。
データノイズ、モデル説明可能性、潜在的なバイアスなど、生物学においてFMが直面する課題と限界を分析します。
論文 参考訳(メタデータ) (2024-02-06T02:29:17Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and
Regulatory Norms [58.93352076927003]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - CLAIMED -- the open source framework for building coarse-grained
operators for accelerated discovery in science [0.0]
CLAIMEDは、科学者が科学演算子を再コンパイルすることによって以前の研究から引き出すのを支援することで、再利用可能な演算子とスケーラブルな科学的不可知性を構築するためのフレームワークである。
CLAIMEDはプログラミング言語、科学ライブラリ、実行環境である。
論文 参考訳(メタデータ) (2023-07-12T11:54:39Z) - LIBERO: Benchmarking Knowledge Transfer for Lifelong Robot Learning [64.55001982176226]
LIBEROは、ロボット操作のための生涯学習の新しいベンチマークである。
宣言的知識、手続き的知識、あるいは両者の混在を効率的に伝達する方法に焦点を当てる。
我々は、無限に多くのタスクを生成できる拡張可能な手続き生成パイプラインを開発した。
論文 参考訳(メタデータ) (2023-06-05T23:32:26Z) - Position Paper on Dataset Engineering to Accelerate Science [1.952708415083428]
この作業では、トークン ittextdataset を使用して、明確に定義されたタスクを実行するために構築されたデータの構造化セットを指定する。
具体的には、科学において、各領域にはデータセットを整理、収集、処理するためのユニークな形態がある。
科学と工学の発見プロセスは、データセット上のそのような組織の必要性の極端な例である、と我々は主張する。
論文 参考訳(メタデータ) (2023-03-09T19:07:40Z) - TAPS Responsibility Matrix: A tool for responsible data science by
design [2.2973034509761816]
データサイエンスプロジェクトの社会的、法的、倫理的側面を探求する枠組みとして、透明性、説明責任、プライバシー、社会責任マトリックス(TAPS-RM)について述べる。
TAPS-RMの開発モデルと、オープンデータのためのよく知られたイニシアチブをマッピングする。
TAPS-RMはデータサイエンスプロジェクトレベルでの責任を反映するツールであり、設計による責任あるデータサイエンスの推進に利用することができると結論付けている。
論文 参考訳(メタデータ) (2023-02-02T12:09:14Z) - Artificial Intelligence and Natural Language Processing and
Understanding in Space: Four ESA Case Studies [48.53582660901672]
本稿では,空間文書から情報を自動的に抽出するための,人工知能と自然言語処理と理解に基づく方法論的枠組みを提案する。
ケーススタディはミッションデザイン、品質保証、長期データ保存、オープンスペースイノベーションプラットフォームなど、ESAのさまざまな機能領域で実装されている。
論文 参考訳(メタデータ) (2022-10-07T15:50:17Z) - Opinionated practices for teaching reproducibility: motivation, guided
instruction and practice [0.0]
予測モデリングは、しばしばデータサイエンスの初心者にとって最も興味深いトピックの1つである。
学生は本質的にこのトピックを学ぶ動機がなく、学ぶのは容易ではない。
余分なモチベーション、指導、多くのプラクティスを提供することが、このトピックを効果的に教える鍵となります。
論文 参考訳(メタデータ) (2021-09-17T19:15:41Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z) - COG: Connecting New Skills to Past Experience with Offline Reinforcement
Learning [78.13740204156858]
我々は、動的プログラミングによって新しいスキルを拡張するために、事前データを再利用できることを示します。
我々は、新しいタスクを解決するために、以前のデータセットに見られるいくつかの動作をチェーンすることで、アプローチの有効性を実証する。
我々は、高次元画像観察を低レベルのロボット制御コマンドにマッピングし、エンドツーエンドでポリシーを訓練する。
論文 参考訳(メタデータ) (2020-10-27T17:57:29Z) - A user-centered approach to designing an experimental laboratory data
platform [0.0]
実験的なデータプラットフォームにおいて、設計と機能の本質的な要素が何を求めているのかを理解するために、ユーザ中心のアプローチを採用しています。
リッチで複雑な実験データセットをコンテキスト化できる能力を持つことが、ユーザの主な要件であることに気付きました。
論文 参考訳(メタデータ) (2020-07-28T19:26:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。