論文の概要: TAPS Responsibility Matrix: A tool for responsible data science by
design
- arxiv url: http://arxiv.org/abs/2302.01041v1
- Date: Thu, 2 Feb 2023 12:09:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-03 14:11:00.224870
- Title: TAPS Responsibility Matrix: A tool for responsible data science by
design
- Title(参考訳): TAPS Responsibility Matrix: 設計による責任あるデータサイエンスのためのツール
- Authors: Visara Urovi, Remzi Celebi, Chang Sun, Linda Rieswijk, Michael Erard,
Arif Yilmaz, Kody Moodley, Parveen Kumar and Michel Dumontier
- Abstract要約: データサイエンスプロジェクトの社会的、法的、倫理的側面を探求する枠組みとして、透明性、説明責任、プライバシー、社会責任マトリックス(TAPS-RM)について述べる。
TAPS-RMの開発モデルと、オープンデータのためのよく知られたイニシアチブをマッピングする。
TAPS-RMはデータサイエンスプロジェクトレベルでの責任を反映するツールであり、設計による責任あるデータサイエンスの推進に利用することができると結論付けている。
- 参考スコア(独自算出の注目度): 2.2973034509761816
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data science is an interdisciplinary research area where scientists are
typically working with data coming from different fields. When using and
analyzing data, the scientists implicitly agree to follow standards,
procedures, and rules set in these fields. However, guidance on the
responsibilities of the data scientists and the other involved actors in a data
science project is typically missing. While literature shows that novel
frameworks and tools are being proposed in support of open-science, data reuse,
and research data management, there are currently no frameworks that can fully
express responsibilities of a data science project. In this paper, we describe
the Transparency, Accountability, Privacy, and Societal Responsibility Matrix
(TAPS-RM) as framework to explore social, legal, and ethical aspects of data
science projects. TAPS-RM acts as a tool to provide users with a holistic view
of their project beyond key outcomes and clarifies the responsibilities of
actors. We map the developed model of TAPS-RM with well-known initiatives for
open data (such as FACT, FAIR and Datasheets for datasets). We conclude that
TAPS-RM is a tool to reflect on responsibilities at a data science project
level and can be used to advance responsible data science by design.
- Abstract(参考訳): データサイエンスは学際的な研究分野であり、科学者は典型的に異なる分野から来るデータを扱う。
データを使用、分析する際には、これらの分野で設定された標準、手順、規則に従うことに暗黙的に同意する。
しかし、データサイエンティストとデータサイエンスプロジェクトに関わる他のアクターの責任に関するガイダンスは、一般的に欠落している。
文献によると、オープンサイエンス、データ再利用、研究データ管理をサポートする新しいフレームワークやツールが提案されているが、現在、データサイエンスプロジェクトの責任を完全に表現できるフレームワークは存在しない。
本稿では,データサイエンスプロジェクトの社会的,法的,倫理的側面を探求する枠組みとして,透明性,説明責任,プライバシー,社会責任マトリックス(TAPS-RM)について述べる。
TAPS-RMは、主要な成果以上のプロジェクトの全体像をユーザに提供し、アクターの責任を明らかにするツールとして機能する。
taps-rmの開発モデルをオープンデータ(fact、fair、datasheets for datasetsなど)のためによく知られたイニシアティブとマップします。
TAPS-RMはデータサイエンスプロジェクトのレベルで責任を反映するツールであり、設計による責任あるデータサイエンスの推進に使用できると結論付けている。
関連論文リスト
- SciER: An Entity and Relation Extraction Dataset for Datasets, Methods, and Tasks in Scientific Documents [49.54155332262579]
我々は,科学論文のデータセット,メソッド,タスクに関連するエンティティに対して,新たなエンティティと関係抽出データセットをリリースする。
我々のデータセットには、24k以上のエンティティと12kの関係を持つ106の注釈付きフルテキストの科学出版物が含まれています。
論文 参考訳(メタデータ) (2024-10-28T15:56:49Z) - DSBench: How Far Are Data Science Agents to Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - The Future of Data Science Education [0.11566458078238004]
バージニア大学のデータサイエンススクールは、データサイエンスの定義のための新しいモデルを開発した。
本稿では、モデルの中核となる特徴を説明し、AIの分析コンポーネントを超えて、さまざまな概念を統合する方法について説明する。
論文 参考訳(メタデータ) (2024-07-16T15:11:54Z) - SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.49349719239584]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。
SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-10T15:19:09Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - The Problem of Zombie Datasets:A Framework For Deprecating Datasets [55.878249096379804]
我々は、ImageNet、8000 Million Tiny Images、MS-Celeb-1M、Duke MTMC、Brainwash、HRT Transgenderなど、いくつかの著名なデータセットの公開後処理について検討する。
本稿では,リスクの考慮,影響の緩和,アピール機構,タイムライン,非推奨プロトコル,公開チェックなどを含むデータセットの非推奨化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-18T20:13:51Z) - Data Science Methodologies: Current Challenges and Future Approaches [0.0]
ビジョンの欠如と明確な目標、技術的な問題への偏り、アドホックプロジェクトの成熟度が低いことが、これらの課題のひとつです。
チーム、プロジェクト、データ、情報管理の完全なガイドラインを提供する方法論はほとんどない。
総合的な視点でデータサイエンスプロジェクトを管理するための方法論が持つべき一般的な特徴を含む概念的枠組みを提案する。
論文 参考訳(メタデータ) (2021-06-14T10:34:50Z) - Towards Accountability for Machine Learning Datasets: Practices from
Software Engineering and Infrastructure [9.825840279544465]
機械学習を強化するデータセットは、しばしば使われ、共有され、再使用される。
本稿では、意思決定と説明責任をサポートするデータセット開発透明性のための厳格なフレームワークを紹介する。
論文 参考訳(メタデータ) (2020-10-23T01:57:42Z) - Computational Skills by Stealth in Secondary School Data Science [16.960800464621993]
本稿では,学生によるデータサイエンスへの最初の露出における計算スキルのステルス開発について論じる。
このアプローチの目的は、データ駆動学習者になる際に、興味やコーディングの自己効力によらず、学生を支援することである。
論文 参考訳(メタデータ) (2020-10-08T09:11:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。