論文の概要: Biases in Data Science Lifecycle
- arxiv url: http://arxiv.org/abs/2009.09795v2
- Date: Tue, 27 Oct 2020 12:31:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-03 00:30:01.592761
- Title: Biases in Data Science Lifecycle
- Title(参考訳): データサイエンスライフサイクルにおけるバイアス
- Authors: Dinh-An Ho and Oya Beyan
- Abstract要約: 本研究の目的は,データ科学者の実践的ガイドラインを提供し,その意識を高めることである。
この研究では、さまざまなバイアス源をレビューし、データサイエンスライフサイクルの異なる段階の下でグループ化しました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In recent years, data science has become an indispensable part of our
society. Over time, we have become reliant on this technology because of its
opportunity to gain value and new insights from data in any field - business,
socializing, research and society. At the same time, it raises questions about
how justified we are in placing our trust in these technologies. There is a
risk that such powers may lead to biased, inappropriate or unintended actions.
Therefore, ethical considerations which might occur as the result of data
science practices should be carefully considered and these potential problems
should be identified during the data science lifecycle and mitigated if
possible. However, a typical data scientist has not enough knowledge for
identifying these challenges and it is not always possible to include an ethics
expert during data science production. The aim of this study is to provide a
practical guideline to data scientists and increase their awareness. In this
work, we reviewed different sources of biases and grouped them under different
stages of the data science lifecycle. The work is still under progress. The aim
of early publishing is to collect community feedback and improve the curated
knowledge base for bias types and solutions.
- Abstract(参考訳): 近年、データサイエンスは我々の社会にとって欠かせない部分となっている。
ビジネス、社会化、研究、社会など、あらゆる分野のデータから価値と新たな洞察を得る機会があるので、私たちはこの技術に依存しています。
同時に、これらの技術への信頼がいかに正当化されているかという疑問も持ち上がっています。
このような力がバイアス、不適切、意図しない行動につながるリスクがある。
したがって、データサイエンスの実践の結果として生じる可能性のある倫理的考察を慎重に検討すべきであり、これらの潜在的な問題はデータサイエンスライフサイクル中に特定され、可能であれば軽減されるべきである。
しかし、典型的なデータ科学者はこれらの課題を特定するのに十分な知識を持っておらず、データサイエンス生産中に倫理の専門家を組み込むことは必ずしも不可能である。
本研究の目的は,データ科学者の実践的ガイドラインを提供し,その意識を高めることである。
本研究では,データサイエンスライフサイクルの異なる段階において,さまざまなバイアス源をレビューし,それらをグループ化した。
その作業はまだ進行中です。
早期出版の目的は、コミュニティのフィードバックを集め、バイアスタイプとソリューションのキュレートされた知識ベースを改善することである。
関連論文リスト
- Eagle: Ethical Dataset Given from Real Interactions [74.7319697510621]
社会的バイアス、毒性、不道徳な問題を示すChatGPTとユーザ間の実際のインタラクションから抽出されたデータセットを作成します。
我々の実験では、イーグルは、そのような倫理的課題の評価と緩和のために提案された既存のデータセットでカバーされていない相補的な側面を捉えている。
論文 参考訳(メタデータ) (2024-02-22T03:46:02Z) - Data Science for Social Good [2.8621556092850065]
本稿では,「データ・サイエンス・フォー・ソーシャル・グッド」(DSSG)研究の枠組みについて述べる。
本研究では,情報システムにおけるDSSG研究の質を実証的に示すために,文献の分析を行う。
この記事と特別号が今後のDSSG研究を刺激することを期待している。
論文 参考訳(メタデータ) (2023-11-02T15:40:20Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - A data science axiology: the nature, value, and risks of data science [0.0]
データサイエンスは、知識発見のための未完成のスコープ、スケール、複雑さ、パワーを持つ研究パラダイムである。
本稿では、データサイエンスの公理、その目的、性質、重要性、リスク、問題解決の価値について述べる。
論文 参考訳(メタデータ) (2023-07-19T21:12:04Z) - How Data Scientists Review the Scholarly Literature [4.406926847270567]
データサイエンティストの文献レビューの実践について検討する。
データサイエンスは、論文の指数的な増加を示す分野である。
これらの科学者が直面する具体的な実践や課題について、事前の研究は行われていない。
論文 参考訳(メタデータ) (2023-01-10T03:53:05Z) - A Non-Expert's Introduction to Data Ethics for Mathematicians [0.0]
データ倫理に関する背景情報と社会的文脈から始めます。
私は、データ倫理、社会、社会的善に関するいくつかの取り組みを、私の自宅や他の施設で簡単に強調します。
次に、研究におけるオープンデータ、研究の複製性、その他の研究における倫理的問題について議論します。
次に、倫理原則、制度審査委員会、および人間のデータの科学的利用に関するいくつかの考察について論じる。
論文 参考訳(メタデータ) (2022-01-18T23:31:06Z) - An Ethical Highlighter for People-Centric Dataset Creation [62.886916477131486]
本稿では,既存のデータセットの倫理的評価を導くための分析フレームワークを提案する。
我々の研究は、先行研究のレビューと分析によって知らされ、そのような倫理的課題が生じる場所を強調します。
論文 参考訳(メタデータ) (2020-11-27T07:18:44Z) - Data Science: A Comprehensive Overview [42.98602883069444]
21世紀はビッグデータとデータ経済の時代に始まり、データDNAはすべてのデータに基づく有機体の本質的な構成要素となっている。
データDNAとその生物の適切な理解は、新しいデータ科学の分野と分析のキーストーンに依存している。
この記事では、データサイエンスと分析に関する豊富な観察、教訓、考察に加えて、総合的な全体像を描いている分野としては、初めてである。
論文 参考訳(メタデータ) (2020-07-01T02:33:58Z) - Data Science: Nature and Pitfalls [42.98602883069444]
初期のデータサイエンスの健全な発展にとって重要なことは、データ科学とデータ科学の性質を深く理解することである。
これらの重要な問題は、この記事の議論を動機付けている。
論文 参考訳(メタデータ) (2020-06-28T02:06:54Z) - A Data Scientist's Guide to Streamflow Prediction [55.22219308265945]
我々は,水文降雨要素と流出モデルに着目し,洪水の予測と流れの予測に応用する。
このガイドは、データサイエンティストが問題や水文学的な概念、そしてその過程で現れる詳細を理解するのを助けることを目的としています。
論文 参考訳(メタデータ) (2020-06-05T08:04:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。