論文の概要: AI Data Development: A Scorecard for the System Card Framework
- arxiv url: http://arxiv.org/abs/2506.02071v1
- Date: Mon, 02 Jun 2025 06:35:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.896154
- Title: AI Data Development: A Scorecard for the System Card Framework
- Title(参考訳): AIデータ開発 - システムカードフレームワークのためのスコアカード
- Authors: Tadesse K. Bahiru, Haileleol Tibebu, Ioannis A. Kakadiaris,
- Abstract要約: 本稿では,AIデータセットの開発を評価するために設計されたスコアカードを紹介する。
この手法は、データセットの品質と完全性を評価するために、取り込み形式と評価基準を用いて構造化されたアプローチに従う。
スコアカードは、技術的および倫理的な側面に対処し、データプラクティスの全体的評価を提供する。
- 参考スコア(独自算出の注目度): 3.0723404270319685
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial intelligence has transformed numerous industries, from healthcare to finance, enhancing decision-making through automated systems. However, the reliability of these systems is mainly dependent on the quality of the underlying datasets, raising ongoing concerns about transparency, accountability, and potential biases. This paper introduces a scorecard designed to evaluate the development of AI datasets, focusing on five key areas from the system card framework data development life cycle: data dictionary, collection process, composition, motivation, and pre-processing. The method follows a structured approach, using an intake form and scoring criteria to assess the quality and completeness of the data set. Applied to four diverse datasets, the methodology reveals strengths and improvement areas. The results are compiled using a scoring system that provides tailored recommendations to enhance the transparency and integrity of the data set. The scorecard addresses technical and ethical aspects, offering a holistic evaluation of data practices. This approach aims to improve the quality of the data set. It offers practical guidance to curators and researchers in developing responsible AI systems, ensuring fairness and accountability in decision support systems.
- Abstract(参考訳): 人工知能は医療から金融、自動システムによる意思決定の強化など、多くの産業を変革してきた。
しかしながら、これらのシステムの信頼性は、主に基盤となるデータセットの品質に依存し、透明性、説明責任、潜在的なバイアスに関する継続的な懸念を提起する。
本稿では,データ辞書,収集プロセス,合成,モチベーション,前処理という,システムカードフレームワークのデータ開発ライフサイクルの5つの重要な領域に着目し,AIデータセットの開発を評価するために設計されたスコアカードを紹介する。
この手法は、データセットの品質と完全性を評価するために、取り込み形式と評価基準を用いて構造化されたアプローチに従う。
4つの多様なデータセットに適用すると、その方法論は強みと改善領域を明らかにする。
結果は、データセットの透明性と整合性を高めるために、カスタマイズされたレコメンデーションを提供するスコアシステムを使用してコンパイルされる。
スコアカードは、技術的および倫理的な側面に対処し、データプラクティスの全体的評価を提供する。
このアプローチはデータセットの品質を改善することを目的としています。
キュレーターや研究者に、責任あるAIシステムを開発するための実践的なガイダンスを提供し、意思決定支援システムにおける公正性と説明責任を保証する。
関連論文リスト
- GPT in Data Science: A Practical Exploration of Model Selection [0.7646713951724013]
この研究は、AI意思決定プロセスの理解を深めることにコミットしています。
我々の取り組みは、より透明で理解しやすいAIシステムの構築に向けられている。
論文 参考訳(メタデータ) (2023-11-20T03:42:24Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - Collect, Measure, Repeat: Reliability Factors for Responsible AI Data
Collection [8.12993269922936]
AIのデータ収集は責任ある方法で行うべきだと我々は主張する。
本稿では,データ収集をメトリクスの集合でガイドするResponsible AI(RAI)手法を提案する。
論文 参考訳(メタデータ) (2023-08-22T18:01:27Z) - Human-Centric Multimodal Machine Learning: Recent Advances and Testbed
on AI-based Recruitment [66.91538273487379]
人間中心のアプローチでAIアプリケーションを開発する必要性には、ある程度のコンセンサスがある。
i)ユーティリティと社会的善、(ii)プライバシとデータ所有、(iii)透明性と説明責任、(iv)AIによる意思決定プロセスの公正性。
異種情報ソースに基づく現在のマルチモーダルアルゴリズムは、データ中の機密要素や内部バイアスによってどのように影響を受けるかを検討する。
論文 参考訳(メタデータ) (2023-02-13T16:44:44Z) - The Principles of Data-Centric AI (DCAI) [9.211953610948862]
新たな概念としてのデータ中心型AI(DCAI)は、データ、その品質、ダイナミズムを最前線にもたらす。
この記事では、DCAIの基礎を概説するために、データ中心の視点と概念をまとめます。
論文 参考訳(メタデータ) (2022-11-26T16:43:40Z) - Trustworthy AI [75.99046162669997]
入力データの小さな敵対的変化への脆さ、決定の説明能力、トレーニングデータのバイアスに対処する能力は、最も顕著な制限である。
我々は,AIシステムに対するユーザおよび公的な信頼を高める上での6つの重要な問題に対処するために,信頼に値するAIに関するチュートリアルを提案する。
論文 参考訳(メタデータ) (2020-11-02T20:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。