論文の概要: Data Stewardship Decoded: Mapping Its Diverse Manifestations and Emerging Relevance at a time of AI
- arxiv url: http://arxiv.org/abs/2502.10399v1
- Date: Mon, 20 Jan 2025 16:24:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-02 04:52:06.273818
- Title: Data Stewardship Decoded: Mapping Its Diverse Manifestations and Emerging Relevance at a time of AI
- Title(参考訳): データスチュワードのデコード:AIの時、その多彩な操作と創発的妥当性をマッピングする
- Authors: Stefaan Verhulst,
- Abstract要約: データスチュワードシップは、特に人工知能(AI)の利用の増加に伴い、現代データガバナンスの重要な要素となっている。
重要性が増しているにもかかわらず、データスチュワードシップの概念はあいまいであり、その適用範囲は様々である。
本稿では,データガバナンスの現場における新たな立場を明らかにするために,データスチュワードシップの4つの特徴について考察する。
- 参考スコア(独自算出の注目度): 0.21756081703275998
- License:
- Abstract: Data stewardship has become a critical component of modern data governance, especially with the growing use of artificial intelligence (AI). Despite its increasing importance, the concept of data stewardship remains ambiguous and varies in its application. This paper explores four distinct manifestations of data stewardship to clarify its emerging position in the data governance landscape. These manifestations include a) data stewardship as a set of competencies and skills, b) a function or role within organizations, c) an intermediary organization facilitating collaborations, and d) a set of guiding principles. The paper subsequently outlines the core competencies required for effective data stewardship, explains the distinction between data stewards and Chief Data Officers (CDOs), and details the intermediary role of stewards in bridging gaps between data holders and external stakeholders. It also explores key principles aligned with the FAIR framework (Findable, Accessible, Interoperable, Reusable) and introduces the emerging principle of AI readiness to ensure data meets the ethical and technical requirements of AI systems. The paper emphasizes the importance of data stewardship in enhancing data collaboration, fostering public value, and managing data reuse responsibly, particularly in the era of AI. It concludes by identifying challenges and opportunities for advancing data stewardship, including the need for standardized definitions, capacity building efforts, and the creation of a professional association for data stewardship.
- Abstract(参考訳): データスチュワードシップは、特に人工知能(AI)の利用の増加に伴い、現代のデータガバナンスの重要なコンポーネントとなっている。
その重要性は増しているが、データスチュワードシップの概念はあいまいであり、その適用範囲は様々である。
本稿では,データガバナンスの現場における新たな立場を明らかにするために,データスチュワードシップの4つの特徴について考察する。
これらの徴候には
a) 能力と技能のセットとしてのデータ管理
b) 組織内の機能又は役割
c) 協力を促進する仲介組織、及び
d) 指針の集合
この論文はその後、効果的なデータスチュワードシップに必要なコア能力を概説し、データスチュワードとチーフデータオフィサー(CDO)の区別を説明し、データ所有者と外部ステークホルダーの間のギャップを埋める際のスチュワードの役割について詳述する。
また、FAIRフレームワーク(Findable、Accessible、Interoperable、Reusable)に沿った重要な原則を探求し、AIシステムの倫理的および技術的要件を確実に満たすために、AI準備の新たな原則を導入している。
本稿では、特にAI時代において、データコラボレーションの強化、公開価値の育成、データ再利用の責任を負う管理において、データスチュワードシップの重要性を強調した。
それは、標準化された定義の必要性、キャパシティ構築の取り組み、データスチュワードシップのための専門的協会の創設など、データスチュワードシップを進めるための課題と機会を特定することで締めくくられる。
関連論文リスト
- Towards Human-Guided, Data-Centric LLM Co-Pilots [53.35493881390917]
CliMB-DCは、機械学習コパイロットのための、ヒューマンガイド付き、データ中心のフレームワークである。
高度なデータ中心ツールとLLM駆動推論を組み合わせることで、堅牢でコンテキスト対応のデータ処理を可能にする。
CliMB-DCが未処理のデータセットをML対応フォーマットに変換する方法を示す。
論文 参考訳(メタデータ) (2025-01-17T17:51:22Z) - Towards Data Governance of Frontier AI Models [0.0]
私たちは、フロンティアAIモデルに対して、データが新たなガバナンス能力を実現する方法について検討する。
データは非リバルで、しばしば非排除可能で、容易に複製可能で、ますます合成可能になっている。
データサプライチェーンに沿ってキーアクターをターゲットにした一連のポリシー機構を提案する。
論文 参考訳(メタデータ) (2024-12-05T02:37:51Z) - Blockchain-Enabled Accountability in Data Supply Chain: A Data Bill of Materials Approach [16.31469678670097]
データ請求書(Data Bill of Materials, DataBOM)は、特定のメタデータを格納することで、異なるデータセットと利害関係者間の依存関係関係をキャプチャする。
ブロックチェーンベースのDataBOMサービスを提供するためのプラットフォームアーキテクチャを実証し、利害関係者のためのインタラクションプロトコルを提示し、DataBOMメタデータの最小要件について議論する。
論文 参考訳(メタデータ) (2024-08-16T05:34:50Z) - Human-Data Interaction Framework: A Comprehensive Model for a Future Driven by Data and Humans [0.0]
HDI(Human-Data Interaction)フレームワークは、現代のデジタル世界でのデータガバナンスと利用に関連する課題と倫理的問題に取り組むための重要なアプローチとなっている。
本稿では、組織がHDI原則をシームレスに統合するために必要な基本的な手順を概説する。
論文 参考訳(メタデータ) (2024-07-30T17:57:09Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Data Acquisition: A New Frontier in Data-centric AI [65.90972015426274]
まず、現在のデータマーケットプレースを調査し、データセットに関する詳細な情報を提供するプラットフォームが不足していることを明らかにする。
次に、データプロバイダと取得者間のインタラクションをモデル化するベンチマークであるDAMチャレンジを紹介します。
提案手法の評価は,機械学習における効果的なデータ取得戦略の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-11-22T22:15:17Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - Towards Avoiding the Data Mess: Industry Insights from Data Mesh Implementations [1.5029560229270191]
Data Meshは、企業データ管理のための、社会技術的、分散化されたコンセプトである。
業界の専門家との15の半構造化インタビューを行います。
本研究は,業界の専門家による知見を総合し,データメッシュの採用を成功させるための予備的ガイドラインを研究者や専門家に提供する。
論文 参考訳(メタデータ) (2023-02-03T13:09:57Z) - Data-centric AI: Perspectives and Challenges [51.70828802140165]
データ中心AI(DCAI)は、モデル進歩からデータ品質と信頼性の確保への根本的なシフトを提唱している。
データ開発、推論データ開発、データメンテナンスの3つの一般的なミッションをまとめます。
論文 参考訳(メタデータ) (2023-01-12T05:28:59Z) - Data Governance in the Age of Large-Scale Data-Driven Language
Technology [79.92626780294258]
この研究は、利害関係者、価値観、権利間のデータ管理を組織化しようとする、グローバル言語データガバナンスへのアプローチを提案する。
現在提案するフレームワークは、言語データに焦点を当てた多政党の国際ガバナンス構造であり、その作業を支援するために必要な技術および組織ツールを取り入れています。
論文 参考訳(メタデータ) (2022-05-04T00:44:35Z) - Data Justice in Practice: A Guide for Developers [2.5953185061765884]
Advancing Data Justice Research and Practice プロジェクトは、現代のデータ収集、ガバナンス、利用のエコロジーにおける差別と不平等に寄与する社会的、歴史的、文化的、政治的、経済的力の理解を深めることを目的としている。
これは、データ集約技術の作成、調達、使用を行っている開発者や組織のためのガイドの草案です。
論文 参考訳(メタデータ) (2022-04-12T09:33:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。