論文の概要: Semantic Modelling of Organizational Knowledge as a Basis for Enterprise
Data Governance 4.0 -- Application to a Unified Clinical Data Model
- arxiv url: http://arxiv.org/abs/2311.02082v1
- Date: Fri, 20 Oct 2023 19:36:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-12 19:57:04.157634
- Title: Semantic Modelling of Organizational Knowledge as a Basis for Enterprise
Data Governance 4.0 -- Application to a Unified Clinical Data Model
- Title(参考訳): 企業データガバナンスの基盤としての組織知識のセマンティックモデリング 4.0 --統一臨床データモデルへの応用
- Authors: Miguel AP Oliveira, Stephane Manara, Bruno Mol\'e, Thomas Muller,
Aur\'elien Guillouche, Lysann Hesske, Bruce Jordan, Gilles Hubert, Chinmay
Kulkarni, Pralipta Jagdev and Cedric R. Berger
- Abstract要約: メタデータ駆動、アジャイル、および(半)自動化されたデータガバナンスを可能にする、シンプルでコスト効率のよいフレームワークを確立します。
企業規模で25年間の臨床研究データを、完全に生産的な環境で統合するために、このフレームワークをどのように実装し、利用するかを説明します。
- 参考スコア(独自算出の注目度): 6.302916372143144
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Individuals and organizations cope with an always-growing data amount,
heterogeneous in contents and formats. Prerequisites to get value out this data
and minimise inherent risks related to multiple usages are adequate data
management processes yielding data quality and control over its lifecycle.
Common data governance frameworks relying on people and policies falls short of
the overwhelming data complexity. Yet, harnessing this complexity is necessary
to achieve high quality standards. The later will condition the outcome of any
downstream data usage, including generative artificial intelligence trained on
this data. In this paper, we report our concrete experience establishing a
simple, cost-efficient framework, that enables metadata-driven, agile and
(semi-)automated data governance (i.e. Data Governance 4.0). We explain how we
implement and use this framework to integrate 25 years of clinical study data
at enterprise scale, in a fully productive environment. The framework
encompasses both methodologies and technologies leveraging semantic web
principles. We built an knowledge graph describing data assets avatars in their
business context including governance principles. Multiple ontologies
articulated by an enterprise upper ontology enable key governance actions such
as FAIRification, lifecycle management, definition of roles and
responsibilities, lineage across transformations and provenance from source
systems. This metadata model is a prerequisite to automatize data governance,
make it fit-for-purpose to each use case and dynamically adapting it to
business changes.
- Abstract(参考訳): 個人や組織は常に成長するデータ量に対処し、内容やフォーマットは異質である。
このデータから価値を得て、複数の利用に関連する固有のリスクを最小化する前提条件は、データの品質とライフサイクルの制御をもたらす適切なデータ管理プロセスである。
人とポリシーに依存する一般的なデータガバナンスフレームワークは、圧倒的なデータ複雑性に欠けています。
しかし、高品質な標準を達成するためには、この複雑さを活用する必要がある。
後者は、このデータで訓練された生成的人工知能を含む、ダウンストリームのデータ使用の結果を条件とする。
本稿では,メタデータ駆動,アジャイル,(準)自動データガバナンス(すなわちデータガバナンス 4.0)を実現する,シンプルでコスト効率のよいフレームワークを構築した具体的経験を報告する。
我々は,25年間の臨床研究データを企業規模で,完全に生産的な環境で統合するために,このフレームワークの実装と利用について説明する。
このフレームワークはセマンティックウェブの原則を利用する方法論と技術の両方を含んでいる。
ガバナンスの原則を含むビジネスコンテキストにおけるデータ資産アバターを記述するナレッジグラフを構築しました。
エンタープライズ上のオントロジーによって記述された複数のオントロジーは、FAIRification、ライフサイクル管理、役割と責任の定義、トランスフォーメーション間の血統、ソースコードからの証明といった重要なガバナンスのアクションを可能にします。
このメタデータモデルは、データガバナンスを自動化し、各ユースケースに適合させ、ビジネスの変化に動的に適用するための前提条件です。
関連論文リスト
- Efficient Data Collection for Robotic Manipulation via Compositional
Generalization [75.92297934925611]
視覚模倣学習政策が環境要因を構成することができるかどうかを検討する。
ポリシーは構成を示すが、実際のロボットでは、事前のロボットデータセットを活用することが重要である。
本稿では,合成を生かしたデータ収集戦略を提案する。
論文 参考訳(メタデータ) (2024-03-08T07:15:38Z) - An Integrated Data Processing Framework for Pretraining Foundation Models [57.47845148721817]
研究者や実践者は、しばしば異なるソースからデータセットを手動でキュレートする必要がある。
本稿では,処理モジュールと解析モジュールを統合したデータ処理フレームワークを提案する。
提案されたフレームワークは使いやすく、柔軟です。
論文 参考訳(メタデータ) (2024-02-26T07:22:51Z) - Transforming Agriculture with Intelligent Data Management and Insights [3.027257459810039]
現代の農業は、気候変動と天然資源の枯渇の制約の下で、食料、燃料、飼料、繊維の需要の増加に対応するための大きな課題に直面している。
データ革新は、アグロエコシステムの生産性、持続可能性、レジリエンスの確保と改善に緊急に必要です。
論文 参考訳(メタデータ) (2023-11-07T22:02:54Z) - Robot Fleet Learning via Policy Merging [58.5086287737653]
我々はFLEET-MERGEを提案し、艦隊設定における政策を効率的にマージする。
本稿では,FLEET-MERGEがメタワールド環境における50のタスクで訓練されたポリシーの行動を統合することを示す。
合成・接触に富んだロボット操作タスクにおけるフリートポリシー学習のための新しいロボットツール用ベンチマークであるFLEET-TOOLSを導入する。
論文 参考訳(メタデータ) (2023-10-02T17:23:51Z) - Mapping and Comparing Data Governance Frameworks: A benchmarking
exercise to inform global data governance deliberations [0.0]
この記事は、データの急速な成長と責任あるデータ利用と保護の必要性による、グローバルデータガバナンスの重要性の高まりについて説明する。
報告書は、データのグローバルフローを責任を持って、そして公共の関心のために管理するための、より包括的な、協調的なデータガバナンスアプローチの必要性を強調している。
論文 参考訳(メタデータ) (2023-02-27T12:56:25Z) - Towards Avoiding the Data Mess: Industry Insights from Data Mesh
Implementations [0.0]
Data Meshは、企業データ管理のための、社会技術的、分散化されたコンセプトである。
業界の専門家との15の半構造化インタビューを行います。
本研究は,業界の専門家による知見を総合し,データメッシュの採用を成功させるための予備的ガイドラインを研究者や専門家に提供する。
論文 参考訳(メタデータ) (2023-02-03T13:09:57Z) - 1st ICLR International Workshop on Privacy, Accountability,
Interpretability, Robustness, Reasoning on Structured Data (PAIR^2Struct) [28.549151517783287]
データプライバシ、説明可能性、解釈可能性、ロバスト性、推論は、決定クリティカルおよび/またはプライバシに敏感なアプリケーションに機械学習(ML)技術を使用する基本的な原則として認識されている。
本質的に構造化された知識を利用することで、より関連性の高い変数を特定し、使用して信頼性の高い決定を行うための、妥当なアプローチを設計することができる。
論文 参考訳(メタデータ) (2022-10-07T15:12:03Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Data Cards: Purposeful and Transparent Dataset Documentation for
Responsible AI [0.0]
我々は、データセットの透明性、目的、人間中心のドキュメンテーションを促進するためのデータカードを提案する。
データカードは、利害関係者が必要とするMLデータセットのさまざまな側面に関する重要な事実の要約である。
実世界のユーティリティと人間中心性にデータカードを基盤とするフレームワークを提示する。
論文 参考訳(メタデータ) (2022-04-03T13:49:36Z) - CateCom: a practical data-centric approach to categorization of
computational models [77.34726150561087]
本稿では,物理モデルとデータ駆動型計算モデルのランドスケープを整理する取り組みについて述べる。
オブジェクト指向設計の概念を適用し、オープンソース協調フレームワークの基礎を概説する。
論文 参考訳(メタデータ) (2021-09-28T02:59:40Z) - Learning to Limit Data Collection via Scaling Laws: Data Minimization
Compliance in Practice [62.44110411199835]
我々は機械学習法における文献に基づいて、データとシステム性能を結びつけるデータ解釈に基づく収集を制限するフレームワークを提案する。
我々は、性能曲線微分に基づくデータ最小化基準を定式化し、有効かつ解釈可能な分数法法技術を提供する。
論文 参考訳(メタデータ) (2021-07-16T19:59:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。