論文の概要: Knowledge Scientists: Unlocking the data-driven organization
- arxiv url: http://arxiv.org/abs/2004.07917v1
- Date: Thu, 16 Apr 2020 20:14:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 06:29:10.731862
- Title: Knowledge Scientists: Unlocking the data-driven organization
- Title(参考訳): 知識科学者: データ駆動型組織を解き放つ
- Authors: George Fletcher, Paul Groth, Juan Sequeda
- Abstract要約: 信頼できるデータのための技術は、異なる関心事と専門知識によって駆動されている、と私たちは主張する。
意味のある、説明可能な、再現可能な、保守可能なデータの重要さを識別する組織は、信頼できるデータの民主化の最前線にいる。
- 参考スコア(独自算出の注目度): 5.05432938384774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Organizations across all sectors are increasingly undergoing deep
transformation and restructuring towards data-driven operations. The central
role of data highlights the need for reliable and clean data. Unreliable,
erroneous, and incomplete data lead to critical bottlenecks in processing
pipelines and, ultimately, service failures, which are disastrous for the
competitive performance of the organization. Given its central importance,
those organizations which recognize and react to the need for reliable data
will have the advantage in the coming decade. We argue that the technologies
for reliable data are driven by distinct concerns and expertise which
complement those of the data scientist and the data engineer. Those
organizations which identify the central importance of meaningful, explainable,
reproducible, and maintainable data will be at the forefront of the
democratization of reliable data. We call the new role which must be developed
to fill this critical need the Knowledge Scientist. The organizational
structures, tools, methodologies and techniques to support and make possible
the work of knowledge scientists are still in their infancy. As organizations
not only use data but increasingly rely on data, it is time to empower the
people who are central to this transformation.
- Abstract(参考訳): あらゆる分野の組織は、データ駆動型オペレーションへの深い変革と再構築をますます進めている。
データの中心的な役割は、信頼性とクリーンなデータの必要性を強調する。
信頼できない、誤った、不完全なデータは、パイプラインの処理と、最終的にはサービス障害に重大なボトルネックをもたらします。
その中心的な重要性を考えると、信頼できるデータの必要性を認識して対応する組織は、今後10年で有利になるでしょう。
信頼できるデータのための技術は、データサイエンティストとデータエンジニアの関心を補完する、異なる関心事と専門知識によって駆動されると主張する。
意味のある、説明可能な、再現可能な、保守可能なデータの重要さを識別する組織は、信頼できるデータの民主化の最前線にいる。
我々は、この重要なニーズを満たすために開発されなければならない新しい役割を知識科学者と呼んでいる。
知識科学者の仕事を支援するための組織構造、ツール、方法論、技術は、まだ初期段階にある。
組織はデータを使うだけでなく、ますますデータに頼るようになるので、この変革の中心にいる人々を力づける時が来たのです。
関連論文リスト
- Open-sourced Data Ecosystem in Autonomous Driving: the Present and Future [130.87142103774752]
このレビューは、70以上のオープンソースの自動運転データセットを体系的に評価する。
高品質なデータセットの作成の基礎となる原則など、さまざまな側面に関する洞察を提供する。
また、解決を保障する科学的、技術的課題も検討している。
論文 参考訳(メタデータ) (2023-12-06T10:46:53Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - Towards Avoiding the Data Mess: Industry Insights from Data Mesh Implementations [1.5029560229270191]
Data Meshは、企業データ管理のための、社会技術的、分散化されたコンセプトである。
業界の専門家との15の半構造化インタビューを行います。
本研究は,業界の専門家による知見を総合し,データメッシュの採用を成功させるための予備的ガイドラインを研究者や専門家に提供する。
論文 参考訳(メタデータ) (2023-02-03T13:09:57Z) - Exploring the Critical Success Factors for Data Democratization [0.0]
データ民主化は、従業員へのデータアクセスを拡大するプロセスである。
本稿では,データの民主化における重要な成功要因を,詳細な文献レビューを通じて明らかにすることを目的とする。
論文 参考訳(メタデータ) (2022-12-04T22:07:45Z) - Invisible Data Curation Practices: A Case Study from Facility Management [0.0]
施設管理部門では、企業は建物に関するデータから価値を引き出そうとしている。
管理者はデータキュレーションに関与しています。
本稿では,3施設におけるデータキュレーションの実施状況について考察する。
論文 参考訳(メタデータ) (2021-11-05T09:09:42Z) - Understanding the World Through Action [91.3755431537592]
ラベルのないデータを利用するための汎用的で原則的で強力なフレームワークは、強化学習から導き出すことができると私は主張する。
このような手順が、下流の潜在的なタスクとどのように密接に一致しているかについて論じます。
論文 参考訳(メタデータ) (2021-10-24T22:33:52Z) - Trustworthy Transparency by Design [57.67333075002697]
本稿では,ユーザ信頼とエクスペリエンスに関する研究を取り入れた,ソフトウェア設計のための透明性フレームワークを提案する。
私たちのフレームワークは、その設計に透明性を取り入れたソフトウェアの開発を可能にします。
論文 参考訳(メタデータ) (2021-03-19T12:34:01Z) - Explainable Patterns: Going from Findings to Insights to Support Data
Analytics Democratization [60.18814584837969]
我々は,データストーリテリングの探索と作成において,レイユーザをサポートする新しいフレームワークであるExplainable Patterns (ExPatt)を提示する。
ExPattは、外部(テキスト)の情報ソースを使用して、観察または選択された発見の実用的な説明を自動的に生成します。
論文 参考訳(メタデータ) (2021-01-19T16:13:44Z) - Dataset Security for Machine Learning: Data Poisoning, Backdoor Attacks,
and Defenses [150.64470864162556]
この作業は体系的に分類され、幅広いデータセット脆弱性とエクスプロイトを議論する。
様々な毒とバックドアの脅威モデルとそれらの関係を記述することに加えて,それらの統一分類法を展開する。
論文 参考訳(メタデータ) (2020-12-18T22:38:47Z) - Towards Accountability for Machine Learning Datasets: Practices from
Software Engineering and Infrastructure [9.825840279544465]
機械学習を強化するデータセットは、しばしば使われ、共有され、再使用される。
本稿では、意思決定と説明責任をサポートするデータセット開発透明性のための厳格なフレームワークを紹介する。
論文 参考訳(メタデータ) (2020-10-23T01:57:42Z) - From Data to Knowledge to Action: A Global Enabler for the 21st Century [26.32590947516587]
コンピュータと数理科学の進歩が相まって、真の証拠に基づく意思決定を可能にする前例のない能力がもたらされた。
これらの機能は、データの大規模なキャプチャと、そのデータの洞察とレコメンデーションへの変換を可能にする。
商業、科学、教育、芸術、エンターテイメントのWebへの移行により、人間の活動に関する構造化された、非構造化されたデータベースが、これまで例のない量で利用可能になった。
論文 参考訳(メタデータ) (2020-07-31T19:19:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。