論文の概要: Scaling Data Science Solutions with Semantics and Machine Learning:
Bosch Case
- arxiv url: http://arxiv.org/abs/2308.01094v1
- Date: Wed, 2 Aug 2023 11:58:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-03 13:10:57.427794
- Title: Scaling Data Science Solutions with Semantics and Machine Learning:
Bosch Case
- Title(参考訳): セマンティックスと機械学習によるデータサイエンスソリューションのスケーリング - Bosch氏のケース
- Authors: Baifan Zhou, Nikolay Nikolov, Zhuoxun Zheng, Xianghui Luo, Ognjen
Savkovic, Dumitru Roman, Ahmet Soylu, Evgeny Kharlamov
- Abstract要約: SemCloudはセマンティックスに強化されたクラウドシステムで、セマンティック技術と機械学習を備えている。
このシステムは、何百万ものデータ、何千もの繰り返し実行、ドメインユーザによる産業ユースケースで評価され、有望な結果を示している。
- 参考スコア(独自算出の注目度): 8.445414390004636
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Industry 4.0 and Internet of Things (IoT) technologies unlock unprecedented
amount of data from factory production, posing big data challenges in volume
and variety. In that context, distributed computing solutions such as cloud
systems are leveraged to parallelise the data processing and reduce computation
time. As the cloud systems become increasingly popular, there is increased
demand that more users that were originally not cloud experts (such as data
scientists, domain experts) deploy their solutions on the cloud systems.
However, it is non-trivial to address both the high demand for cloud system
users and the excessive time required to train them. To this end, we propose
SemCloud, a semantics-enhanced cloud system, that couples cloud system with
semantic technologies and machine learning. SemCloud relies on domain
ontologies and mappings for data integration, and parallelises the semantic
data integration and data analysis on distributed computing nodes. Furthermore,
SemCloud adopts adaptive Datalog rules and machine learning for automated
resource configuration, allowing non-cloud experts to use the cloud system. The
system has been evaluated in industrial use case with millions of data,
thousands of repeated runs, and domain users, showing promising results.
- Abstract(参考訳): 産業 4.0 と Internet of Things (IoT) 技術は、工場生産から前例のない量のデータをアンロックし、ボリュームと多様性においてビッグデータの課題を提起する。
その文脈では、クラウドシステムのような分散コンピューティングソリューションを利用して、データ処理を並列化し、計算時間を短縮する。
クラウドシステムが普及するにつれて、元来クラウドの専門家ではないユーザ(データサイエンティストやドメインエキスパートなど)が、ソリューションをクラウドシステムにデプロイする必要性が高まっている。
しかし、クラウドシステムのユーザに対する高い需要と、トレーニングに要する過剰な時間の両方に対処するのは簡単ではない。
そこで本研究では,semcloudを提案する。semcloudは,クラウドシステムとセマンティック技術と機械学習を結合する,セマンティック拡張型クラウドシステムである。
SemCloudは、データ統合のためのドメインオントロジーとマッピングに依存し、分散コンピューティングノード上のセマンティックデータ統合とデータ分析を並列化する。
さらに、SemCloudはアダプティブなDatalogルールと機械学習を採用して、自動リソース設定を実現している。
このシステムは、何百万ものデータ、何千もの繰り返し実行、ドメインユーザによる産業ユースケースで評価され、有望な結果を示している。
関連論文リスト
- Integrating Homomorphic Encryption and Trusted Execution Technology for
Autonomous and Confidential Model Refining in Cloud [4.21388107490327]
同型暗号化と信頼性の高い実行環境技術は、自律的な計算の機密性を保護することができる。
モデル精錬方式の設計にこれらの2つの手法を統合することを提案する。
論文 参考訳(メタデータ) (2023-08-02T06:31:41Z) - CWD: A Machine Learning based Approach to Detect Unknown Cloud Workloads [3.523208537466129]
我々は、クラウド環境で実行されるワークロードを特徴付け、プロファイルし、予測する機械学習ベースの技術を開発した。
また,モデルの性能をスタンドアローンで解析する手法も開発している。
論文 参考訳(メタデータ) (2022-11-28T19:41:56Z) - Kubric: A scalable dataset generator [73.78485189435729]
KubricはPythonフレームワークで、PyBulletやBlenderとインターフェースして写真リアリスティックなシーンを生成する。
本研究では,3次元NeRFモデルの研究から光フロー推定まで,13種類の異なるデータセットを提示することで,Kubricの有効性を実証する。
論文 参考訳(メタデータ) (2022-03-07T18:13:59Z) - Unsupervised Point Cloud Representation Learning with Deep Neural
Networks: A Survey [104.71816962689296]
大規模クラウドラベリングの制約により,教師なしのポイントクラウド表現学習が注目されている。
本稿では、ディープニューラルネットワークを用いた教師なしポイントクラウド表現学習の総合的なレビューを提供する。
論文 参考訳(メタデータ) (2022-02-28T07:46:05Z) - Edge-Cloud Polarization and Collaboration: A Comprehensive Survey [61.05059817550049]
クラウドとエッジ両方のAIの体系的なレビューを行います。
私たちはクラウドとエッジモデリングの協調学習メカニズムを最初にセットアップしました。
我々は現在進行中の最先端AIトピックの可能性と実践経験について議論する。
論文 参考訳(メタデータ) (2021-11-11T05:58:23Z) - Auto-Split: A General Framework of Collaborative Edge-Cloud AI [49.750972428032355]
本稿では,Huawei Cloudのエッジクラウド共同プロトタイプであるAuto-Splitの技法と技術実践について述べる。
私たちの知る限りでは、Deep Neural Network(DNN)分割機能を提供する既存の産業製品はありません。
論文 参考訳(メタデータ) (2021-08-30T08:03:29Z) - Cloud Computing Concept and Roots [0.0]
クラウドコンピューティングは分散コンピューティングの特別な実装である。
スケーラビリティ、信頼性、分散透明性など、分散コンピューティングの多くの特性を継承した。
新しい処理とストレージリソースをCloudリソースプールにシームレスに追加することができる。
論文 参考訳(メタデータ) (2021-01-28T17:42:46Z) - Sampling Training Data for Continual Learning Between Robots and the
Cloud [26.116999231118793]
ロボットに搭載され、システムのボトルネックを低減するインテリジェントなサンプリングアルゴリズムであるHarvestNetを紹介します。
これは、道路建設現場の新しいデータセット、自動運転車のフィールドテスト、およびストリーミング顔認識上の機械学習モデルの精度を大幅に改善します。
ベースラインアルゴリズムよりも1.05-2.58倍正確であり、sscalablyは組み込みディープラーニングハードウェア上で動作する。
論文 参考訳(メタデータ) (2020-12-12T05:52:33Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z) - Anomaly Detection in a Large-scale Cloud Platform [9.283888139549067]
クラウドコンピューティングはユビキタスで、ますます多くの企業がワークロードをクラウドに移行している。
サービスプロバイダは、成長を続ける製品の品質を効果的に監視する必要があります。
我々は,IBM Cloud Platform用の自動監視システムを設計,実装した。
論文 参考訳(メタデータ) (2020-10-21T12:58:36Z) - A Privacy-Preserving Distributed Architecture for
Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。
クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文 参考訳(メタデータ) (2020-03-30T15:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。