論文の概要: Distributed data analytics
- arxiv url: http://arxiv.org/abs/2203.14088v1
- Date: Sat, 26 Mar 2022 14:10:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 17:48:54.897155
- Title: Distributed data analytics
- Title(参考訳): 分散データ分析
- Authors: Richard Mortier, Hamed Haddadi, Sandra Servia, Liang Wang
- Abstract要約: レコメンデーションシステムは、オンラインサービスプロバイダの重要なコンポーネントである。
金融業界は不正検出、リスク管理、コンプライアンスなどの分野で大量のデータを活用するためにMLを採用している。
- 参考スコア(独自算出の注目度): 8.415530878975751
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine Learning (ML) techniques have begun to dominate data analytics
applications and services. Recommendation systems are a key component of online
service providers. The financial industry has adopted ML to harness large
volumes of data in areas such as fraud detection, risk-management, and
compliance. Deep Learning is the technology behind voice-based personal
assistants, etc. Deployment of ML technologies onto cloud computing
infrastructures has benefited numerous aspects of our daily life. The
advertising and associated online industries in particular have fuelled a rapid
rise the in deployment of personal data collection and analytics tools.
Traditionally, behavioural analytics relies on collecting vast amounts of data
in centralised cloud infrastructure before using it to train machine learning
models that allow user behaviour and preferences to be inferred. A contrasting
approach, distributed data analytics, where code and models for training and
inference are distributed to the places where data is collected, has been
boosted by two recent, ongoing developments: increased processing power and
memory capacity available in user devices at the edge of the network, such as
smartphones and home assistants; and increased sensitivity to the highly
intrusive nature of many of these devices and services and the attendant
demands for improved privacy. Indeed, the potential for increased privacy is
not the only benefit of distributing data analytics to the edges of the
network: reducing the movement of large volumes of data can also improve energy
efficiency, helping to ameliorate the ever increasing carbon footprint of our
digital infrastructure, enabling much lower latency for service interactions
than is possible when services are cloud-hosted. These approaches often
introduce challenges in privacy, utility, and efficiency trade-offs, while
having to ensure fruitful user engagement.
- Abstract(参考訳): 機械学習(ML)技術は、データ分析アプリケーションやサービスを支配し始めている。
レコメンデーションシステムは、オンラインサービスプロバイダの重要なコンポーネントである。
金融業界は不正検出、リスク管理、コンプライアンスなどの分野で大量のデータを活用するためにMLを採用している。
Deep Learningは音声ベースのパーソナルアシスタントなどを支える技術だ。
ML技術のクラウドコンピューティングインフラストラクチャへの展開は、私たちの日常生活の多くの面に恩恵をもたらしています。
特に広告と関連するオンライン産業は、個人データ収集と分析ツールの展開を急速に加速させてきた。
従来、行動分析は、ユーザー行動や好みを推測できる機械学習モデルをトレーニングするために使用する前に、集中型クラウドインフラストラクチャで大量のデータを集めることに依存していた。
対照的に、トレーニングと推論のためのコードとモデルを収集する分散データ分析は、スマートフォンやホームアシスタントなど、ネットワークの端にあるユーザデバイスで利用可能な処理能力とメモリ容量の増加、これらのデバイスやサービスの非常に侵入的な性質に対する感受性の向上、およびプライバシー改善に対する付随的要求の2つの最近の発展によって、強化されている。
大量のデータの移動を削減すれば、エネルギー効率も向上し、デジタルインフラストラクチャの二酸化炭素排出量の増大を緩和し、サービスがクラウドホストされている場合よりもサービス間通信のレイテンシを低減します。
これらのアプローチは、しばしばプライバシー、ユーティリティ、効率上のトレードオフに問題をもたらし、ユーザーエンゲージメントを満足させる必要がある。
関連論文リスト
- Effective Intrusion Detection in Heterogeneous Internet-of-Things Networks via Ensemble Knowledge Distillation-based Federated Learning [52.6706505729803]
我々は、分散化された侵入検知システムの共有モデル(IDS)を協調訓練するために、フェデレートラーニング(FL)を導入する。
FLEKDは従来のモデル融合法よりも柔軟な凝集法を実現する。
実験の結果,提案手法は,速度と性能の両面で,局所訓練と従来のFLよりも優れていた。
論文 参考訳(メタデータ) (2024-01-22T14:16:37Z) - Federated Learning-Empowered AI-Generated Content in Wireless Networks [58.48381827268331]
フェデレートドラーニング(FL)は、学習効率を改善し、AIGCのプライバシー保護を達成するために利用することができる。
我々は,AIGCの強化を目的としたFLベースの技術を提案し,ユーザが多様でパーソナライズされた高品質なコンテンツを作成できるようにすることを目的とする。
論文 参考訳(メタデータ) (2023-07-14T04:13:11Z) - Enabling Inter-organizational Analytics in Business Networks Through
Meta Machine Learning [0.0]
センシティブな情報を開示すると同時に、交換が必要なデータの量の多さが、効果的なシステムワイドソリューションの創出の鍵となるインヒビターである。
本稿では,これらの障害に対処し,ビジネスネットワーク内の包括的分析を可能にするメタ機械学習手法を提案する。
論文 参考訳(メタデータ) (2023-03-28T09:06:28Z) - Federated Learning for Autoencoder-based Condition Monitoring in the
Industrial Internet of Things [0.07646713951724012]
コンディションモニタリングと予測保守手法は,産業用モノのインターネットにおいて,効率的かつ堅牢な製造サイクルを実現するための重要な柱である。
複数の産業環境にまたがって収集されたさまざまなデータを分析して、機械学習モデルを用いて劣化行動を検出し予測することは、最近の研究で有望な成果を示している。
業界サイト間の知識のコラボレーションと共有は大きな利益をもたらすが、データプライバシーの問題のため、しばしば禁止される。
本稿では,自動エンコーダを用いたフェデレート学習手法を提案する。回転機械の振動センサデータを利用して,オンプレミスで監視機に近いエッジデバイス上での分散トレーニングを実現する。
論文 参考訳(メタデータ) (2022-11-14T18:40:50Z) - Outsourcing Training without Uploading Data via Efficient Collaborative
Open-Source Sampling [49.87637449243698]
従来のアウトソーシングでは、デバイスデータをクラウドサーバにアップロードする必要がある。
我々は、公開および異種ソースから収集された膨大なデータセットである、広く利用可能なオープンソースデータを活用することを提案する。
我々は,オープンソースデータからクラウドトレーニングのためのプロキシデータセットを構築するための,ECOS(Efficient Collaborative Open-source Sampling)と呼ばれる新しい戦略を開発した。
論文 参考訳(メタデータ) (2022-10-23T00:12:18Z) - Distributed intelligence on the Edge-to-Cloud Continuum: A systematic
literature review [62.997667081978825]
このレビューは、現在利用可能な機械学習とデータ分析のための最先端ライブラリとフレームワークに関する包括的なビジョンを提供することを目的としている。
現在利用可能なEdge-to-Cloud Continuumに関する実験的な研究のための、主要なシミュレーション、エミュレーション、デプロイメントシステム、テストベッドも調査されている。
論文 参考訳(メタデータ) (2022-04-29T08:06:05Z) - Deep Reinforcement Learning Assisted Federated Learning Algorithm for
Data Management of IIoT [82.33080550378068]
産業用IoT(Industrial Internet of Things)の継続的な拡大により、IIoT機器は毎回大量のユーザデータを生成する。
IIoTの分野で、これらの時系列データを効率的かつ安全な方法で管理する方法は、依然として未解決の問題である。
本稿では,無線ネットワーク環境におけるIIoT機器データ管理におけるFL技術の適用について検討する。
論文 参考訳(メタデータ) (2022-02-03T07:12:36Z) - Privacy-Preserving Serverless Edge Learning with Decentralized Small
Data [13.254530176359182]
最近、分散トレーニング戦略は、ディープモデルをトレーニングする際のデータプライバシを保証するための有望なアプローチになっている。
本稿では、従来のサーバレスプラットフォームをサーバレスエッジ学習アーキテクチャで拡張し、ネットワークの観点から効率的な分散トレーニングフレームワークを提供する。
論文 参考訳(メタデータ) (2021-11-29T21:04:49Z) - A Review of Privacy-preserving Federated Learning for the
Internet-of-Things [3.3517146652431378]
この研究は、分散データ上で機械学習を実行するためのアプローチとして、フェデレーション学習をレビューした。
ユーザ生成データのプライバシ保護と,データ転送に伴う通信コストの削減を目的としている。
フェデレート学習に適用される様々な手法の長所と短所を同定する。
論文 参考訳(メタデータ) (2020-04-24T15:27:23Z) - A Privacy-Preserving Distributed Architecture for
Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。
クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文 参考訳(メタデータ) (2020-03-30T15:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。