論文の概要: Wide-Area Data Analytics
- arxiv url: http://arxiv.org/abs/2006.10188v1
- Date: Wed, 17 Jun 2020 22:44:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-13 15:40:04.669398
- Title: Wide-Area Data Analytics
- Title(参考訳): 広域データ分析
- Authors: Rachit Agarwal and Jen Rexford (workshop co-chairs) with contributions
from numerous workshop attendees
- Abstract要約: 私たちはますます、さまざまな種類のデータが多くの場所に分散している、データ駆動の世界に住んでいます。
コンピューティングコミュニティコンソーシアム(CCC)は、2019年10月に、広域データ分析に焦点を当てた1.5日間のワークショップを開催した。
本報告では,ワークショップで議論された課題と結論について要約する。
- 参考スコア(独自算出の注目度): 4.080171822768553
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We increasingly live in a data-driven world, with diverse kinds of data
distributed across many locations. In some cases, the datasets are collected
from multiple locations, such as sensors (e.g., mobile phones and street
cameras) spread throughout a geographic region. The data may need to be
analyzed close to where they are produced, particularly when the applications
require low latency, high, low cost, user privacy, and regulatory constraints.
In other cases, large datasets are distributed across public clouds, private
clouds, or edge-cloud computing sites with more plentiful computation, storage,
bandwidth, and energy resources. Often, some portion of the analysis may take
place on the end-host or edge cloud (to respect user privacy and reduce the
volume of data) while relying on remote clouds to complete the analysis (to
leverage greater computation and storage resources).
Wide-area data analytics is any analysis of data that is generated by, or
stored at, geographically dispersed entities. Over the past few years, several
parts of the computer science research community have started to explore
effective ways to analyze data spread over multiple locations. In particular,
several areas of "systems" research - including databases, distributed systems,
computer networking, and security and privacy - have delved into these topics.
These research subcommunities often focus on different aspects of the problem,
consider different motivating applications and use cases, and design and
evaluate their solutions differently. To address these challenges the Computing
Community Consortium (CCC) convened a 1.5-day workshop focused on wide-area
data analytics in October 2019. This report summarizes the challenges discussed
and the conclusions generated at the workshop.
- Abstract(参考訳): 私たちはますますデータ駆動の世界に住み、さまざまな種類のデータが多くの場所に分散しています。
場合によっては、センサー(携帯電話やストリートカメラなど)などの複数の場所からデータセットが収集される。
データは、特にアプリケーションが低レイテンシ、高コスト、低コスト、ユーザのプライバシ、規制制約を必要とする場合、生成する場所の近くで分析する必要がある。
その他のケースでは、大規模なデータセットがパブリッククラウド、プライベートクラウド、あるいはエッジクラウドコンピューティングサイト全体に分散し、より豊富な計算、ストレージ、帯域幅、エネルギーリソースを持つ。
多くの場合、分析の一部がエンドホストやエッジクラウド(ユーザのプライバシを尊重し、データ量を減らすため)で行われ、(より大きな計算とストレージリソースを活用するために)解析を完了するためにリモートクラウドに依存する。
広域データ分析は、地理的に分散したエンティティによって生成された、あるいは保存されたデータの分析である。
過去数年間、コンピュータサイエンス研究コミュニティのいくつかの部分が、複数の場所にまたがるデータを分析する効果的な方法を模索してきた。
特に、データベース、分散システム、コンピュータネットワーク、セキュリティとプライバシなど、"システム"研究のいくつかの領域が、これらのトピックを掘り下げている。
これらの研究サブコミュニティは、しばしば問題の異なる側面に注目し、異なる動機付けアプリケーションとユースケースを検討し、そのソリューションを異なる方法で設計し評価する。
これらの課題に対処するため、コンピューティングコミュニティコンソーシアム(CCC)は、2019年10月に、広域データ分析に焦点を当てた1.5日間のワークショップを開催した。
本報告は,ワークショップで議論された課題と結論をまとめたものである。
関連論文リスト
- Enabling High Data Throughput Reinforcement Learning on GPUs: A Domain Agnostic Framework for Data-Driven Scientific Research [90.91438597133211]
我々は、強化学習の適用において重要なシステムのボトルネックを克服するために設計されたフレームワークであるWarpSciを紹介する。
我々は、CPUとGPU間のデータ転送の必要性を排除し、数千のシミュレーションを同時実行可能にする。
論文 参考訳(メタデータ) (2024-08-01T21:38:09Z) - A Survey on Differential Privacy for SpatioTemporal Data in Transportation Research [0.9790236766474202]
交通機関では、時空間データ収集が急増している。
このようなデータにおける微分プライバシーの最近の発展は、応用プライバシーの研究につながっている。
個人情報を公開することなく、研究や推論におけるこのようなデータの必要性に対処するために、重要な研究が提案されている。
論文 参考訳(メタデータ) (2024-07-18T03:19:29Z) - A Unified View of Differentially Private Deep Generative Modeling [60.72161965018005]
プライバシー上の懸念のあるデータには、データアクセスとデータ共有を頻繁に禁止する厳格な規制が伴う。
これらの障害を克服することは、プライバシーに敏感なデータを含む多くの現実世界のアプリケーションシナリオにおいて、技術的進歩の鍵となる。
差分的プライベート(DP)データパブリッシングは、データの衛生化された形式のみを公開する、魅力的なソリューションを提供する。
論文 参考訳(メタデータ) (2023-09-27T14:38:16Z) - Privacy-Preserving Graph Machine Learning from Data to Computation: A
Survey [67.7834898542701]
我々は,グラフ機械学習のプライバシ保護手法の見直しに重点を置いている。
まずプライバシ保護グラフデータを生成する方法を検討する。
次に,プライバシ保護情報を送信する方法について述べる。
論文 参考訳(メタデータ) (2023-07-10T04:30:23Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - Towards Confidential Computing: A Secure Cloud Architecture for Big Data
Analytics and AI [0.0]
クラウドコンピューティングは、ビッグデータ分析と人工知能のための実行可能なソリューションになっている。
バイオメディカルリサーチのような特定の分野におけるデータセキュリティは、クラウドに移行する際の大きな懸念事項である。
論文 参考訳(メタデータ) (2023-05-28T16:08:44Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - A communication efficient distributed learning framework for smart
environments [0.4898659895355355]
本稿では,データ生成箇所にデータ分析を近づける分散学習フレームワークを提案する。
分散機械学習技術を使用することで、クラウドソリューションに匹敵するパフォーマンスを確保しながら、ネットワークオーバーヘッドを大幅に削減することができる。
分析はまた、ノード上のデータの特定の分布に基づいて、各分散学習アプローチがいつ好ましいかを示す。
論文 参考訳(メタデータ) (2021-09-27T13:44:34Z) - Opening practice: supporting Reproducibility and Critical spatial data
science [0.0]
本稿では,空間データ科学に対するよりオープンで再現可能なアプローチに向けて,いくつかの傾向を考察する。
特に、ビッグデータへのトレンドと、それが空間データ分析とモデリングに与える影響について検討している。
ブラックボックス”を提供するプロプライエタリなソフトウェアツールから離れ、コア分析ツールとしてのコーディングへの学界の転換を識別する。
論文 参考訳(メタデータ) (2020-07-20T07:50:08Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z) - Towards an Integrated Platform for Big Data Analysis [4.5257812998381315]
本稿では,これらすべての側面を統合した,ビッグデータ解析のための統合型プレート形式のビジョンについて述べる。
このアプローチの主な利点は、プラットフォーム全体の拡張スケーラビリティ、アルゴリズムのパラメータ化の改善、エンドツーエンドのデータ分析プロセスにおけるユーザビリティの改善である。
論文 参考訳(メタデータ) (2020-04-27T03:15:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。