Fugu-MT 論文翻訳(概要): Wide-Area Data Analytics

論文の概要: Wide-Area Data Analytics

arxiv url: http://arxiv.org/abs/2006.10188v1
Date: Wed, 17 Jun 2020 22:44:33 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-13 15:40:04.669398
Title: Wide-Area Data Analytics
Title（参考訳）: 広域データ分析
Authors: Rachit Agarwal and Jen Rexford (workshop co-chairs) with contributions from numerous workshop attendees
Abstract要約: 私たちはますます、さまざまな種類のデータが多くの場所に分散している、データ駆動の世界に住んでいます。コンピューティングコミュニティコンソーシアム(CCC)は、2019年10月に、広域データ分析に焦点を当てた1.5日間のワークショップを開催した。本報告では,ワークショップで議論された課題と結論について要約する。
参考スコア（独自算出の注目度）: 4.080171822768553
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We increasingly live in a data-driven world, with diverse kinds of data distributed across many locations. In some cases, the datasets are collected from multiple locations, such as sensors (e.g., mobile phones and street cameras) spread throughout a geographic region. The data may need to be analyzed close to where they are produced, particularly when the applications require low latency, high, low cost, user privacy, and regulatory constraints. In other cases, large datasets are distributed across public clouds, private clouds, or edge-cloud computing sites with more plentiful computation, storage, bandwidth, and energy resources. Often, some portion of the analysis may take place on the end-host or edge cloud (to respect user privacy and reduce the volume of data) while relying on remote clouds to complete the analysis (to leverage greater computation and storage resources). Wide-area data analytics is any analysis of data that is generated by, or stored at, geographically dispersed entities. Over the past few years, several parts of the computer science research community have started to explore effective ways to analyze data spread over multiple locations. In particular, several areas of "systems" research - including databases, distributed systems, computer networking, and security and privacy - have delved into these topics. These research subcommunities often focus on different aspects of the problem, consider different motivating applications and use cases, and design and evaluate their solutions differently. To address these challenges the Computing Community Consortium (CCC) convened a 1.5-day workshop focused on wide-area data analytics in October 2019. This report summarizes the challenges discussed and the conclusions generated at the workshop.
Abstract（参考訳）: 私たちはますますデータ駆動の世界に住み、さまざまな種類のデータが多くの場所に分散しています。場合によっては、センサー(携帯電話やストリートカメラなど)などの複数の場所からデータセットが収集される。データは、特にアプリケーションが低レイテンシ、高コスト、低コスト、ユーザのプライバシ、規制制約を必要とする場合、生成する場所の近くで分析する必要がある。その他のケースでは、大規模なデータセットがパブリッククラウド、プライベートクラウド、あるいはエッジクラウドコンピューティングサイト全体に分散し、より豊富な計算、ストレージ、帯域幅、エネルギーリソースを持つ。多くの場合、分析の一部がエンドホストやエッジクラウド(ユーザのプライバシを尊重し、データ量を減らすため)で行われ、(より大きな計算とストレージリソースを活用するために)解析を完了するためにリモートクラウドに依存する。広域データ分析は、地理的に分散したエンティティによって生成された、あるいは保存されたデータの分析である。過去数年間、コンピュータサイエンス研究コミュニティのいくつかの部分が、複数の場所にまたがるデータを分析する効果的な方法を模索してきた。特に、データベース、分散システム、コンピュータネットワーク、セキュリティとプライバシなど、"システム"研究のいくつかの領域が、これらのトピックを掘り下げている。これらの研究サブコミュニティは、しばしば問題の異なる側面に注目し、異なる動機付けアプリケーションとユースケースを検討し、そのソリューションを異なる方法で設計し評価する。これらの課題に対処するため、コンピューティングコミュニティコンソーシアム(CCC)は、2019年10月に、広域データ分析に焦点を当てた1.5日間のワークショップを開催した。本報告は,ワークショップで議論された課題と結論をまとめたものである。

関連論文リスト

Harnessing Rich Multi-Modal Data for Spatial-Temporal Homophily-Embedded Graph Learning Across Domains and Localities [2.5065738436850835]
本研究では、クロスドメインデータ融合を行う異種データパイプラインを提案する。我々は、50以上のデータソースの豊富な情報を活用することで、複数のドメインや地域にわたって複雑な都市問題に対処することを目指している。
論文参考訳（メタデータ） (2025-12-11T23:51:54Z)
Enabling High Data Throughput Reinforcement Learning on GPUs: A Domain Agnostic Framework for Data-Driven Scientific Research [90.91438597133211]
我々は、強化学習の適用において重要なシステムのボトルネックを克服するために設計されたフレームワークであるWarpSciを紹介する。我々は、CPUとGPU間のデータ転送の必要性を排除し、数千のシミュレーションを同時実行可能にする。
論文参考訳（メタデータ） (2024-08-01T21:38:09Z)
A Survey on Differential Privacy for SpatioTemporal Data in Transportation Research [0.9790236766474202]
交通機関では、時空間データ収集が急増している。このようなデータにおける微分プライバシーの最近の発展は、応用プライバシーの研究につながっている。個人情報を公開することなく、研究や推論におけるこのようなデータの必要性に対処するために、重要な研究が提案されている。
論文参考訳（メタデータ） (2024-07-18T03:19:29Z)
A Survey on Federated Analytics: Taxonomy, Enabling Techniques, Applications and Open Issues [28.096861605150075]
フェデレーション分析(FA)は、生データを集中することなく、多様なデータ所有者間で協調的なデータ分析をサポートする新興技術である。この調査は、まずFAの概要を提供し、鍵となる概念を解明し、同様の概念との関係を議論することでギャップを埋めることを目的としている。
論文参考訳（メタデータ） (2024-04-19T07:06:40Z)
A Unified View of Differentially Private Deep Generative Modeling [60.72161965018005]
プライバシー上の懸念のあるデータには、データアクセスとデータ共有を頻繁に禁止する厳格な規制が伴う。これらの障害を克服することは、プライバシーに敏感なデータを含む多くの現実世界のアプリケーションシナリオにおいて、技術的進歩の鍵となる。差分的プライベート(DP)データパブリッシングは、データの衛生化された形式のみを公開する、魅力的なソリューションを提供する。
論文参考訳（メタデータ） (2023-09-27T14:38:16Z)
Privacy-Preserving Graph Machine Learning from Data to Computation: A Survey [67.7834898542701]
我々は,グラフ機械学習のプライバシ保護手法の見直しに重点を置いている。まずプライバシ保護グラフデータを生成する方法を検討する。次に,プライバシ保護情報を送信する方法について述べる。
論文参考訳（メタデータ） (2023-07-10T04:30:23Z)
LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文参考訳（メタデータ） (2023-06-14T05:48:36Z)
Towards Confidential Computing: A Secure Cloud Architecture for Big Data Analytics and AI [0.0]
クラウドコンピューティングは、ビッグデータ分析と人工知能のための実行可能なソリューションになっている。バイオメディカルリサーチのような特定の分野におけるデータセキュリティは、クラウドに移行する際の大きな懸念事項である。
論文参考訳（メタデータ） (2023-05-28T16:08:44Z)
Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文参考訳（メタデータ） (2022-09-28T18:51:59Z)
Federated Learning for Big Data: A Survey on Opportunities, Applications, and Future Directions [18.95670953718066]
フェデレートラーニング(FL)は、機械学習のサブフィールドとして現れる。本稿では、ビッグデータ取得、ストレージ、ビッグデータ分析、さらなるプライバシー保護におけるFLの可能性についてレビューする。スマートシティ、スマートヘルスケア、スマートトランスポート、スマートグリッド、ソーシャルメディアなど、ビッグデータアプリケーションにおけるFLの可能性についても検討している。
論文参考訳（メタデータ） (2021-10-08T14:36:43Z)
A communication efficient distributed learning framework for smart environments [0.4898659895355355]
本稿では,データ生成箇所にデータ分析を近づける分散学習フレームワークを提案する。分散機械学習技術を使用することで、クラウドソリューションに匹敵するパフォーマンスを確保しながら、ネットワークオーバーヘッドを大幅に削減することができる。分析はまた、ノード上のデータの特定の分布に基づいて、各分散学習アプローチがいつ好ましいかを示す。
論文参考訳（メタデータ） (2021-09-27T13:44:34Z)
Opening practice: supporting Reproducibility and Critical spatial data science [0.0]
本稿では,空間データ科学に対するよりオープンで再現可能なアプローチに向けて,いくつかの傾向を考察する。特に、ビッグデータへのトレンドと、それが空間データ分析とモデリングに与える影響について検討している。ブラックボックス”を提供するプロプライエタリなソフトウェアツールから離れ、コア分析ツールとしてのコーディングへの学界の転換を識別する。
論文参考訳（メタデータ） (2020-07-20T07:50:08Z)
Data Mining with Big Data in Intrusion Detection Systems: A Systematic Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文参考訳（メタデータ） (2020-05-23T20:57:12Z)
Towards an Integrated Platform for Big Data Analysis [4.5257812998381315]
本稿では,これらすべての側面を統合した,ビッグデータ解析のための統合型プレート形式のビジョンについて述べる。このアプローチの主な利点は、プラットフォーム全体の拡張スケーラビリティ、アルゴリズムのパラメータ化の改善、エンドツーエンドのデータ分析プロセスにおけるユーザビリティの改善である。
論文参考訳（メタデータ） (2020-04-27T03:15:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。