論文の概要: "If we didn't solve small data in the past, how can we solve Big Data
today?"
- arxiv url: http://arxiv.org/abs/2111.04442v1
- Date: Mon, 8 Nov 2021 16:31:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-08 20:23:19.467373
- Title: "If we didn't solve small data in the past, how can we solve Big Data
today?"
- Title(参考訳): 「もし過去に小さなデータを解けなかったら、今日どのようにビッグデータを解けばいいのか?」
- Authors: Akash Ravi
- Abstract要約: 私たちは、"小さい"データや"大きい"データといった用語を調査し、それらの属性を理解し、価値を付加する方法について検討することを目指しています。
この研究によると、どんなに小さなデータが使われたにせよ、企業は依然として正しい技術とビジネスビジョンでビッグデータを活用できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data is a critical aspect of the world we live in. With systems producing and
consuming vast amounts of data, it is essential for businesses to digitally
transform and be equipped to derive the most value out of data. Data analytics
techniques can be used to augment strategic decision-making. While this overall
objective of data analytics remains fairly constant, the data itself can be
available in numerous forms and can be categorized under various contexts. In
this paper, we aim to research terms such as 'small' and 'big' data, understand
their attributes, and look at ways in which they can add value. Specifically,
the paper probes into the question "If we didn't solve small data in the past,
how can we solve Big Data today?". Based on the research, it can be inferred
that, regardless of how small data might have been used, organizations can
still leverage big data with the right technology and business vision.
- Abstract(参考訳): データは私たちが生きている世界の重要な側面です。
膨大な量のデータを生成し消費するシステムでは、企業がデジタルトランスフォーメーションを行い、データから最も価値を引き出すために装備することが不可欠である。
データ分析技術は、戦略的意思決定を強化するために使用できる。
データ分析のこの全体的な目的はかなり一定であるが、データそのものは様々な形式で利用でき、様々な文脈で分類することができる。
本稿では,「小さい」データや「大きい」データといった用語を研究し,それらの属性を理解し,価値を付加する方法を検討することを目的とする。
特に、この論文は、“もし私たちが過去に小さなデータを解決しなかったら、今日どのようにビッグデータを解決できるのか?
この研究に基づいて、どんなに小さなデータが使われたとしても、組織は適切な技術とビジネスビジョンでビッグデータを活用できると推測できる。
関連論文リスト
- A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - Big Data and Analytics Implementation in Tertiary Institutions to
Predict Students Performance in Nigeria [0.0]
Big Dataという言葉は、従来のデータ処理技術では扱えない大量のデータを指すために作られた。
本稿では,教育機関に関係のあるビッグデータの特徴について考察する。
学習機関におけるビッグデータと分析の導入に影響を与える要因について検討する。
論文 参考訳(メタデータ) (2022-07-29T13:52:24Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z) - Occams Razor for Big Data? On Detecting Quality in Large Unstructured
Datasets [0.0]
分析複雑性への新たな傾向は、科学におけるパシモニーやオッカム・ラザーの原理にとって深刻な課題である。
データクラスタリングのための計算的ビルディングブロックアプローチは、最小の計算時間で大規模な非構造化データセットを扱うのに役立つ。
このレビューは、東西の文化的な違いがビッグデータ分析の過程にどのように影響するかを結論付けている。
論文 参考訳(メタデータ) (2020-11-12T16:06:01Z) - From Data to Knowledge to Action: A Global Enabler for the 21st Century [26.32590947516587]
コンピュータと数理科学の進歩が相まって、真の証拠に基づく意思決定を可能にする前例のない能力がもたらされた。
これらの機能は、データの大規模なキャプチャと、そのデータの洞察とレコメンデーションへの変換を可能にする。
商業、科学、教育、芸術、エンターテイメントのWebへの移行により、人間の活動に関する構造化された、非構造化されたデータベースが、これまで例のない量で利用可能になった。
論文 参考訳(メタデータ) (2020-07-31T19:19:42Z) - Data Augmentation for Deep Candlestick Learner [2.104922050913737]
そこで本研究では,ロウソクスティックデータを改良したローカルサーチアタックサンプリング手法を提案する。
提案手法は,人間の識別が難しい高品質なデータを生成することができることを示す。
論文 参考訳(メタデータ) (2020-05-14T06:02:31Z) - Towards an Integrated Platform for Big Data Analysis [4.5257812998381315]
本稿では,これらすべての側面を統合した,ビッグデータ解析のための統合型プレート形式のビジョンについて述べる。
このアプローチの主な利点は、プラットフォーム全体の拡張スケーラビリティ、アルゴリズムのパラメータ化の改善、エンドツーエンドのデータ分析プロセスにおけるユーザビリティの改善である。
論文 参考訳(メタデータ) (2020-04-27T03:15:23Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。