論文の概要: Big Issues for Big Data: challenges for critical spatial data analytics
- arxiv url: http://arxiv.org/abs/2007.11281v2
- Date: Tue, 11 Aug 2020 12:56:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 18:38:05.521864
- Title: Big Issues for Big Data: challenges for critical spatial data analytics
- Title(参考訳): ビッグデータの大きな問題: 重要な空間データ分析への挑戦
- Authors: Chris Brunsdon and Alexis Comber
- Abstract要約: ビッグデータの収集と分析の基礎となる課題に焦点を合わせます。
通常バイアスのあるビッグデータを扱う場合、推論に関連する問題を考慮します。
特に、個々のデータサイエンス研究をより広い社会的・経済的文脈に配置する必要性を考察する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we consider some of the issues of working with big data and big
spatial data and highlight the need for an open and critical framework. We
focus on a set of challenges underlying the collection and analysis of big
data. In particular, we consider 1) the issues related to inference when
working with usually biased big data, challenging the assumed inferential
superiority of data with observations, n, approaching N, the population (n->N),
and the need for data science analysis that answer questions of practical
significance or with greater emphasis n the size of the effect, rather than the
truth or falsehood of a statistical statement; 2) the need to accept messiness
in your data and to document all operations undertaken on the data because of
this support of openness and reproducibility paradigms; and 3) the need to
explicitly seek to understand the causes of bias, messiness etc in the data and
the inferential consequences of using such data in analyses, by adopting
critical approaches to spatial data science. In particular we consider the need
to place individual data science studies in a wider social and economic
contexts, along the the role of inferential theory in the presence of big data,
and issues relating to messiness and complexity in big data.
- Abstract(参考訳): 本稿では,ビッグデータとビッグデータを扱う際の課題をいくつか検討し,オープンでクリティカルなフレームワークの必要性を強調する。
ビッグデータの収集と分析の基盤となる,一連の課題に焦点を当てています。
特に私たちが考えるのは
1)通常バイアスのあるビッグデータを扱う場合の推論に関する問題,n,n,N,N,N,n->N,及び実践的重要性の疑問に答えるデータ科学分析の必要性,及び,統計的ステートメントの真偽や虚偽ではなく,その効果の大きさに重点を置くこと。
2) 開放性と再現性パラダイムの支援により,データの混乱を受け入れ,データ上で実施されるすべての操作を文書化する必要性。
3)空間データ科学への批判的アプローチを取り入れることで,データのバイアスや混乱などの原因,分析におけるデータの利用による推測的な影響を明示的に理解する必要がある。
特に、ビッグデータの存在下での推論理論の役割や、ビッグデータの混乱や複雑さに関連する問題など、個々のデータサイエンス研究をより広い社会的・経済的文脈に配置する必要があると考えている。
関連論文リスト
- LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - Towards Generalizable Data Protection With Transferable Unlearnable
Examples [50.628011208660645]
本稿では、転送不可能な例を生成することによって、新しい一般化可能なデータ保護手法を提案する。
私たちの知る限りでは、これはデータ分散の観点からデータのプライバシを調べる最初のソリューションです。
論文 参考訳(メタデータ) (2023-05-18T04:17:01Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Continual Causal Effect Estimation: Challenges and Opportunities [11.343298687766579]
観測データにおける原因と効果のさらなる理解は多くの領域で重要である。
既存の手法は主にソース固有および静止観測データに焦点を当てている。
ビッグデータの時代,我々は観測データによる因果推論において新たな課題に直面している。
論文 参考訳(メタデータ) (2023-01-03T09:57:50Z) - FinQA: A Dataset of Numerical Reasoning over Financial Data [52.7249610894623]
我々は、大量の財務文書の分析を自動化することを目的として、財務データに関する深い質問に答えることに重点を置いている。
我々は,金融専門家が作成した財務報告に対して質問回答のペアを用いた,新たな大規模データセットFinQAを提案する。
その結果、人気があり、大規模で、事前訓練されたモデルは、金融知識を得るための専門的な人間には程遠いことが示される。
論文 参考訳(メタデータ) (2021-09-01T00:08:14Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Occams Razor for Big Data? On Detecting Quality in Large Unstructured
Datasets [0.0]
分析複雑性への新たな傾向は、科学におけるパシモニーやオッカム・ラザーの原理にとって深刻な課題である。
データクラスタリングのための計算的ビルディングブロックアプローチは、最小の計算時間で大規模な非構造化データセットを扱うのに役立つ。
このレビューは、東西の文化的な違いがビッグデータ分析の過程にどのように影響するかを結論付けている。
論文 参考訳(メタデータ) (2020-11-12T16:06:01Z) - Opening practice: supporting Reproducibility and Critical spatial data
science [0.0]
本稿では,空間データ科学に対するよりオープンで再現可能なアプローチに向けて,いくつかの傾向を考察する。
特に、ビッグデータへのトレンドと、それが空間データ分析とモデリングに与える影響について検討している。
ブラックボックス”を提供するプロプライエタリなソフトウェアツールから離れ、コア分析ツールとしてのコーディングへの学界の転換を識別する。
論文 参考訳(メタデータ) (2020-07-20T07:50:08Z) - Data Science: A Comprehensive Overview [42.98602883069444]
21世紀はビッグデータとデータ経済の時代に始まり、データDNAはすべてのデータに基づく有機体の本質的な構成要素となっている。
データDNAとその生物の適切な理解は、新しいデータ科学の分野と分析のキーストーンに依存している。
この記事では、データサイエンスと分析に関する豊富な観察、教訓、考察に加えて、総合的な全体像を描いている分野としては、初めてである。
論文 参考訳(メタデータ) (2020-07-01T02:33:58Z) - Towards an Integrated Platform for Big Data Analysis [4.5257812998381315]
本稿では,これらすべての側面を統合した,ビッグデータ解析のための統合型プレート形式のビジョンについて述べる。
このアプローチの主な利点は、プラットフォーム全体の拡張スケーラビリティ、アルゴリズムのパラメータ化の改善、エンドツーエンドのデータ分析プロセスにおけるユーザビリティの改善である。
論文 参考訳(メタデータ) (2020-04-27T03:15:23Z) - A Philosophy of Data [91.3755431537592]
我々は、統計計算に必要な基本特性から統計データの定義まで研究する。
我々は、有用なデータの必要性は、プロパティを根本的にユニークか等しく理解することを規則化する必要があると論じている。
データとデータ技術への依存度が高まるにつれて、この2つの特徴は現実の集合概念に影響を与えます。
論文 参考訳(メタデータ) (2020-04-15T14:47:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。