論文の概要: Big Issues for Big Data: challenges for critical spatial data analytics
- arxiv url: http://arxiv.org/abs/2007.11281v2
- Date: Tue, 11 Aug 2020 12:56:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 18:38:05.521864
- Title: Big Issues for Big Data: challenges for critical spatial data analytics
- Title(参考訳): ビッグデータの大きな問題: 重要な空間データ分析への挑戦
- Authors: Chris Brunsdon and Alexis Comber
- Abstract要約: ビッグデータの収集と分析の基礎となる課題に焦点を合わせます。
通常バイアスのあるビッグデータを扱う場合、推論に関連する問題を考慮します。
特に、個々のデータサイエンス研究をより広い社会的・経済的文脈に配置する必要性を考察する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we consider some of the issues of working with big data and big
spatial data and highlight the need for an open and critical framework. We
focus on a set of challenges underlying the collection and analysis of big
data. In particular, we consider 1) the issues related to inference when
working with usually biased big data, challenging the assumed inferential
superiority of data with observations, n, approaching N, the population (n->N),
and the need for data science analysis that answer questions of practical
significance or with greater emphasis n the size of the effect, rather than the
truth or falsehood of a statistical statement; 2) the need to accept messiness
in your data and to document all operations undertaken on the data because of
this support of openness and reproducibility paradigms; and 3) the need to
explicitly seek to understand the causes of bias, messiness etc in the data and
the inferential consequences of using such data in analyses, by adopting
critical approaches to spatial data science. In particular we consider the need
to place individual data science studies in a wider social and economic
contexts, along the the role of inferential theory in the presence of big data,
and issues relating to messiness and complexity in big data.
- Abstract(参考訳): 本稿では,ビッグデータとビッグデータを扱う際の課題をいくつか検討し,オープンでクリティカルなフレームワークの必要性を強調する。
ビッグデータの収集と分析の基盤となる,一連の課題に焦点を当てています。
特に私たちが考えるのは
1)通常バイアスのあるビッグデータを扱う場合の推論に関する問題,n,n,N,N,N,n->N,及び実践的重要性の疑問に答えるデータ科学分析の必要性,及び,統計的ステートメントの真偽や虚偽ではなく,その効果の大きさに重点を置くこと。
2) 開放性と再現性パラダイムの支援により,データの混乱を受け入れ,データ上で実施されるすべての操作を文書化する必要性。
3)空間データ科学への批判的アプローチを取り入れることで,データのバイアスや混乱などの原因,分析におけるデータの利用による推測的な影響を明示的に理解する必要がある。
特に、ビッグデータの存在下での推論理論の役割や、ビッグデータの混乱や複雑さに関連する問題など、個々のデータサイエンス研究をより広い社会的・経済的文脈に配置する必要があると考えている。
関連論文リスト
- Big data searching using words [0.0]
データ検索における単語の近傍構造に関する基本的な考え方を紹介する。
また、ビッグデータ検索におけるビッグデータプライマリを導入し、データ検索における異常検出における近傍構造の適用について論じる。
論文 参考訳(メタデータ) (2024-09-10T13:46:14Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Lazy Data Practices Harm Fairness Research [49.02318458244464]
本稿では,公正な機械学習データセットを包括的に分析し,不反射的手法がアルゴリズム的公正度発見の到達度と信頼性をいかに妨げているかを示す。
本分析では,(1)データと評価における特定の保護属性の表現のテクスブフラック,(2)データ前処理におけるマイノリティの広汎なテキストbf,(3)フェアネス研究の一般化を脅かすテキストbfopaqueデータ処理の3つの分野について検討した。
この研究は、公正なMLにおけるデータプラクティスの批判的な再評価の必要性を強調し、データセットのソーシングと使用の両方を改善するための指針を提供する。
論文 参考訳(メタデータ) (2024-04-26T09:51:24Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Continual Causal Effect Estimation: Challenges and Opportunities [11.343298687766579]
観測データにおける原因と効果のさらなる理解は多くの領域で重要である。
既存の手法は主にソース固有および静止観測データに焦点を当てている。
ビッグデータの時代,我々は観測データによる因果推論において新たな課題に直面している。
論文 参考訳(メタデータ) (2023-01-03T09:57:50Z) - FinQA: A Dataset of Numerical Reasoning over Financial Data [52.7249610894623]
我々は、大量の財務文書の分析を自動化することを目的として、財務データに関する深い質問に答えることに重点を置いている。
我々は,金融専門家が作成した財務報告に対して質問回答のペアを用いた,新たな大規模データセットFinQAを提案する。
その結果、人気があり、大規模で、事前訓練されたモデルは、金融知識を得るための専門的な人間には程遠いことが示される。
論文 参考訳(メタデータ) (2021-09-01T00:08:14Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Occams Razor for Big Data? On Detecting Quality in Large Unstructured
Datasets [0.0]
分析複雑性への新たな傾向は、科学におけるパシモニーやオッカム・ラザーの原理にとって深刻な課題である。
データクラスタリングのための計算的ビルディングブロックアプローチは、最小の計算時間で大規模な非構造化データセットを扱うのに役立つ。
このレビューは、東西の文化的な違いがビッグデータ分析の過程にどのように影響するかを結論付けている。
論文 参考訳(メタデータ) (2020-11-12T16:06:01Z) - Towards an Integrated Platform for Big Data Analysis [4.5257812998381315]
本稿では,これらすべての側面を統合した,ビッグデータ解析のための統合型プレート形式のビジョンについて述べる。
このアプローチの主な利点は、プラットフォーム全体の拡張スケーラビリティ、アルゴリズムのパラメータ化の改善、エンドツーエンドのデータ分析プロセスにおけるユーザビリティの改善である。
論文 参考訳(メタデータ) (2020-04-27T03:15:23Z) - A Philosophy of Data [91.3755431537592]
我々は、統計計算に必要な基本特性から統計データの定義まで研究する。
我々は、有用なデータの必要性は、プロパティを根本的にユニークか等しく理解することを規則化する必要があると論じている。
データとデータ技術への依存度が高まるにつれて、この2つの特徴は現実の集合概念に影響を与えます。
論文 参考訳(メタデータ) (2020-04-15T14:47:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。