論文の概要: Opening practice: supporting Reproducibility and Critical spatial data
science
- arxiv url: http://arxiv.org/abs/2008.03256v1
- Date: Mon, 20 Jul 2020 07:50:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 23:00:08.548984
- Title: Opening practice: supporting Reproducibility and Critical spatial data
science
- Title(参考訳): オープニング実践 : 再現性と空間データ科学の支援
- Authors: Chris Brunsdon and Alexis Comber
- Abstract要約: 本稿では,空間データ科学に対するよりオープンで再現可能なアプローチに向けて,いくつかの傾向を考察する。
特に、ビッグデータへのトレンドと、それが空間データ分析とモデリングに与える影響について検討している。
ブラックボックス”を提供するプロプライエタリなソフトウェアツールから離れ、コア分析ツールとしてのコーディングへの学界の転換を識別する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper reflects on a number of trends towards a more open and
reproducible approach to geographic and spatial data science over recent years.
In particular it considers trends towards Big Data, and the impacts this is
having on spatial data analysis and modelling. It identifies a turn in academia
towards coding as a core analytic tool, and away from proprietary software
tools offering 'black boxes' where the internal workings of the analysis are
not revealed. It is argued that this closed form software is problematic, and
considers a number of ways in which issues identified in spatial data analysis
(such as the MAUP) could be overlooked when working with closed tools, leading
to problems of interpretation and possibly inappropriate actions and policies
based on these. In addition, this paper and considers the role that
reproducible and open spatial science may play in such an approach, taking into
account the issues raised. It highlights the dangers of failing to account for
the geographical properties of data, now that all data are spatial (they are
collected somewhere), the problems of a desire for n=all observations in data
science and it identifies the need for a critical approach. This is one in
which openness, transparency, sharing and reproducibility provide a mantra for
defensible and robust spatial data science.
- Abstract(参考訳): 本稿では,近年の地理・空間データ科学におけるよりオープンで再現可能なアプローチへの多くのトレンドを考察する。
特にビッグデータへのトレンドと、それが空間データ分析やモデリングに与える影響を考慮に入れている。
これは、コア分析ツールとしてのコーディングへのアカデミアの転換であり、分析の内部動作が明らかにされていない'ブラックボックス'を提供するプロプライエタリなソフトウェアツールから離れている。
このクローズドフォームソフトウェアは問題であり、クローズドツールで作業する際に空間データ分析(MAUPなど)で特定された問題が見過ごされ、解釈の問題や、それに基づくおそらく不適切なアクションやポリシーにつながる、と論じられている。
また,このような手法で再現可能でオープンな空間科学が果たす役割について考察し,課題を考察する。
これは、データの地理的特性を考慮できない危険性を強調し、すべてのデータが空間的であること(それらはどこかで収集されている)、データ科学におけるn=すべての観測の欲求の問題、そして重要なアプローチの必要性を特定する。
これは、オープン性、透明性、共有性、再現性が、防御可能で堅牢な空間データ科学のマントラを提供するものである。
関連論文リスト
- Lazy Data Practices Harm Fairness Research [49.02318458244464]
本稿では,公正な機械学習データセットを包括的に分析し,不反射的手法がアルゴリズム的公正度発見の到達度と信頼性をいかに妨げているかを示す。
本分析では,(1)データと評価における特定の保護属性の表現のテクスブフラック,(2)データ前処理におけるマイノリティの広汎なテキストbf,(3)フェアネス研究の一般化を脅かすテキストbfopaqueデータ処理の3つの分野について検討した。
この研究は、公正なMLにおけるデータプラクティスの批判的な再評価の必要性を強調し、データセットのソーシングと使用の両方を改善するための指針を提供する。
論文 参考訳(メタデータ) (2024-04-26T09:51:24Z) - Spatial-temporal Forecasting for Regions without Observations [13.805203053973772]
本研究では,歴史的観察を伴わない関心領域の時空間予測について検討した。
タスクに対してSTSMというモデルを提案する。
私たちの重要な洞察は、関心のある領域に類似している場所から学ぶことです。
論文 参考訳(メタデータ) (2024-01-19T06:26:05Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and
Regulatory Norms [58.93352076927003]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - Position Paper on Dataset Engineering to Accelerate Science [1.952708415083428]
この作業では、トークン ittextdataset を使用して、明確に定義されたタスクを実行するために構築されたデータの構造化セットを指定する。
具体的には、科学において、各領域にはデータセットを整理、収集、処理するためのユニークな形態がある。
科学と工学の発見プロセスは、データセット上のそのような組織の必要性の極端な例である、と我々は主張する。
論文 参考訳(メタデータ) (2023-03-09T19:07:40Z) - Towards Understanding and Mitigating Dimensional Collapse in Heterogeneous Federated Learning [112.69497636932955]
フェデレートラーニングは、プライバシを考慮したデータ共有を必要とせずに、さまざまなクライアントでモデルをトレーニングすることを目的としている。
本研究では,データの不均一性がグローバル集約モデルの表現に与える影響について検討する。
フェデレーション学習における次元的崩壊を効果的に緩和する新しい手法である sc FedDecorr を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:04:17Z) - Satellite Image Time Series Analysis for Big Earth Observation Data [50.591267188664666]
本稿では,機械学習を用いた衛星画像時系列解析のためのオープンソースRパッケージである sit について述べる。
本手法は, Cerrado Biome のケーススタディにより, 土地利用と土地被覆マップの精度が高いことを示す。
論文 参考訳(メタデータ) (2022-04-24T15:23:25Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Occams Razor for Big Data? On Detecting Quality in Large Unstructured
Datasets [0.0]
分析複雑性への新たな傾向は、科学におけるパシモニーやオッカム・ラザーの原理にとって深刻な課題である。
データクラスタリングのための計算的ビルディングブロックアプローチは、最小の計算時間で大規模な非構造化データセットを扱うのに役立つ。
このレビューは、東西の文化的な違いがビッグデータ分析の過程にどのように影響するかを結論付けている。
論文 参考訳(メタデータ) (2020-11-12T16:06:01Z) - Big Issues for Big Data: challenges for critical spatial data analytics [0.0]
ビッグデータの収集と分析の基礎となる課題に焦点を合わせます。
通常バイアスのあるビッグデータを扱う場合、推論に関連する問題を考慮します。
特に、個々のデータサイエンス研究をより広い社会的・経済的文脈に配置する必要性を考察する。
論文 参考訳(メタデータ) (2020-07-22T09:11:56Z) - Wide-Area Data Analytics [4.080171822768553]
私たちはますます、さまざまな種類のデータが多くの場所に分散している、データ駆動の世界に住んでいます。
コンピューティングコミュニティコンソーシアム(CCC)は、2019年10月に、広域データ分析に焦点を当てた1.5日間のワークショップを開催した。
本報告では,ワークショップで議論された課題と結論について要約する。
論文 参考訳(メタデータ) (2020-06-17T22:44:33Z) - REVISE: A Tool for Measuring and Mitigating Bias in Visual Datasets [64.76453161039973]
REVISE(Revealing VIsual biaSEs)は、視覚的データセットの調査を支援するツールである。
1)オブジェクトベース,(2)個人ベース,(3)地理ベースという3つの次元に沿った潜在的なバイアスを呈示する。
論文 参考訳(メタデータ) (2020-04-16T23:54:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。