論文の概要: Starting with data: advancing spatial data science by building and
sharing high-quality datasets
- arxiv url: http://arxiv.org/abs/2007.08087v1
- Date: Thu, 16 Jul 2020 03:15:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 23:59:17.901301
- Title: Starting with data: advancing spatial data science by building and
sharing high-quality datasets
- Title(参考訳): データから始める:高品質データセットの構築と共有による空間データ科学の進歩
- Authors: Yingjie Hu
- Abstract要約: 近年,空間データ科学が学際分野として登場している。
本稿では,空間データ科学のための高品質データセットの構築と共有の重要性について論じる。
- 参考スコア(独自算出の注目度): 2.8935588665357077
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spatial data science has emerged in recent years as an interdisciplinary
field. This position paper discusses the importance of building and sharing
high-quality datasets for spatial data science.
- Abstract(参考訳): 近年,空間データ科学が学際分野として登場している。
本稿では,空間データ科学のための高品質データセットの構築と共有の重要性について論じる。
関連論文リスト
- On Responsible Machine Learning Datasets with Fairness, Privacy, and
Regulatory Norms [58.93352076927003]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - Unified Data Management and Comprehensive Performance Evaluation for
Urban Spatial-Temporal Prediction [Experiment, Analysis & Benchmark] [78.05103666987655]
この研究は、多様な都市空間時間データセットにアクセスし活用する際の課題に対処する。
都市空間・時空間のビッグデータ用に設計された統合ストレージフォーマットであるアトミックファイルを導入し,40種類の多様なデータセットでその有効性を検証する。
多様なモデルとデータセットを使用して広範な実験を行い、パフォーマンスリーダーボードを確立し、有望な研究方向性を特定する。
論文 参考訳(メタデータ) (2023-08-24T16:20:00Z) - Assessing Scientific Contributions in Data Sharing Spaces [64.16762375635842]
本稿では、研究者の科学的貢献を測定するブロックチェーンベースのメトリクスであるSCIENCE-indexを紹介する。
研究者にデータ共有のインセンティブを与えるため、SCIENCE-indexはデータ共有パラメータを含むように拡張されている。
本モデルは, 地理的に多様な研究者の出力分布とh-indexの分布を比較して評価する。
論文 参考訳(メタデータ) (2023-03-18T19:17:47Z) - Subdivisions and Crossroads: Identifying Hidden Community Structures in
a Data Archive's Citation Network [1.6631602844999724]
本稿では学術出版物に引用されるデータセットの権威ネットワークのコミュニティ構造を解析する。
共有データを用いた社会科学データセットと研究分野のコミュニティを同定する。
本研究は、データ再利用の隠れ構造を明らかにし、学際的な研究コミュニティがデータセットを共有科学的なインプットとして構成する方法を実証する。
論文 参考訳(メタデータ) (2022-05-17T14:18:49Z) - Sketch and Scale: Geo-distributed tSNE and UMAP [75.44887265789056]
地理的に分散したデータセット上で機械学習分析を実行することは、急速に発生する問題である。
私たちはSketch and Scale(SnS)という新しいフレームワークを紹介します。
これはCount Sketchデータ構造を利用して、エッジノード上のデータを圧縮し、マスターノード上の縮小サイズスケッチを集約し、サマリ上でバニラtSNEまたはUMAPを実行する。
我々は、この技術が完全に並列で、線形に時間にスケールし、メモリに対数的に分散し、通信し、世界中の複数のデータセンターにまたがる数百万、数十億のデータポイントでデータセットを解析できることを示す。
論文 参考訳(メタデータ) (2020-11-11T22:32:21Z) - Data Science: A Comprehensive Overview [42.98602883069444]
21世紀はビッグデータとデータ経済の時代に始まり、データDNAはすべてのデータに基づく有機体の本質的な構成要素となっている。
データDNAとその生物の適切な理解は、新しいデータ科学の分野と分析のキーストーンに依存している。
この記事では、データサイエンスと分析に関する豊富な観察、教訓、考察に加えて、総合的な全体像を描いている分野としては、初めてである。
論文 参考訳(メタデータ) (2020-07-01T02:33:58Z) - Data Science: Nature and Pitfalls [42.98602883069444]
初期のデータサイエンスの健全な発展にとって重要なことは、データ科学とデータ科学の性質を深く理解することである。
これらの重要な問題は、この記事の議論を動機付けている。
論文 参考訳(メタデータ) (2020-06-28T02:06:54Z) - Data Science: Challenges and Directions [42.98602883069444]
データサイエンスのタイトルを含む何百もの文献をレビューする。
議論の大部分は、統計、データマイニング、機械学習、ビッグデータ、あるいは広範なデータ分析に関するものだと考えています。
我々は、複雑なシステムとしてのデータサイエンス問題の性質にインスパイアされた研究とイノベーションの課題に焦点を当てる。
論文 参考訳(メタデータ) (2020-06-28T01:49:00Z) - Ten Research Challenge Areas in Data Science [4.670305538969914]
データサイエンスは、コンピュータ科学、数学、統計学、その他の分野の知識に基づいている。
この記事では、データサイエンスの専門分野としてのメタクエストから始め、データサイエンスの研究課題の基礎となる10のアイデアについて詳述する。
論文 参考訳(メタデータ) (2020-01-27T21:39:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。