論文の概要: The NetMob2024 Dataset: Population Density and OD Matrices from Four LMIC Countries
- arxiv url: http://arxiv.org/abs/2410.00453v2
- Date: Wed, 2 Oct 2024 18:18:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-05 05:27:01.792436
- Title: The NetMob2024 Dataset: Population Density and OD Matrices from Four LMIC Countries
- Title(参考訳): NetMob2024データセット:4つのLMIC諸国の人口密度とOD行列
- Authors: Wenlan Zhang, Miguel Nunez del Prado, Vincent Gauthier, Sveta Milusheva,
- Abstract要約: NetMob24データセットは、さまざまな学術分野の研究者が、2年間(2019年と2020年)に4カ国にまたがる包括的なデータセットにアクセスするためのユニークな機会を提供する。
このデータセットは、調査目的で匿名データ収集に自発的に同意したユーザから収集されたモバイルアプリケーション(アプリ)データからのプライバシー保護データセットを含む。
この参照データセットが新たな研究手法の創出と研究成果の集約を促進することを願っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The NetMob24 dataset offers a unique opportunity for researchers from a range of academic fields to access comprehensive spatiotemporal data sets spanning four countries (India, Mexico, Indonesia, and Colombia) over the course of two years (2019 and 2020). This dataset, developed in collaboration with Cuebiq (Also referred to as Spectus), comprises privacy-preserving aggregated data sets derived from mobile application (app) data collected from users who have voluntarily consented to anonymous data collection for research purposes. It is our hope that this reference dataset will foster the production of new research methods and the reproducibility of research outcomes.
- Abstract(参考訳): NetMob24データセットは、さまざまな学術分野の研究者が、2年間(2019年と2020年)にわたって4つの国(インド、メキシコ、インドネシア、コロンビア)にまたがる包括的な時空間データセットにアクセスする特別な機会を提供する。
このデータセットは、Cuebiq(AlsoはSpectusと呼ばれている)と共同で開発され、研究目的のために匿名データ収集に自発的に同意したユーザから収集されたモバイルアプリケーション(アプリ)データから得られる、プライバシー保護の集約データセットを含む。
この基準データセットが新たな研究手法の創出と研究成果の再現性を促進することを願っている。
関連論文リスト
- Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - The Full-scale Assembly Simulation Testbed (FAST) Dataset [3.483595743063401]
われわれはVRを用いたFAST(Full-scale Assembly Simulation Testbed)による新しいオープンデータセットを提案する。
このデータセットは、VRで2つの異なるフルスケール構造を組み立てる方法を学ぶ108人の参加者から収集されたデータで構成されている。
論文 参考訳(メタデータ) (2024-03-13T21:30:01Z) - Datasets for Large Language Models: A Comprehensive Survey [37.153302283062004]
この調査は、LLMデータセットの基本的側面を5つの観点から統合し、分類する。
この調査は、一般的な課題を浮き彫りにし、今後の調査への道のりを指摘している。
調査対象のデータサイズは、事前トレーニングのコーパスが774.5TB、他のデータセットが700万インスタンスを超えている。
論文 参考訳(メタデータ) (2024-02-28T04:35:51Z) - DataFinder: Scientific Dataset Recommendation from Natural Language
Descriptions [100.52917027038369]
我々は、短い自然言語記述を与えられたデータセットを推奨するタスクを運用する。
この作業を容易にするために、我々は、より大規模な自動構築トレーニングセットと、より少ない専門家によるアノテート評価セットからなるDataFinderデータセットを構築した。
このシステムは、DataFinderデータセットに基づいてトレーニングされ、既存のサードパーティのデータセット検索エンジンよりも関連性の高い検索結果を見つける。
論文 参考訳(メタデータ) (2023-05-26T05:22:36Z) - DeepShovel: An Online Collaborative Platform for Data Extraction in
Geoscience Literature with AI Assistance [48.55345030503826]
地質学者は、関連する結果やデータを発見、抽出、集約するために膨大な量の文献を読む必要がある。
DeepShovelは、彼らのニーズをサポートするAI支援データ抽出システムである。
14人の研究者によるユーザ評価の結果、DeepShovelは科学データベース構築のためのデータ抽出の効率を改善した。
論文 参考訳(メタデータ) (2022-02-21T12:18:08Z) - A Summary of COVID-19 Datasets [1.3490988186255934]
本研究は、新型コロナウイルス研究のために開発された主要なデータセットについてレビューする。
このコレクションが引き続き、コンピューティングコミュニティ、バイオメディカルの専門家、および政策立案者のメンバを集結させることを願っています。
論文 参考訳(メタデータ) (2022-02-06T17:34:26Z) - Datasets: A Community Library for Natural Language Processing [55.48866401721244]
データセットは、現代のNLPのためのコミュニティライブラリである。
このライブラリには650以上のユニークなデータセットが含まれており、250以上のコントリビュータを抱えており、さまざまな新しいクロスデータセット研究プロジェクトを支援している。
論文 参考訳(メタデータ) (2021-09-07T03:59:22Z) - Retiring Adult: New Datasets for Fair Machine Learning [47.27417042497261]
UCIアダルトは、多くのアルゴリズム的公正な介入の開発と比較の基礎として機能している。
UCIアダルトデータのスーパーセットを米国国勢調査資料から再構築し、その外部妥当性を制限するUCIアダルトデータセットの慣用性を明らかにする。
私たちの主な貢献は、公正な機械学習の研究のために既存のデータエコシステムを拡張する、一連の新しいデータセットです。
論文 参考訳(メタデータ) (2021-08-10T19:19:41Z) - CO-Search: COVID-19 Information Retrieval with Semantic Search, Question
Answering, and Abstractive Summarization [53.67205506042232]
CO-Searchは、新型コロナウイルスの文献上の複雑なクエリを処理するように設計された、レトリバーランサーセマンティック検索エンジンである。
ドメイン固有の比較的限られたデータセットを考慮し、文書の段落と引用の2部グラフを生成する。
TREC-COVID情報検索課題のデータに基づいて,本システムの評価を行った。
論文 参考訳(メタデータ) (2020-06-17T01:32:48Z) - CovidNet: To Bring Data Transparency in the Era of COVID-19 [9.808021836153712]
本稿では,大規模流行データセットに関連付けられた新型コロナウイルス追跡プロジェクトであるCovidNetについて述べる。
CovidNetは、世界27か国から4,124のサブディビジョンのリアルタイムグローバルケース情報を提供する唯一のプラットフォームである。
データセットの正確性と鮮度は、自発的なチームワーク、クラウドソーシングチャネル、自動データパイプラインによる苦労の結果です。
論文 参考訳(メタデータ) (2020-05-22T00:05:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。