論文の概要: A compendium of data sources for data science, machine learning, and
artificial intelligence
- arxiv url: http://arxiv.org/abs/2309.05682v1
- Date: Sun, 10 Sep 2023 19:15:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 15:51:09.459750
- Title: A compendium of data sources for data science, machine learning, and
artificial intelligence
- Title(参考訳): データサイエンス、機械学習、人工知能のためのデータソースのコンペディション
- Authors: Paul Bilokon and Oleksandr Bilokon and Saeed Amen
- Abstract要約: データサイエンス、機械学習、人工知能の最近の進歩は、データに対する需要の増加につながっている。
データソースはアプリケーション固有のものであり、そのようなデータソースの完全なリストを作成することは不可能である。
この出版の目標は、複数の分野のアプリケーションにまたがるデータソースの(必然的に不完全な)リストを提供することです。
- 参考スコア(独自算出の注目度): 17.857341127079305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in data science, machine learning, and artificial
intelligence, such as the emergence of large language models, are leading to an
increasing demand for data that can be processed by such models. While data
sources are application-specific, and it is impossible to produce an exhaustive
list of such data sources, it seems that a comprehensive, rather than complete,
list would still benefit data scientists and machine learning experts of all
levels of seniority. The goal of this publication is to provide just such an
(inevitably incomplete) list -- or compendium -- of data sources across
multiple areas of applications, including finance and economics, legal (laws
and regulations), life sciences (medicine and drug discovery), news sentiment
and social media, retail and ecommerce, satellite imagery, and shipping and
logistics, and sports.
- Abstract(参考訳): 大規模言語モデルの出現など、データサイエンス、機械学習、人工知能の最近の進歩は、そのようなモデルによって処理可能なデータの需要の増加につながっている。
データソースはアプリケーション固有のものであり、そのようなデータソースの完全なリストを作成することは不可能である。
この出版の目的は、金融と経済、法(法律と規制)、生命科学(医療と薬物の発見)、ニュースの感情とソーシャルメディア、小売とeコマース、衛星画像、輸送と物流、スポーツなど、さまざまな分野の応用分野にまたがるデータソースの(故意に未完成な)リストを提供することである。
関連論文リスト
- DSBench: How Far Are Data Science Agents to Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - Research on the Spatial Data Intelligent Foundation Model [70.47828328840912]
本報告では、これらのモデルの原理、手法、最先端の応用を探求する、空間データインテリジェントな大規模モデルに焦点を当てる。
これは、空間データインテリジェントな大規模モデルの定義、開発履歴、現状、およびトレンドに関する詳細な議論を提供する。
本報告では, 都市環境, 航空宇宙リモートセンシング, 地理, 交通, その他のシナリオにおける空間データ知能大規模モデルの重要技術とその応用を体系的に解明する。
論文 参考訳(メタデータ) (2024-05-30T06:21:34Z) - Best Practices and Lessons Learned on Synthetic Data [83.63271573197026]
AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。
合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文 参考訳(メタデータ) (2024-04-11T06:34:17Z) - Book Chapter in Computational Demography and Health [0.0]
計算デモグラフィー、ビッグデータ、精密健康研究には社会科学者、物理科学者、技術者、データ科学者、疾病の専門家が含まれる。
この作業は、管理データの使用方法を変え、調査を実施し、ビッグデータを通じた複雑な行動研究を可能にしました。
この章では、この新興分野の新しいデータソース、メソッド、アプリケーションについてレビューする。
論文 参考訳(メタデータ) (2023-09-08T17:30:33Z) - Data-centric Artificial Intelligence: A Survey [47.24049907785989]
近年、AIにおけるデータの役割は大幅に拡大し、データ中心AIという新たな概念が生まれた。
本稿では,データ中心型AIの必要性について論じ,続いて3つの一般的なデータ中心型目標の全体像を考察する。
これは、データライフサイクルのさまざまな段階にわたるタスクのグローバルなビューを提供する、初めての総合的な調査である、と私たちは信じています。
論文 参考訳(メタデータ) (2023-03-17T17:44:56Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - Computational Skills by Stealth in Secondary School Data Science [16.960800464621993]
本稿では,学生によるデータサイエンスへの最初の露出における計算スキルのステルス開発について論じる。
このアプローチの目的は、データ駆動学習者になる際に、興味やコーディングの自己効力によらず、学生を支援することである。
論文 参考訳(メタデータ) (2020-10-08T09:11:51Z) - A Survey on Data Pricing: from Economics to Data Science [61.72030615854597]
データ価格の背景にある様々なモチベーションを調べ、データ価格の経済性を理解する。
デジタル製品とデータ製品の両方について論じる。
我々は、今後の仕事の一連の課題と方向性を考えます。
論文 参考訳(メタデータ) (2020-09-09T19:31:38Z) - A fresh look at introductory data science [0.0]
本稿では、これらのニーズに対処するために設計されたデータサイエンスの入門学部のケーススタディを示す。
このコースには前提条件がなく、人文科学、社会科学、自然科学の学生だけでなく、目指す統計学やデータサイエンス専攻の幅広い聴衆に役立っている。
このようなコースを提供することによって生じる課題のユニークなセットについて議論し、これらの課題を踏まえて、教育設計要素、コンテンツ、構造、計算インフラ、およびコースの評価方法論について詳細な議論を行う。
論文 参考訳(メタデータ) (2020-08-01T18:39:34Z) - Data Science: A Comprehensive Overview [42.98602883069444]
21世紀はビッグデータとデータ経済の時代に始まり、データDNAはすべてのデータに基づく有機体の本質的な構成要素となっている。
データDNAとその生物の適切な理解は、新しいデータ科学の分野と分析のキーストーンに依存している。
この記事では、データサイエンスと分析に関する豊富な観察、教訓、考察に加えて、総合的な全体像を描いている分野としては、初めてである。
論文 参考訳(メタデータ) (2020-07-01T02:33:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。