論文の概要: A compendium of data sources for data science, machine learning, and
artificial intelligence
- arxiv url: http://arxiv.org/abs/2309.05682v1
- Date: Sun, 10 Sep 2023 19:15:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 15:51:09.459750
- Title: A compendium of data sources for data science, machine learning, and
artificial intelligence
- Title(参考訳): データサイエンス、機械学習、人工知能のためのデータソースのコンペディション
- Authors: Paul Bilokon and Oleksandr Bilokon and Saeed Amen
- Abstract要約: データサイエンス、機械学習、人工知能の最近の進歩は、データに対する需要の増加につながっている。
データソースはアプリケーション固有のものであり、そのようなデータソースの完全なリストを作成することは不可能である。
この出版の目標は、複数の分野のアプリケーションにまたがるデータソースの(必然的に不完全な)リストを提供することです。
- 参考スコア(独自算出の注目度): 17.857341127079305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in data science, machine learning, and artificial
intelligence, such as the emergence of large language models, are leading to an
increasing demand for data that can be processed by such models. While data
sources are application-specific, and it is impossible to produce an exhaustive
list of such data sources, it seems that a comprehensive, rather than complete,
list would still benefit data scientists and machine learning experts of all
levels of seniority. The goal of this publication is to provide just such an
(inevitably incomplete) list -- or compendium -- of data sources across
multiple areas of applications, including finance and economics, legal (laws
and regulations), life sciences (medicine and drug discovery), news sentiment
and social media, retail and ecommerce, satellite imagery, and shipping and
logistics, and sports.
- Abstract(参考訳): 大規模言語モデルの出現など、データサイエンス、機械学習、人工知能の最近の進歩は、そのようなモデルによって処理可能なデータの需要の増加につながっている。
データソースはアプリケーション固有のものであり、そのようなデータソースの完全なリストを作成することは不可能である。
この出版の目的は、金融と経済、法(法律と規制)、生命科学(医療と薬物の発見)、ニュースの感情とソーシャルメディア、小売とeコマース、衛星画像、輸送と物流、スポーツなど、さまざまな分野の応用分野にまたがるデータソースの(故意に未完成な)リストを提供することである。
関連論文リスト
- A Survey on Data Selection for Language Models [151.6210632830082]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - Book Chapter in Computational Demography and Health [0.0]
計算デモグラフィー、ビッグデータ、精密健康研究には社会科学者、物理科学者、技術者、データ科学者、疾病の専門家が含まれる。
この作業は、管理データの使用方法を変え、調査を実施し、ビッグデータを通じた複雑な行動研究を可能にしました。
この章では、この新興分野の新しいデータソース、メソッド、アプリケーションについてレビューする。
論文 参考訳(メタデータ) (2023-09-08T17:30:33Z) - Data-centric Artificial Intelligence: A Survey [47.24049907785989]
近年、AIにおけるデータの役割は大幅に拡大し、データ中心AIという新たな概念が生まれた。
本稿では,データ中心型AIの必要性について論じ,続いて3つの一般的なデータ中心型目標の全体像を考察する。
これは、データライフサイクルのさまざまな段階にわたるタスクのグローバルなビューを提供する、初めての総合的な調査である、と私たちは信じています。
論文 参考訳(メタデータ) (2023-03-17T17:44:56Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - Maximizing information from chemical engineering data sets: Applications
to machine learning [61.442473332320176]
化学工学の応用において、古典的な人工知能のアプローチを適用するのが難しくなる4つの特徴を同定する。
それぞれのデータ特性について、これらのデータ特性が生じるアプリケーションについて論じ、現在の化学工学研究が、これらの課題を組み込むために、データサイエンスと機械学習の分野をどのように拡張しているかを示す。
論文 参考訳(メタデータ) (2022-01-25T01:25:45Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z) - Computational Skills by Stealth in Secondary School Data Science [16.960800464621993]
本稿では,学生によるデータサイエンスへの最初の露出における計算スキルのステルス開発について論じる。
このアプローチの目的は、データ駆動学習者になる際に、興味やコーディングの自己効力によらず、学生を支援することである。
論文 参考訳(メタデータ) (2020-10-08T09:11:51Z) - A Survey on Data Pricing: from Economics to Data Science [61.72030615854597]
データ価格の背景にある様々なモチベーションを調べ、データ価格の経済性を理解する。
デジタル製品とデータ製品の両方について論じる。
我々は、今後の仕事の一連の課題と方向性を考えます。
論文 参考訳(メタデータ) (2020-09-09T19:31:38Z) - A fresh look at introductory data science [0.0]
本稿では、これらのニーズに対処するために設計されたデータサイエンスの入門学部のケーススタディを示す。
このコースには前提条件がなく、人文科学、社会科学、自然科学の学生だけでなく、目指す統計学やデータサイエンス専攻の幅広い聴衆に役立っている。
このようなコースを提供することによって生じる課題のユニークなセットについて議論し、これらの課題を踏まえて、教育設計要素、コンテンツ、構造、計算インフラ、およびコースの評価方法論について詳細な議論を行う。
論文 参考訳(メタデータ) (2020-08-01T18:39:34Z) - Data Science: A Comprehensive Overview [42.98602883069444]
21世紀はビッグデータとデータ経済の時代に始まり、データDNAはすべてのデータに基づく有機体の本質的な構成要素となっている。
データDNAとその生物の適切な理解は、新しいデータ科学の分野と分析のキーストーンに依存している。
この記事では、データサイエンスと分析に関する豊富な観察、教訓、考察に加えて、総合的な全体像を描いている分野としては、初めてである。
論文 参考訳(メタデータ) (2020-07-01T02:33:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。