論文の概要: An Annotated Glossary for Data Commons, Data Meshes, and Other Data Platforms
- arxiv url: http://arxiv.org/abs/2404.15475v1
- Date: Tue, 23 Apr 2024 19:26:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 01:58:25.241286
- Title: An Annotated Glossary for Data Commons, Data Meshes, and Other Data Platforms
- Title(参考訳): データコモンズ、データメッシュ、その他のデータプラットフォームのための注釈付き用語集
- Authors: Robert L. Grossman,
- Abstract要約: クラウドベースのデータコモンズ、データメッシュ、データハブ、その他のデータプラットフォームは、データを管理、分析、共有して研究を加速し、再現可能な研究をサポートする重要な方法である。
これは、これらのプラットフォームに関する記事や議論で使われる、より一般的な用語の注釈付き用語集である。
- 参考スコア(独自算出の注目度): 1.599816632987178
- License:
- Abstract: Cloud-based data commons, data meshes, data hubs, and other data platforms are important ways to manage, analyze and share data to accelerate research and to support reproducible research. This is an annotated glossary of some of the more common terms used in articles and discussions about these platforms.
- Abstract(参考訳): クラウドベースのデータコモンズ、データメッシュ、データハブ、その他のデータプラットフォームは、データを管理、分析、共有して研究を加速し、再現可能な研究をサポートする重要な方法である。
これは、これらのプラットフォームに関する記事や議論で使われる、より一般的な用語の注釈付き用語集である。
関連論文リスト
- A Survey on Data Markets [73.07800441775814]
より大きな福祉のためのトレーディングデータの増加は、データ市場の台頭につながっている。
データ市場とは、データセットやデータデリバティブを含むデータプロダクトの交換が行われるメカニズムである。
これは、価格やデータの分散など、いくつかの機能が相互作用するコーディネートメカニズムとして機能する。
論文 参考訳(メタデータ) (2024-11-09T15:09:24Z) - Leveraging GPT for the Generation of Multi-Platform Social Media Datasets for Research [0.0]
ソーシャルメディアデータセットは、偽情報、影響操作、ソーシャルセンシング、ヘイトスピーチ検出、サイバーいじめ、その他の重要なトピックの研究に不可欠である。
これらのデータセットへのアクセスは、コストとプラットフォーム規制のために制限されることが多い。
本稿では,複数のプラットフォームにまたがって,語彙的および意味論的に関連するソーシャルメディアデータセットを作成するための,大規模言語モデルの可能性について検討する。
論文 参考訳(メタデータ) (2024-07-11T09:12:39Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Open the Data! Chuvash Datasets [50.59120569845975]
Chuvash言語用の包括的データセットを4つ紹介する。
これらのデータセットには、モノリンガルデータセット、ロシア語による並列データセット、英語による並列データセット、オーディオデータセットが含まれる。
論文 参考訳(メタデータ) (2024-05-31T07:51:19Z) - Large Language Models(LLMs) on Tabular Data: Prediction, Generation, and Understanding -- A Survey [17.19337964440007]
現在、この研究領域における主要なテクニック、メトリクス、データセット、モデル、最適化アプローチを要約し比較する包括的なレビューが欠如しています。
この調査は、これらの領域における最近の進歩を集約し、使用するデータセット、メトリクス、方法論の詳細な調査と分類を提供することによって、このギャップに対処することを目的としている。
既存の文献の強さ、限界、未探索領域、ギャップを識別し、この重要かつ急速に発展する分野における将来の研究の方向性についていくつかの洞察を提供する。
論文 参考訳(メタデータ) (2024-02-27T23:59:01Z) - A Survey of Data Pricing for Data Marketplaces [77.3189288320768]
本稿では,既存のデータ価格研究の現状を概観する。
我々の重要な貢献は、データ価格を決定する異なる属性を統一するデータ価格研究の新しい分類である。
論文 参考訳(メタデータ) (2023-03-07T04:35:56Z) - DataPerf: Benchmarks for Data-Centric AI Development [81.03754002516862]
DataPerfは、MLデータセットとデータ中心アルゴリズムを評価するための、コミュニティ主導のベンチマークスイートである。
私たちは、この反復的な開発をサポートするために、複数の課題を抱えたオープンなオンラインプラットフォームを提供しています。
ベンチマーク、オンライン評価プラットフォーム、ベースライン実装はオープンソースである。
論文 参考訳(メタデータ) (2022-07-20T17:47:54Z) - Big Data and Education: using big data analytics in language learning [0.0]
データマイニングツールを使ったビッグデータの利用は、教育業界で急速にトレンドになりつつある。
我々は,教育データマイニングと学習分析に関する基本的な概念と,最も一般的なツール,手法,技術について考察する。
論文 参考訳(メタデータ) (2022-07-19T19:17:10Z) - Documenting Geographically and Contextually Diverse Data Sources: The
BigScience Catalogue of Language Data and Resources [17.69148305999049]
我々はBigScienceイニシアチブの一環として、ドキュメントファーストで人間中心のデータ収集プロジェクトのための方法論を提示する。
我々は,潜在的なデータソースのメタデータを収集する,地理的に多様な対象言語群を同定する。
この取り組みを構築するために,組織化された公開ハッカソンを通じてメタデータを収集する支援ツールとして,オンラインカタログを開発した。
論文 参考訳(メタデータ) (2022-01-25T03:05:23Z) - A Survey on Data Pricing: from Economics to Data Science [61.72030615854597]
データ価格の背景にある様々なモチベーションを調べ、データ価格の経済性を理解する。
デジタル製品とデータ製品の両方について論じる。
我々は、今後の仕事の一連の課題と方向性を考えます。
論文 参考訳(メタデータ) (2020-09-09T19:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。