論文の概要: Evolution and use of data science vocabulary. How much have we changed
in 13 years?
- arxiv url: http://arxiv.org/abs/2204.10174v1
- Date: Mon, 28 Mar 2022 23:31:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-24 16:43:42.201356
- Title: Evolution and use of data science vocabulary. How much have we changed
in 13 years?
- Title(参考訳): データサイエンスの語彙の進化と利用。
13年でどのくらい変わりましたか。
- Authors: Igor Barahona
- Abstract要約: タイトル、抽象語、キーワードに「データサイエンス」という単語を含む12,787の文書からなるデータベースを解析する。
この分野の進化を3つの期間(出芽、成長、ブーム)に分類することが提案されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Here I present an investigation on the evolution and use of vocabulary in
data science in the last 13 years. Based on a rigorous statistical analysis, a
database with 12,787 documents containing the words "data science" in the
title, abstract or keywords is analyzed. It is proposed to classify the
evolution of this discipline in three periods: emergence, growth and boom.
Characteristic words and pioneering documents are identified for each period.
By proposing the distinctive vocabulary and relevant topics of data science and
classified in time periods, these results add value to the scientific community
of this discipline.
- Abstract(参考訳): ここでは,過去13年間のデータサイエンスにおける語彙の進化と利用について検討する。
厳密な統計分析に基づいて、「データサイエンス」のタイトル、抽象語、キーワードを含む12,787の文書からなるデータベースを解析する。
この分野の進化を、出現、成長、ブームの3つの期間に分類することが提案されている。
各期間ごとに特徴ある単語や先駆的な文書が識別される。
データサイエンスの特有な語彙と関連するトピックを提案し、時代によって分類することで、これらの結果はこの分野の科学コミュニティに価値を与えます。
関連論文リスト
- SciInstruct: a Self-Reflective Instruction Annotated Dataset for Training Scientific Language Models [57.96527452844273]
我々はSciInstructを紹介した。SciInstructは、大学レベルの科学的推論が可能な科学言語モデルを訓練するための科学指導スイートである。
我々は、物理学、化学、数学、公式な証明を含む多種多様な高品質なデータセットをキュレートした。
SciInstructの有効性を検証するため、SciInstruct、すなわちChatGLM3(6Bと32B)、Llama3-8B-Instruct、Mistral-7B: MetaMathを用いて言語モデルを微調整した。
論文 参考訳(メタデータ) (2024-01-15T20:22:21Z) - The evolving of Data Science and the Saudi Arabia case. How much have we
changed in 13 years? [0.0]
この研究は、新しい語彙を導入し、その後、この語彙が科学文献にどのように組み込まれたかを探求する文書の同定を含む。
研究結果とサウジアラビア特有の論文の比較を行った。
論文 参考訳(メタデータ) (2023-10-23T11:09:38Z) - Defining data science: a new field of inquiry [0.0]
現代のデータサイエンスは生まれたばかりで、1962年から徐々に発展し、2000年から急速に発展し、21世紀の最も活発で強力で急速に進化しているイノベーションの1つです。
その価値、パワー、適用性のために、40以上の分野、何百もの研究領域、何千ものアプリケーションで登場しています。
本研究は、データサイエンス参照フレームワークに基づく一貫性のある統一された定義の開発を提案することにより、このデータサイエンスの多重定義問題に対処する。
論文 参考訳(メタデータ) (2023-06-28T12:58:42Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - Language statistics at different spatial, temporal, and grammatical
scales [48.7576911714538]
Twitterのデータを使って、さまざまなスケールでランクの多様性を探求しています。
最も大きな変化は、文法的なスケールのバリエーションによる。
文法スケールが大きくなるにつれて、ランクの多様性曲線は時間スケールや空間スケールによって大きく変化する。
論文 参考訳(メタデータ) (2022-07-02T01:38:48Z) - SciTweets -- A Dataset and Annotation Framework for Detecting Scientific
Online Discourse [2.3371548697609303]
科学的な話題、主張、資源は、オンライン談話の一部としてますます議論されている。
これにより、社会的な影響が大きくなり、様々な分野からの科学的オンライン談話への関心が高まった。
専門分野にわたる研究は、現在、科学関連の様々な形態の堅牢な定義の欠如に悩まされている。
論文 参考訳(メタデータ) (2022-06-15T08:14:55Z) - Change Summarization of Diachronic Scholarly Paper Collections by
Semantic Evolution Analysis [10.554831859741851]
本研究では,長期間にわたる研究論文の収集を解析するための新しい手法を実証する。
我々のアプローチは、時間とともに単語の意味表現を比較することに基づいており、学術出版物の大規模なドメイン中心のアーカイブをより深く理解することを目的としている。
論文 参考訳(メタデータ) (2021-12-07T11:15:19Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - Principal Components of the Meaning [58.720142291102135]
科学における(語彙的な)意味は、13次元の意味空間で表すことができる。
この空間は、単語カテゴリ相対情報ゲインの行列上の主成分分析(特異分解)を用いて構成される。
論文 参考訳(メタデータ) (2020-09-18T14:28:32Z) - Informational Space of Meaning for Scientific Texts [68.8204255655161]
本稿では,単語の意味を,テキストが属する対象カテゴリに関する相対情報ゲイン(RIG)のベクトルで表現する意味空間を紹介する。
Leicester Scientific Corpus (LSC) と Leicester Scientific Dictionary-Core (LScDC) に基づく意味空間の構築に本手法を適用した。
RIGに基づく提案モデルでは,カテゴリ内の話題特化語を際立たせる能力があることが示されている。
論文 参考訳(メタデータ) (2020-04-28T14:26:12Z) - Ten Research Challenge Areas in Data Science [4.670305538969914]
データサイエンスは、コンピュータ科学、数学、統計学、その他の分野の知識に基づいている。
この記事では、データサイエンスの専門分野としてのメタクエストから始め、データサイエンスの研究課題の基礎となる10のアイデアについて詳述する。
論文 参考訳(メタデータ) (2020-01-27T21:39:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。