論文の概要: How Data Scientists Review the Scholarly Literature
- arxiv url: http://arxiv.org/abs/2301.03774v1
- Date: Tue, 10 Jan 2023 03:53:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 17:20:44.749273
- Title: How Data Scientists Review the Scholarly Literature
- Title(参考訳): データサイエンティストが学術文献をレビューする方法
- Authors: Sheshera Mysore, Mahmood Jasim, Haoru Song, Sarah Akbar, Andre Kenneth
Chase Randall, Narges Mahyar
- Abstract要約: データサイエンティストの文献レビューの実践について検討する。
データサイエンスは、論文の指数的な増加を示す分野である。
これらの科学者が直面する具体的な実践や課題について、事前の研究は行われていない。
- 参考スコア(独自算出の注目度): 4.406926847270567
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Keeping up with the research literature plays an important role in the
workflow of scientists - allowing them to understand a field, formulate the
problems they focus on, and develop the solutions that they contribute, which
in turn shape the nature of the discipline. In this paper, we examine the
literature review practices of data scientists. Data science represents a field
seeing an exponential rise in papers, and increasingly drawing on and being
applied in numerous diverse disciplines. Recent efforts have seen the
development of several tools intended to help data scientists cope with a
deluge of research and coordinated efforts to develop AI tools intended to
uncover the research frontier. Despite these trends indicative of the
information overload faced by data scientists, no prior work has examined the
specific practices and challenges faced by these scientists in an
interdisciplinary field with evolving scholarly norms. In this paper, we close
this gap through a set of semi-structured interviews and think-aloud protocols
of industry and academic data scientists (N = 20). Our results while
corroborating other knowledge workers' practices uncover several novel
findings: individuals (1) are challenged in seeking and sensemaking of papers
beyond their disciplinary bubbles, (2) struggle to understand papers in the
face of missing details and mathematical content, (3) grapple with the deluge
by leveraging the knowledge context in code, blogs, and talks, and (4) lean on
their peers online and in-person. Furthermore, we outline future directions
likely to help data scientists cope with the burgeoning research literature.
- Abstract(参考訳): 研究文献に追いつくことは、科学者のワークフローにおいて重要な役割を担います – 分野を理解し、焦点を絞った問題を定式化し、彼らが貢献するソリューションを開発し、それが規律の性質を形作るのです。
本稿では,データ科学者の文献レビューの実践について検討する。
データサイエンスは、論文が指数関数的に増加し、ますます様々な分野に応用されていく分野である。
最近の取り組みでは、データサイエンティストが大量の研究に対処し、研究のフロンティアを明らかにするためのaiツールを開発するための協力的な取り組みを支援する、いくつかのツールの開発が見られる。
これらの傾向は、データ科学者が直面する情報過負荷を示すものだが、これらの科学者が学際的な分野において直面する特定の実践や課題について、学術的な規範が進化する以前の研究は行われていない。
本稿では,このギャップを,産業および学術データサイエンティストの半構造化インタビューと思考情報プロトコル(N=20)を通じて埋める。
その結果,(1) 個人は学際的なバブルを超えて論文の発見・理解に挑戦し,(2) 詳細や数学的内容の欠如に直面した論文の理解に苦慮し,(3) コード,ブログ,講演における知識コンテキストを活用することで,論文の難しさに対処し,(4) オンラインで,かつ,直接,同僚に頼りにしている,という新たな知見が明らかになった。
さらに,データ科学者が急成長する研究文献に対処できるであろう今後の方向性について概説する。
関連論文リスト
- A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery [68.48094108571432]
大規模言語モデル(LLM)は、テキストやその他のデータ処理方法に革命をもたらした。
我々は,科学LLM間のクロスフィールドおよびクロスモーダル接続を明らかにすることで,研究ランドスケープのより総合的なビューを提供することを目指している。
論文 参考訳(メタデータ) (2024-06-16T08:03:24Z) - MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-10T15:19:09Z) - ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、大規模言語モデルによる研究アイデア作成エージェントである。
科学文献に基づいて繰り返し精製しながら、問題、方法、実験設計を生成する。
我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文 参考訳(メタデータ) (2024-04-11T13:36:29Z) - Knowledge Graphs for the Life Sciences: Recent Developments, Challenges
and Opportunities [11.35513523308132]
生命科学におけるグラフ技術の利用の進展と進歩について論じる。
我々は、知識グラフ(KG)の構築と管理、新しい知識の発見におけるKGとその関連技術の使用、説明を支援する人工知能アプリケーションにおけるKGの使用の3つの幅広いトピックに焦点を当てる。
論文 参考訳(メタデータ) (2023-09-29T14:03:34Z) - A Diachronic Analysis of Paradigm Shifts in NLP Research: When, How, and
Why? [84.46288849132634]
本稿では、因果発見と推論技術を用いて、科学分野における研究トピックの進化を分析するための体系的な枠組みを提案する。
我々は3つの変数を定義し、NLPにおける研究トピックの進化の多様な側面を包含する。
我々は因果探索アルゴリズムを用いてこれらの変数間の因果関係を明らかにする。
論文 参考訳(メタデータ) (2023-05-22T11:08:00Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - A Search Engine for Discovery of Biomedical Challenges and Directions [38.72769142277108]
フル長の論文から抽出したテキストの注釈付きコーパスを構築し,リリースする。
新型コロナウイルスのパンデミックに関連する学際的な作業の大規模なコーパスに焦点を当てる。
我々は、データに基づいてトレーニングされたモデルを適用して、コーパス全体の課題と方向性を特定し、この情報のための専用の検索エンジンを構築します。
論文 参考訳(メタデータ) (2021-08-31T11:08:20Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - A field guide to cultivating computational biology [1.040598660564506]
バイオメディカルリサーチセンターは、実験や患者からの大規模なデータセットを活用することで、基礎的な発見と治療戦略を強化することができる。
このデータと、それを作成し、分析する新しい技術は、従来の個別の単一分野の研究モデルを超えて、データ駆動の発見の時代を後押ししてきた。
我々は、個々の科学者、機関、雑誌発行者、資金調達機関、教育者に対する解決策を提案する。
論文 参考訳(メタデータ) (2021-04-23T01:24:21Z) - Semantic and Relational Spaces in Science of Science: Deep Learning
Models for Article Vectorisation [4.178929174617172]
我々は、自然言語処理(NLP)とグラフニューラルネットワーク(GNN)を用いて、記事の意味的・関係的な側面に基づく文書レベルの埋め込みに焦点を当てる。
論文のセマンティックな空間をNLPでエンコードできるのに対し、GNNでは研究コミュニティの社会的実践をエンコードするリレーショナルな空間を構築することができる。
論文 参考訳(メタデータ) (2020-11-05T14:57:41Z) - Generating Knowledge Graphs by Employing Natural Language Processing and
Machine Learning Techniques within the Scholarly Domain [1.9004296236396943]
本稿では、自然言語処理と機械学習を利用して研究論文から実体や関係を抽出する新しいアーキテクチャを提案する。
本研究では,現在最先端の自然言語処理ツールとテキストマイニングツールを用いて,知識抽出の課題に取り組む。
セマンティックWebドメイン内の論文26,827件から抽出した109,105件のトリプルを含む科学知識グラフを作成した。
論文 参考訳(メタデータ) (2020-10-28T08:31:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。