論文の概要: Evaluating the state-of-the-art in mapping research spaces: a Brazilian
case study
- arxiv url: http://arxiv.org/abs/2104.03338v1
- Date: Wed, 7 Apr 2021 18:14:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 04:22:59.840770
- Title: Evaluating the state-of-the-art in mapping research spaces: a Brazilian
case study
- Title(参考訳): 地図研究空間における最先端技術の評価--ブラジルの事例研究
- Authors: Francisco Galuppo Azevedo and Fabricio Murai
- Abstract要約: 最近の2つの研究は、科学者の出版記録から研究地図を作成する方法を提案している。
与えられたエンティティが新しいフィールドに入るかどうかを予測するモデルの能力を評価します。
これらのモデルがどのようにブラジルの文脈で科学のダイナミクスを特徴づけることができるかを示すケーススタディを実施します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific knowledge cannot be seen as a set of isolated fields, but as a
highly connected network. Understanding how research areas are connected is of
paramount importance for adequately allocating funding and human resources
(e.g., assembling teams to tackle multidisciplinary problems). The relationship
between disciplines can be drawn from data on the trajectory of individual
scientists, as researchers often make contributions in a small set of
interrelated areas. Two recent works propose methods for creating research maps
from scientists' publication records: by using a frequentist approach to create
a transition probability matrix; and by learning embeddings (vector
representations). Surprisingly, these models were evaluated on different
datasets and have never been compared in the literature. In this work, we
compare both models in a systematic way, using a large dataset of publication
records from Brazilian researchers. We evaluate these models' ability to
predict whether a given entity (scientist, institution or region) will enter a
new field w.r.t. the area under the ROC curve. Moreover, we analyze how
sensitive each method is to the number of publications and the number of fields
associated to one entity. Last, we conduct a case study to showcase how these
models can be used to characterize science dynamics in the context of Brazil.
- Abstract(参考訳): 科学的知識は孤立した分野の集合として見ることはできないが、高度に結びついたネットワークとして見なされる。
研究領域がどのように結びついているかを理解することは、資金と人的資源を適切に割り当てる上で、最重要事項である。
分野間の関係は個々の科学者の軌跡のデータから導き出され、研究者はしばしば小さな相互関連領域に寄与する。
最近の2つの研究により、科学者の出版記録から研究地図を作成する方法が提案されている。
驚くべきことに、これらのモデルは異なるデータセットで評価され、文献で比較されることはなかった。
本研究では,ブラジルの研究者による大量の出版記録を用いて,両モデルを体系的に比較する。
我々は、与えられた実体(科学者、機関、地域)が新しい分野に入るかどうかを予測するこれらのモデルの能力を評価する。
ROC曲線の下の領域。
さらに、各メソッドが出版物数と1つのエンティティに関連するフィールド数に対してどれほど敏感であるかを分析する。
最後に、ブラジルの文脈において、これらのモデルがどのように科学力学を特徴づけられるかを示すケーススタディを行う。
関連論文リスト
- Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.34182805429511]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できる
この研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。
本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文 参考訳(メタデータ) (2024-07-17T20:01:21Z) - A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery [68.48094108571432]
我々は,科学LLM間のクロスフィールドおよびクロスモーダル接続を明らかにすることで,研究ランドスケープのより総合的なビューを提供することを目指している。
本稿では,250以上の科学LLMを包括的に調査し,それらの共通点と相違点について考察するとともに,各分野とモダリティに関する事前学習データセットと評価タスクを要約する。
論文 参考訳(メタデータ) (2024-06-16T08:03:24Z) - A Survey of Decomposition-Based Evolutionary Multi-Objective Optimization: Part II -- A Data Science Perspective [4.322038460697958]
5,400以上の論文,10,000人の著者,400の会場,1600のMOEA/D研究機関をカプセル化したナレッジグラフを構築します。
また、MOEA/Dの協調と引用ネットワークを探求し、文学の成長に隠れたパターンを明らかにする。
論文 参考訳(メタデータ) (2024-04-22T14:38:58Z) - Large Models for Time Series and Spatio-Temporal Data: A Survey and
Outlook [95.32949323258251]
時系列データ、特に時系列データと時間時間データは、現実世界のアプリケーションで広く使われている。
大規模言語やその他の基礎モデルの最近の進歩は、時系列データマイニングや時間データマイニングでの使用の増加に拍車を掛けている。
論文 参考訳(メタデータ) (2023-10-16T09:06:00Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Mapping Research Trajectories [0.0]
本稿では, あらゆる科学分野に適用可能な, 研究軌道のエンハンマッピングに関する原則的アプローチを提案する。
われわれの視覚化は、時間とともに実体の研究トピックを、直接的に相互に表現している。
実践的な実証アプリケーションでは、機械学習による出版コーパスに対する提案されたアプローチを例示する。
論文 参考訳(メタデータ) (2022-04-25T13:32:39Z) - Semantic and Relational Spaces in Science of Science: Deep Learning
Models for Article Vectorisation [4.178929174617172]
我々は、自然言語処理(NLP)とグラフニューラルネットワーク(GNN)を用いて、記事の意味的・関係的な側面に基づく文書レベルの埋め込みに焦点を当てる。
論文のセマンティックな空間をNLPでエンコードできるのに対し、GNNでは研究コミュニティの社会的実践をエンコードするリレーショナルな空間を構築することができる。
論文 参考訳(メタデータ) (2020-11-05T14:57:41Z) - A Survey of Embedding Space Alignment Methods for Language and Knowledge
Graphs [77.34726150561087]
単語,文,知識グラフの埋め込みアルゴリズムに関する現在の研究状況について調査する。
本稿では、関連するアライメント手法の分類と、この研究分野で使用されるベンチマークデータセットについて論じる。
論文 参考訳(メタデータ) (2020-10-26T16:08:13Z) - Method and Dataset Entity Mining in Scientific Literature: A CNN +
Bi-LSTM Model with Self-attention [21.93889297841459]
MDERと呼ばれる新しいエンティティ認識モデルを提案し、科学的論文から効果的にメソッドとデータセットを抽出することができる。
我々は,NLP,CV,データマイニング,AIの4つの研究分野の論文から構築したデータセットのモデルを評価する。
論文 参考訳(メタデータ) (2020-10-26T13:38:43Z) - Topic Space Trajectories: A case study on machine learning literature [0.0]
本稿では,研究トピックの包括的追跡を可能にする構造であるトピック空間トラジェクトリを提案する。
我々は,32の出版会場から50年間の機械学習研究を対象とする出版コーパスへのアプローチの適用性を示した。
本手法は,論文分類,今後の研究課題の予測,未発表の論文提出のための会議や雑誌の掲載を推奨するために利用することができる。
論文 参考訳(メタデータ) (2020-10-23T10:53:42Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。