論文の概要: Will This Idea Spread Beyond Academia? Understanding Knowledge Transfer
of Scientific Concepts across Text Corpora
- arxiv url: http://arxiv.org/abs/2010.06657v1
- Date: Tue, 13 Oct 2020 19:46:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 00:33:14.758371
- Title: Will This Idea Spread Beyond Academia? Understanding Knowledge Transfer
of Scientific Concepts across Text Corpora
- Title(参考訳): この考えは学界を超えて広まるだろうか。
テキストコーパスにおける科学概念の知識伝達の理解
- Authors: Hancheng Cao, Mengjie Cheng, Zhepeng Cen, Daniel A. McFarland, Xiang
Ren
- Abstract要約: 我々はすべての科学分野の科学的概念のレベルで翻訳研究を研究する。
我々は「研究アイデア」のインスタンス化としてコーパスから科学的概念を抽出する。
そして、45万以上の新しい概念の軌跡を辿って、これらのアイデアのごく一部しか発明や薬物の試行に使われていない要因を特定します。
- 参考スコア(独自算出の注目度): 18.76916879679805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: What kind of basic research ideas are more likely to get applied in practice?
There is a long line of research investigating patterns of knowledge transfer,
but it generally focuses on documents as the unit of analysis and follow their
transfer into practice for a specific scientific domain. Here we study
translational research at the level of scientific concepts for all scientific
fields. We do this through text mining and predictive modeling using three
corpora: 38.6 million paper abstracts, 4 million patent documents, and 0.28
million clinical trials. We extract scientific concepts (i.e., phrases) from
corpora as instantiations of "research ideas", create concept-level features as
motivated by literature, and then follow the trajectories of over 450,000 new
concepts (emerged from 1995-2014) to identify factors that lead only a small
proportion of these ideas to be used in inventions and drug trials. Results
from our analysis suggest several mechanisms that distinguish which scientific
concept will be adopted in practice, and which will not. We also demonstrate
that our derived features can be used to explain and predict knowledge transfer
with high accuracy. Our work provides greater understanding of knowledge
transfer for researchers, practitioners, and government agencies interested in
encouraging translational research.
- Abstract(参考訳): 実践に応用される基本的な研究アイデアはどのようなものか?
知識伝達のパターンを調査する研究は長いが、一般的には分析単位としての文書に焦点をあて、特定の科学領域の実践への移行に追随する。
ここでは、すべての科学分野の科学概念のレベルで翻訳研究を研究する。
私たちは3つのコーパスを使ってテキストマイニングと予測モデリングを行い、3860万の論文要約、400万の特許文書、0.28万の臨床試験を行います。
我々は、コーポラから「研究アイデア」のインスタンス化として科学概念(句)を抽出し、文学によって動機づけられた概念レベルの特徴を創出し、さらに45万以上の新しい概念(1995年から2014年までの)の軌跡を辿り、これらの概念のごく一部しか発明や薬物試験に使われない要因を特定する。
分析の結果, 科学的概念が実際に採用されるか, そうでないかを区別するいくつかのメカニズムが示唆された。
また,本手法を用いて知識伝達を高精度に説明・予測できることを示す。
本研究は,翻訳研究の奨励に関心のある研究者,実践者,政府機関に対して,知識伝達に関する理解を深めるものである。
関連論文リスト
- Two Heads Are Better Than One: A Multi-Agent System Has the Potential to Improve Scientific Idea Generation [48.29699224989952]
VirSciは研究のアイデアを共同で生成し、評価し、洗練するエージェントのチームを組織している。
このマルチエージェントアプローチは、新規で影響力のある科学的アイデアを生み出す上で、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-12T07:16:22Z) - Good Idea or Not, Representation of LLM Could Tell [86.36317971482755]
我々は、大規模言語モデルの知識を活用し、科学的アイデアのメリットを評価することを目的としたアイデアアセスメントに焦点をあてる。
我々は、このタスクに対する様々なアプローチのパフォーマンスを訓練し評価するために、細心の注意を払って設計された、フルテキストを持つ約4万の原稿からベンチマークデータセットをリリースする。
その結果, 大規模言語モデルの表現は, 生成出力よりもアイデアの価値を定量化する可能性が高いことが示唆された。
論文 参考訳(メタデータ) (2024-09-07T02:07:22Z) - The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery [14.465756130099091]
本稿では,完全自動科学的発見のための最初の包括的枠組みについて述べる。
我々は、新しい研究アイデアを生成し、コードを書き、実験を実行し、結果を視覚化し、その結果を説明するThe AI Scientistを紹介します。
原則として、このプロセスは、人間の科学コミュニティのように行動しながら、オープンな方法でアイデアを反復的に発展させることができる。
論文 参考訳(メタデータ) (2024-08-12T16:58:11Z) - SciDMT: A Large-Scale Corpus for Detecting Scientific Mentions [52.35520385083425]
SciDMTは,科学的言及検出のための拡張および拡張されたコーパスである。
コーパスは,1)SciDMTの主コーパスは8万4千件の科学的論文と8百万件以上の弱い注釈付き言及アノテーションと,2)評価目的のために手作業で注釈付けされた100件の科学的論文からなる評価セットから構成される。
論文 参考訳(メタデータ) (2024-06-20T22:03:21Z) - MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-10T15:19:09Z) - Interesting Scientific Idea Generation Using Knowledge Graphs and LLMs: Evaluations with 100 Research Group Leaders [0.6906005491572401]
我々は,5800万件の研究論文と大規模言語モデルを用いて研究アイデアを生成するSciMuseを紹介した。
我々は、100以上の研究グループのリーダーが興味に基づいて4,400以上のパーソナライズされたアイデアをランク付けする大規模な評価を行う。
このデータにより,(1)人間の評価に基づいて訓練された教師付きニューラルネットワーク,(2)大規模言語モデルを用いた教師なしゼロショットランキングを用いて,研究の関心を予測できる。
論文 参考訳(メタデータ) (2024-05-27T11:00:51Z) - LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery [141.39722070734737]
本稿では,大規模言語モデルの知識駆動型抽象推論能力をシミュレーションの計算力で強化することを提案する。
本稿では,2段階最適化フレームワークであるSGA(Scientific Generative Agent)を紹介する。
法発見と分子設計における枠組みの有効性を実証するための実験を行った。
論文 参考訳(メタデータ) (2024-05-16T03:04:10Z) - ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、大規模言語モデルによる研究アイデア作成エージェントである。
科学文献に基づいて繰り返し精製しながら、問題、方法、実験設計を生成する。
我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文 参考訳(メタデータ) (2024-04-11T13:36:29Z) - To think inside the box, or to think out of the box? Scientific
discovery via the reciprocation of insights and concepts [26.218943558900552]
私たちは科学的発見を、洞察に富んだ解決策を積極的に求めている$$と$の相互作用と見なしています。
我々は,科学的発見的な思考を自然に引き起こす意味探索ゲームであるMindleを提案する。
この観点から、洞察のメタストラテジーと概念の利用を相互に検討することができる。
論文 参考訳(メタデータ) (2022-12-01T03:52:12Z) - Measure Utility, Gain Trust: Practical Advice for XAI Researcher [2.4756236418706483]
研究者は信頼ではなく、機械学習の説明の有用性に重点を置くことを推奨する。
説明が有用である5つの広いユースケースを概説する。
客観的な経験的測定と偽りの仮説に依存する擬似実験について述べる。
論文 参考訳(メタデータ) (2020-09-27T18:55:33Z) - High-Precision Extraction of Emerging Concepts from Scientific
Literature [29.56863792319201]
学術文献の教師なし概念抽出法を提案する。
arXivのコンピュータサイエンス論文のコーパスから、我々の手法は99%の精度@1000を達成することがわかった。
論文 参考訳(メタデータ) (2020-06-11T23:48:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。