論文の概要: AI Marker-based Large-scale AI Literature Mining
- arxiv url: http://arxiv.org/abs/2011.00518v2
- Date: Tue, 3 Nov 2020 04:13:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 23:37:01.216761
- Title: AI Marker-based Large-scale AI Literature Mining
- Title(参考訳): AIマーカに基づく大規模AI文学マイニング
- Authors: Rujing Yao, Yingchun Ye, Ji Zhang, Shuxiao Li and Ou Wu
- Abstract要約: メソッド、データセット、メトリクスはAI文献のAIマーカーとして使用される。
実体抽出モデルを用いて,大規模AI文献からAIマーカーを抽出する。
メソッドクラスタ内の進化と異なる研究シーンクラスタ間の影響関係について検討した。
- 参考スコア(独自算出の注目度): 5.144684482990409
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The knowledge contained in academic literature is interesting to mine.
Inspired by the idea of molecular markers tracing in the field of biochemistry,
three named entities, namely, methods, datasets and metrics are used as AI
markers for AI literature. These entities can be used to trace the research
process described in the bodies of papers, which opens up new perspectives for
seeking and mining more valuable academic information. Firstly, the entity
extraction model is used in this study to extract AI markers from large-scale
AI literature. Secondly, original papers are traced for AI markers. Statistical
and propagation analysis are performed based on tracing results. Finally, the
co-occurrences of AI markers are used to achieve clustering. The evolution
within method clusters and the influencing relationships amongst different
research scene clusters are explored. The above-mentioned mining based on AI
markers yields many meaningful discoveries. For example, the propagation of
effective methods on the datasets is rapidly increasing with the development of
time; effective methods proposed by China in recent years have increasing
influence on other countries, whilst France is the opposite. Saliency
detection, a classic computer vision research scene, is the least likely to be
affected by other research scenes.
- Abstract(参考訳): 学術文献に含まれる知識は私の興味を引く。
生化学の分野における分子マーカー追跡のアイデアに触発されて、3つの名前のエンティティ、すなわちメソッド、データセット、メトリクスがAI文献のAIマーカーとして使用される。
これらの実体は、論文の本体に記述された研究過程の追跡に利用することができ、より価値のある学術情報を探し、採掘するための新しい視点を開くことができる。
まず,エンティティ抽出モデルを用いて,大規模AI文献からAIマーカーを抽出する。
第2に、オリジナルの論文はAIマーカーにトレースされている。
追跡結果に基づいて統計的および伝播解析を行う。
最後に、クラスタリングを実現するためにAIマーカーの共用が使用される。
方法クラスタ内の進化と異なる研究シーンクラスタ間の関係性について検討した。
上記のAIマーカーに基づく採掘は、多くの有意義な発見をもたらす。
例えば、データセット上での効果的な方法の伝播は、時間の発達とともに急速に増加しており、近年の中国による効果的な方法が他国に影響を与えている一方で、フランスは反対である。
従来のコンピュータビジョンの研究シーンである塩分検出は、他の研究シーンの影響が最も少ない。
関連論文リスト
- Enhancing literature review with LLM and NLP methods. Algorithmic trading case [0.0]
本研究では,機械学習アルゴリズムを用いて,アルゴリズム取引分野の知識を分析し,整理する。
1956年から2020年の第1四半期にかけて、1億3600万件の研究論文のデータセットをフィルタリングして14,342件の関連記事を特定した。
論文 参考訳(メタデータ) (2024-10-23T13:37:27Z) - Automating Bibliometric Analysis with Sentence Transformers and Retrieval-Augmented Generation (RAG): A Pilot Study in Semantic and Contextual Search for Customized Literature Characterization for High-Impact Urban Research [2.1728621449144763]
文献分析は、都市科学における研究動向、スコープ、影響を理解するために不可欠である。
キーワード検索に依存する伝統的な手法は、記事のタイトルやキーワードに明記されていない価値ある洞察を明らかにするのに失敗することが多い。
我々は、生成AIモデル、特にトランスフォーマーとレトリーバル拡張生成(RAG)を活用して、バイオロメトリ分析の自動化と強化を行う。
論文 参考訳(メタデータ) (2024-10-08T05:13:27Z) - From Linguistic Giants to Sensory Maestros: A Survey on Cross-Modal Reasoning with Large Language Models [56.9134620424985]
クロスモーダル推論(CMR)は、より高度な人工知能システムへの進化における重要な能力として、ますます認識されている。
CMRタスクに取り組むためにLLM(Large Language Models)をデプロイする最近のトレンドは、その有効性を高めるためのアプローチの新たな主流となっている。
本調査では,LLMを用いてCMRで適用された現在の方法論を,詳細な3階層分類に分類する。
論文 参考訳(メタデータ) (2024-09-19T02:51:54Z) - Masked Image Modeling: A Survey [73.21154550957898]
マスク付き画像モデリングは、コンピュータビジョンにおける強力な自己教師付き学習技術として登場した。
我々は近年,分類学を構築し,最も顕著な論文をレビューしている。
我々は,最も人気のあるデータセット上で,様々なマスク付き画像モデリング手法の性能評価結果を集約する。
論文 参考訳(メタデータ) (2024-08-13T07:27:02Z) - Large Language Models and Knowledge Graphs for Astronomical Entity Disambiguation [0.0]
本稿では,大規模言語モデル(LLM)と知識グラフクラスタリングを用いて,天体と関係を天文学的なテキストから抽出することに焦点を当てる。
この実験は、LLMと知識グラフクラスタリング技術を組み合わせて、天文学的な研究において情報抽出を行う可能性を示す。
論文 参考訳(メタデータ) (2024-06-17T10:38:03Z) - Data-Driven Information Extraction and Enrichment of Molecular Profiling
Data for Cancer Cell Lines [1.1999555634662633]
本研究では,新しいデータ抽出・探索システムの設計,実装,応用について述べる。
我々は、ゲノムコピー番号の変種プロットと、ランク付けされた関連エンティティの自動リンクを可能にする、新しい公開データ探索ポータルを導入する。
私たちのシステムは、https://cancercelllines.org.comで公開されています。
論文 参考訳(メタデータ) (2023-07-03T11:15:42Z) - Neurosymbolic AI and its Taxonomy: a survey [48.7576911714538]
ニューロシンボリックAIは、古典的なAIやニューラルネットワークのようなシンボリック処理を組み合わせたモデルを扱う。
本研究は近年,本分野の研究論文を調査し,提案モデルと応用モデルとの分類と比較を行った。
論文 参考訳(メタデータ) (2023-05-12T19:51:13Z) - Citation Trajectory Prediction via Publication Influence Representation
Using Temporal Knowledge Graph [52.07771598974385]
既存のアプローチは主に学術論文の時間的データとグラフデータのマイニングに依存している。
本フレームワークは,差分保存グラフ埋め込み,きめ細かい影響表現,学習に基づく軌道計算という3つのモジュールから構成される。
APSアカデミックデータセットとAIPatentデータセットの両方で実験を行った。
論文 参考訳(メタデータ) (2022-10-02T07:43:26Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。