論文の概要: AI Marker-based Large-scale AI Literature Mining
- arxiv url: http://arxiv.org/abs/2011.00518v2
- Date: Tue, 3 Nov 2020 04:13:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 23:37:01.216761
- Title: AI Marker-based Large-scale AI Literature Mining
- Title(参考訳): AIマーカに基づく大規模AI文学マイニング
- Authors: Rujing Yao, Yingchun Ye, Ji Zhang, Shuxiao Li and Ou Wu
- Abstract要約: メソッド、データセット、メトリクスはAI文献のAIマーカーとして使用される。
実体抽出モデルを用いて,大規模AI文献からAIマーカーを抽出する。
メソッドクラスタ内の進化と異なる研究シーンクラスタ間の影響関係について検討した。
- 参考スコア(独自算出の注目度): 5.144684482990409
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The knowledge contained in academic literature is interesting to mine.
Inspired by the idea of molecular markers tracing in the field of biochemistry,
three named entities, namely, methods, datasets and metrics are used as AI
markers for AI literature. These entities can be used to trace the research
process described in the bodies of papers, which opens up new perspectives for
seeking and mining more valuable academic information. Firstly, the entity
extraction model is used in this study to extract AI markers from large-scale
AI literature. Secondly, original papers are traced for AI markers. Statistical
and propagation analysis are performed based on tracing results. Finally, the
co-occurrences of AI markers are used to achieve clustering. The evolution
within method clusters and the influencing relationships amongst different
research scene clusters are explored. The above-mentioned mining based on AI
markers yields many meaningful discoveries. For example, the propagation of
effective methods on the datasets is rapidly increasing with the development of
time; effective methods proposed by China in recent years have increasing
influence on other countries, whilst France is the opposite. Saliency
detection, a classic computer vision research scene, is the least likely to be
affected by other research scenes.
- Abstract(参考訳): 学術文献に含まれる知識は私の興味を引く。
生化学の分野における分子マーカー追跡のアイデアに触発されて、3つの名前のエンティティ、すなわちメソッド、データセット、メトリクスがAI文献のAIマーカーとして使用される。
これらの実体は、論文の本体に記述された研究過程の追跡に利用することができ、より価値のある学術情報を探し、採掘するための新しい視点を開くことができる。
まず,エンティティ抽出モデルを用いて,大規模AI文献からAIマーカーを抽出する。
第2に、オリジナルの論文はAIマーカーにトレースされている。
追跡結果に基づいて統計的および伝播解析を行う。
最後に、クラスタリングを実現するためにAIマーカーの共用が使用される。
方法クラスタ内の進化と異なる研究シーンクラスタ間の関係性について検討した。
上記のAIマーカーに基づく採掘は、多くの有意義な発見をもたらす。
例えば、データセット上での効果的な方法の伝播は、時間の発達とともに急速に増加しており、近年の中国による効果的な方法が他国に影響を与えている一方で、フランスは反対である。
従来のコンピュータビジョンの研究シーンである塩分検出は、他の研究シーンの影響が最も少ない。
関連論文リスト
- A Survey on Data Selection for Language Models [151.6210632830082]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - Spurious Correlations in Machine Learning: A Survey [69.89249134046086]
機械学習システムは、入力の偏りのある特徴と対応するラベルの間の急激な相関に敏感である。
これらの特徴とそのラベルとの相関は"spurious"として知られている。
我々は、機械学習モデルにおける素早い相関に対処する現在の最先端の手法の分類とともに、この問題を包括的にレビューする。
論文 参考訳(メタデータ) (2024-02-20T04:49:34Z) - Data-Driven Information Extraction and Enrichment of Molecular Profiling
Data for Cancer Cell Lines [1.1999555634662633]
本研究では,新しいデータ抽出・探索システムの設計,実装,応用について述べる。
我々は、ゲノムコピー番号の変種プロットと、ランク付けされた関連エンティティの自動リンクを可能にする、新しい公開データ探索ポータルを導入する。
私たちのシステムは、https://cancercelllines.org.comで公開されています。
論文 参考訳(メタデータ) (2023-07-03T11:15:42Z) - Neurosymbolic AI and its Taxonomy: a survey [48.7576911714538]
ニューロシンボリックAIは、古典的なAIやニューラルネットワークのようなシンボリック処理を組み合わせたモデルを扱う。
本研究は近年,本分野の研究論文を調査し,提案モデルと応用モデルとの分類と比較を行った。
論文 参考訳(メタデータ) (2023-05-12T19:51:13Z) - Citation Trajectory Prediction via Publication Influence Representation
Using Temporal Knowledge Graph [52.07771598974385]
既存のアプローチは主に学術論文の時間的データとグラフデータのマイニングに依存している。
本フレームワークは,差分保存グラフ埋め込み,きめ細かい影響表現,学習に基づく軌道計算という3つのモジュールから構成される。
APSアカデミックデータセットとAIPatentデータセットの両方で実験を行った。
論文 参考訳(メタデータ) (2022-10-02T07:43:26Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Evaluating the state-of-the-art in mapping research spaces: a Brazilian
case study [0.0]
最近の2つの研究は、科学者の出版記録から研究地図を作成する方法を提案している。
与えられたエンティティが新しいフィールドに入るかどうかを予測するモデルの能力を評価します。
これらのモデルがどのようにブラジルの文脈で科学のダイナミクスを特徴づけることができるかを示すケーススタディを実施します。
論文 参考訳(メタデータ) (2021-04-07T18:14:41Z) - Sensor Artificial Intelligence and its Application to Space Systems -- A
White Paper [35.78525324168878]
このホワイトペーパーの目的は、専用の研究トピックとして"Sensor AI"を確立することである。
AIアプローチにおけるセンサーとその物理的特性を詳しく見ると、より堅牢で広く適用可能なアルゴリズムが生まれるだろう。
センサーAIは、自動運転だけでなく、自動生産、予測保守、宇宙研究の分野でも決定的な役割を果たす。
論文 参考訳(メタデータ) (2020-06-09T14:10:35Z) - Exemplar Auditing for Multi-Label Biomedical Text Classification [0.4873362301533824]
我々は、最近提案されたゼロショットシーケンスラベリング手法「畳み込み分解による教師付きラベリング」を一般化する。
この手法は"イントロスペクション(introspection)"と分類され、推論時間予測のきめ細かい特徴を最も近い隣人に関連付ける。
提案手法は,医療従事者に対して,モデルの予測を駆動する健全な特徴を理解する上で,競争力のある分類モデルと尋問メカニズムの両方を提供する。
論文 参考訳(メタデータ) (2020-04-07T02:54:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。