論文の概要: SciNoBo : A Hierarchical Multi-Label Classifier of Scientific
Publications
- arxiv url: http://arxiv.org/abs/2204.00880v1
- Date: Sat, 2 Apr 2022 15:09:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-07 06:06:31.210787
- Title: SciNoBo : A Hierarchical Multi-Label Classifier of Scientific
Publications
- Title(参考訳): SciNoBo : 科学出版の階層型マルチラベル分類器
- Authors: Nikolaos Gialitsis, Sotiris Kotitsas, Haris Papageorgiou
- Abstract要約: 科学論文のフィールド・オブ・サイエンス(FoS)による分類が重要である。
本稿では,FoSの新たな分類システムであるSciNoBoを紹介する。
他の研究とは対照的に,本システムは複数の分野への出版物の割り当てを多元性の可能性を考慮して支援する。
- 参考スコア(独自算出の注目度): 0.7305019142196583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classifying scientific publications according to Field-of-Science (FoS)
taxonomies is of crucial importance, allowing funders, publishers, scholars,
companies and other stakeholders to organize scientific literature more
effectively. Most existing works address classification either at venue level
or solely based on the textual content of a research publication. We present
SciNoBo, a novel classification system of publications to predefined FoS
taxonomies, leveraging the structural properties of a publication and its
citations and references organised in a multilayer network. In contrast to
other works, our system supports assignments of publications to multiple fields
by considering their multidisciplinarity potential. By unifying publications
and venues under a common multilayer network structure made up of citing and
publishing relationships, classifications at the venue-level can be augmented
with publication-level classifications. We evaluate SciNoBo on a publications'
dataset extracted from Microsoft Academic Graph and we perform a comparative
analysis against a state-of-the-art neural-network baseline. The results reveal
that our proposed system is capable of producing high-quality classifications
of publications.
- Abstract(参考訳): fos(field-of-science)による科学出版物の分類は、資金提供者、出版者、学者、企業、その他の利害関係者がより効果的に科学文献を整理できるように、非常に重要である。
現存する作品の多くは、会場レベルでの分類、あるいは研究出版物のテキストの内容のみに基づく分類である。
SciNoBoは、FoS分類の分類体系であり、出版物の構造的特性と、多層ネットワークで編成された引用と参照を活用する。
他の研究とは対照的に,本システムは多分野の可能性を考慮して,出版物の複数分野への割り当てを支援する。
引用・公開関係からなる共通多層ネットワーク構造の下で出版物と会場を統一することにより、会場レベルの分類を出版レベルの分類で拡張することができる。
我々は、Microsoft Academic Graphから抽出した出版物のデータセット上でSciNoBoを評価し、最先端のニューラルネットワークベースラインに対して比較分析を行う。
その結果,本システムは出版物の高品質な分類を作成できることが判明した。
関連論文リスト
- Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - An Instance-based Plus Ensemble Learning Method for Classification of Scientific Papers [2.0794749869068005]
本稿では,科学論文の分類に事例ベース学習とアンサンブル学習を併用した新しい手法を提案する。
実験の結果,提案手法は論文を様々な研究領域に分類する上で効果的かつ効果的であることが示唆された。
論文 参考訳(メタデータ) (2024-09-21T19:42:15Z) - Incremental hierarchical text clustering methods: a review [49.32130498861987]
本研究の目的は,階層的および漸進的クラスタリング技術の解析である。
本研究の主な貢献は、文書クラスタリングのテキスト化を目的とした、2010年から2018年にかけて出版された研究で使用されるテクニックの組織化と比較である。
論文 参考訳(メタデータ) (2023-12-12T22:27:29Z) - Weakly Supervised Multi-Label Classification of Full-Text Scientific
Papers [29.295941972777978]
我々は,クロスペーパーネットワーク構造と紙内階層構造を用いて,弱い監督下で全文科学論文を分類するフレームワークEXを提案する。
ネットワーク対応のコントラスト調整モジュールと階層対応のアグリゲーションモジュールは、2種類の構造信号を利用するように設計されている。
論文 参考訳(メタデータ) (2023-06-24T15:27:55Z) - Hierarchical Classification of Research Fields in the "Web of Science" Using Deep Learning [15.915719490494876]
本稿では,その抽象概念を用いて学術出版物を自動分類する階層分類システムを提案する。
Microsoft Academic Graphの1億6000万の抽象スニペットの中で、44の規律、718のフィールド、1,485のサブフィールドを区別している。
分類精度は77.13%で90%、シングルラベルとマルチラベルの分類では78.19%である。
論文 参考訳(メタデータ) (2023-02-01T11:59:17Z) - Hierarchical Multi-Label Classification of Scientific Documents [47.293189105900524]
我々はSciHTCと呼ばれる科学論文の階層的多ラベルテキスト分類のための新しいデータセットを提案する。
このデータセットは、ACM CCSツリーから186,160の論文と1,233のカテゴリを含んでいる。
我々の最良のモデルでは、マクロF1スコアが34.57%に達し、このデータセットが大きな研究機会を提供することを示す。
論文 参考訳(メタデータ) (2022-11-05T04:12:57Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Analyzing Scientific Publications using Domain-Specific Word Embedding
and Topic Modelling [0.6308539010172307]
本稿では学術出版物の科学的分析を行うための枠組みを提案する。
自然言語処理の様々な技術、例えば単語の埋め込みやトピックモデリングを組み合わせる。
PUB-G と PUB-W という2つの新しい科学論文の埋め込みを提案する。
論文 参考訳(メタデータ) (2021-12-24T04:25:34Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。