論文の概要: An Instance-based Plus Ensemble Learning Method for Classification of Scientific Papers
- arxiv url: http://arxiv.org/abs/2409.14237v1
- Date: Sat, 21 Sep 2024 19:42:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 23:37:15.891235
- Title: An Instance-based Plus Ensemble Learning Method for Classification of Scientific Papers
- Title(参考訳): 科学論文の分類のための事例ベース+アンサンブル学習法
- Authors: Fang Zhang, Shengli Wu,
- Abstract要約: 本稿では,科学論文の分類に事例ベース学習とアンサンブル学習を併用した新しい手法を提案する。
実験の結果,提案手法は論文を様々な研究領域に分類する上で効果的かつ効果的であることが示唆された。
- 参考スコア(独自算出の注目度): 2.0794749869068005
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The exponential growth of scientific publications in recent years has posed a significant challenge in effective and efficient categorization. This paper introduces a novel approach that combines instance-based learning and ensemble learning techniques for classifying scientific papers into relevant research fields. Working with a classification system with a group of research fields, first a number of typical seed papers are allocated to each of the fields manually. Then for each paper that needs to be classified, we compare it with all the seed papers in every field. Contents and citations are considered separately. An ensemble-based method is then employed to make the final decision. Experimenting with the datasets from DBLP, our experimental results demonstrate that the proposed classification method is effective and efficient in categorizing papers into various research areas. We also find that both content and citation features are useful for the classification of scientific papers.
- Abstract(参考訳): 近年の科学出版物の指数的成長は、効果的かつ効率的な分類において重要な課題となっている。
本稿では,科学論文を関連研究分野に分類するために,事例ベース学習とアンサンブル学習技術を組み合わせた新しいアプローチを提案する。
研究分野のグループによる分類システムを用いて、まず、複数の典型的なシード論文を手動で各分野に割り当てる。
次に、分類が必要な各紙について、各分野のすべてのシード紙と比較する。
内容と引用は別々に検討される。
次に、アンサンブルに基づく方法を用いて最終決定を行う。
本研究は,DBLPのデータセットを用いて,論文を様々な研究領域に分類する上で,提案手法が効果的かつ効果的であることを示すものである。
また,学術論文の分類において,内容と引用の特徴の両方が有用であることがわかった。
関連論文リスト
- Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Text Classification: A Review, Empirical, and Experimental Evaluation [2.341806147715478]
既存の調査論文は、テキスト分類のためのアルゴリズムを幅広いクラスに分類している。
アルゴリズムを階層的にきめ細かなクラスと特定のテクニックに分類する,新しい方法論の分類法を導入する。
本研究は,本手法をテキスト分類アルゴリズムの分類に利用した最初の調査である。
論文 参考訳(メタデータ) (2024-01-11T08:17:42Z) - Incremental hierarchical text clustering methods: a review [49.32130498861987]
本研究の目的は,階層的および漸進的クラスタリング技術の解析である。
本研究の主な貢献は、文書クラスタリングのテキスト化を目的とした、2010年から2018年にかけて出版された研究で使用されるテクニックの組織化と比較である。
論文 参考訳(メタデータ) (2023-12-12T22:27:29Z) - Document Provenance and Authentication through Authorship Classification [5.2545206693029884]
本稿では,単一文書と複数文書の分類のためのアンサンブルベースのテキスト処理フレームワークを提案する。
提案するフレームワークには,最先端のテキスト分類アルゴリズムがいくつか組み込まれている。
フレームワークは大規模なベンチマークデータセットで評価される。
論文 参考訳(メタデータ) (2023-03-02T12:26:03Z) - The Effect of Metadata on Scientific Literature Tagging: A Cross-Field
Cross-Model Study [29.965010251365946]
メタデータが19分野にわたる科学文献のタグ付けに与える影響を体系的に研究した。
全分野にわたるメタデータの効果のユビキタスなパターンを観察する。
論文 参考訳(メタデータ) (2023-02-07T09:34:41Z) - Tag-Aware Document Representation for Research Paper Recommendation [68.8204255655161]
本稿では,ユーザによって割り当てられたソーシャルタグに基づいて,研究論文の深い意味表現を活用するハイブリッドアプローチを提案する。
提案手法は,評価データが極めて少ない場合でも研究論文の推薦に有効である。
論文 参考訳(メタデータ) (2022-09-08T09:13:07Z) - Topic Segmentation of Research Article Collections [4.0810783261728565]
紙データ収集のトピックセグメンテーションを行い、約700万枚の紙データ記録のマルチトピックデータセットを生成した。
データ記録から抽出したトピックの分類を構築し、その分類から対応するトピックで各ドキュメントに注釈を付ける。
この新たに提案されたデータセットは、様々な分野の文書の異種コレクションとして、あるいは単一の研究トピックの同種コレクションの集合として、2つのモードで使用できる。
論文 参考訳(メタデータ) (2022-05-18T15:19:42Z) - Using Full-text Content of Academic Articles to Build a Methodology
Taxonomy of Information Science in China [10.949304105928286]
本研究は情報科学の方法論分類法を構築するための新しい概念を提供する。
提案手法は従来の手法よりも詳細に分類され,分類の更新速度が向上した。
論文 参考訳(メタデータ) (2021-01-20T01:56:43Z) - Cooperative Bi-path Metric for Few-shot Learning [50.98891758059389]
数発の分類問題の調査に2つの貢献をしている。
本稿では,従来の教師あり学習法において,ベースクラスで訓練されたシンプルで効果的なベースラインについて報告する。
本稿では, 基礎クラスと新しいクラス間の相関を利用して, 精度の向上を図る, 分類のための協調的二経路計量を提案する。
論文 参考訳(メタデータ) (2020-08-10T11:28:52Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。